课程类型
默认排序价格排序
这几年,随着越来越多的业务对数据的实时性提出了高要求,实时流计算技术变得越来越火,阿里、字节、京东等互联网大厂都在用它来处理用户兴趣分析,实时异常检测、在线反欺诈和金融风控等实时业务。
然而,想要真正搞懂并会运用实时流计算并不容易,NIO和异步编程、高并发编程、分布式处理、实时算法开发......这些都是阻碍你掌握实时流计算的拦路虎。
为了帮你攻克相关技术难点,本课程设计了一条系统、高效的学习路径,共四个模块,从“系统架构”和“实时算法”两方面入手,由浅入深、自底而上带你扎实掌握实时流计算。
① 模块一:实时流计算入门
这部分会介绍流计算系统的整体架构和使用场景,以及入门需掌握的编程基础,比如 NIO 和异步编程,以及异步系统中的 OOM 和反向压力问题,学完你会对实时流计算有个整体的认识,对“流”的本质有个初步理解。
②模块二:自己动手做一个流计算框架
这部分会介绍如何从 JDK 里最基础的工具类,一步步开发出一个分布式流计算框架。通过这种自己动手的方式,你会更深刻理解流计算系统的核心概念及实现原理。
③模块三:核心技术篇
这部分详细讲解流计算能够
搞懂实时流计算
优秀的软件工程师,必须具备过硬的代码开发能力。而代码开发的能力,则体现在对数据结构、算法思维、代码效率优化等知识的储备上。
本课程会从方法论、基础知识、真题演练、面试技巧这四个方面,掌握优秀工程师学习的完整路径。具体包括以下五部分内容:
第一部分:把“烂”代码优化为高效率代码的方法和路径。 代码的目标,除了完成任务,还要求把某项任务高效率地完成。
第二部分,带你补充必备的数据结构基础知识。 时间/空间复杂度的降低,要求对数据有超强的组织方式,这些能力需要你对数据结构的基础知识有极为深刻的理解,只有理解他们的优劣才能灵活选用合适的数据结构。
第三部分,这部分是你学习的重点,也就是用算法思考问题的逻辑和程序设计方法。 通过对递归、二分法、排序算法等介绍,教你一些不会改变数据的组织方式,就可以用巧妙的方法计算代码复杂度。
第四部分,侧重在 BAT 高频面试真题详解。 这一部分,带你运用前面所学来深入剖析高频真题的解题方法和思路,为你的大厂面试助力。
第五部分,面试现场, 给你求职时的切实建议。很多工程师有个共性问题,那就是明明有能力,却说不出来,表现得就像是个
卓越软件工程师成长路径
《SQL 数据分析进阶之必备核心技能》课程包括四个任务。任务一阐述数据分析师学习 SQL 的原因;任务二介绍神奇的数据库及 SQL 利器;任务三通过与 Excel 对比,分多部分讲解 SQL 基本查询;任务四对 SQL 查询进行扩展,涵盖去重、别名、聚合函数、分组统计、关联查询及各种连接查询等内容。本课程目标是通过对比学习掌握SQL语言的核心应用。
掌握SQL语言的核心应用
想要成为一名优秀的深度学习工程师并不容易,研究 AI 有着天然的高门槛和高要求。很多人都是理论上的王者,实践上的青铜,自以为对框架、算法的理解足够,但因为缺乏应用场景和实践机会,遇到实际问题仍然不知道该怎么抽象问题然后用模型解决。
本门课程将会从理论基础、工具使用、实战上手三个方面,带领你从理论开始,一步步认识和了解深度学习,并学会打造深度学习模型。
模块一:深度学习的基础概念。这个模块就像是打地基,老师会带你了解深度学习会用到的基础知识,主要是数学知识和理论知识。还会对深度学习中常用的结构进行详细的介绍,比如你经常听到的 CNN、DNN、GAN 等,从零开始,逐步深入。通过这一部分的学习,你会了解深度学习必备的基础知识。
模块二:深度学习的工具与框架。这个模块就像是盖楼的砖瓦,有了理论知识,就可以将理论知识转化成代码,并用合适的框架、工具协助你开展工作。框架方面,目前常用的深度学习框架很多,有 TensorFlow、PyTorch 等,老师会以其中使用最广泛的 TensorFlow 作为切入点,带你熟悉图像处理工具、模型训练记录工具、交互工具等工具的使用。通过这一部
学会打造深度学习模型
课程共七大模块, 26 个课时,引用大量大数据运维的实战案例,来讲述大数据平台的架构设计与部署、大数据平台的监控告警、性能调优,涵盖了大数据运维工作的全方位技能点。
模块一:Hadoop 大数据平台的规划与部署,主要讲解 Hadoop 大数据平台的搭建与基础配置;
模块二:Hadoop 分布式架构解析,主要讲解分布式文件系统 HDFS 和分布式资源管理器 Yarn 的运行机制以及内部实现细节;
模块三:Hadoop 外围应用整合实战,主要讲解大数据平台下如何整合一些外围应用,主要是 Spark、Flink 与 Yarn 的整合应用,以及 HBase 集群的部署;
模块四:Hadoop 大数据平台数据收集应用实践,主要讲解数据收集方法以及如何实现快速查询,Filebeat 、 Logstash、Elasticsearch ;
模块五:大数据平台日志传输与可视化应用实践,主要讲解海量数据环境中如何实现数据的实时传输,并实现可视化展示 ;
模块六:大数据平台运维监控体系的构建,主要讲解如何对大数据平台下每个组件的运行状态、服务状态进行监控;
模块七:
涵盖全方位技能点
编程语句、数据结构、算法,这些开发者的基本功都构筑在数学的基础上。日常开发工作中,解决问题的逻辑、代码优化的方法,无不体现出数学思维的重要性。
对于程序员来说,大而全地学习数学理论是没有必要的,精简程序员用得上的数学知识,将数学原理反哺实践,培养数学思维,提高解决问题的能力,是这个课程的核心目标。
本课程共 23 讲,通过以下 4 个模块的讲解,让你成为懂数学的一流程序员:
① 养成无处不在的数学思维。这一模块通过数制转化、数学逻辑、经典公式等原理与业务代码示例,讲解数学思维是如何运用在日常编程工作中的,让你重新审视数学思维在工作中的作用。
② 程序员必备的数学原理:代数与统计。精简的数学知识,比如求极值、向量与导数,这些应用于实际工作哪些方面:如何找到复杂业务最优解,如何完成海量高维度数据计算。这一模块将带你认识数学原理的实际应用,更为你打好理论基础。
③ 打好编程基本功:算法与数据结构。这一模块会讲到二分法、动态规划、递归等通用算法和重要思想,从数学角度找到算法背后的规律,还会结合实战场景,如:利用指数爆炸优化程序,将数学原理、算法与实战结合,事半功倍
培养数学思维,提高解决问题的能力
互联网数据增长是爆发式的,单机数据库很快触到容量与性能的瓶颈,业内经历了 SQL 到 NoSQL 再到 NewSQL 的技术探索。分布式数据库以更高并发访问量、更强的可扩展性、更快的数据访问速度,替代了传统关系型数据库,正在被行业广泛采纳。
身为开发者,深入理解分布式数据库原理与应用已经十分必要。
本课程为你摒弃过时与不重要的技术细节,给你精简的原理,拓展到实用的实际案例,让你对分布式数据库能够活学活用。课程分为以下 4 大模块:
模块一,分布式数据历史演变及其核心原理。 从历史背景出发,带你了解分布式数据库要解决的问题、应用场景,以及核心技术特点。
模块二,存储引擎——分布式数据库的高性能保证。 本模块带你理解典型存储引擎,分布式索引、日志型存储、事务处理等,其中会特别介绍分布式数据库与传统数据库在存储层面上的差异。
学完你会更加理解分布式数据库的数据一致性和分布式事务两大特性,明白为什么一些特定存储引擎更适合去构建分布式数据库,这些底层逻辑是你接下来学习的基础,也帮助你在未来工作中进行技术选型。
模块三,分布式系统——分布式数据库的高扩展性保证。 分
精简原理+实际案例
如今,大数据就像是一座潜力无穷的金矿,最核心的价值需要通过挖掘分析才能体现。各行各业的互联网化,让数据得到更广泛的应用。
而从事数据分析、数据挖掘、数据处理的岗位的人才其实相当稀缺, 如今掌握数据挖掘思维和技能,将会为你的升职加薪打牢基础。
本课程从构建数据挖掘思维的角度出发,为你详解数据挖掘,具体分为三大部分:
第一部分、基础知识准备。 你建立对数据挖掘的全局认知,学习课程中可能会涉及的一些基础知识(包括必备的 Python 语言知识,以及如何搭建 Python 环境),夯实基础知识,帮你快速进入状态。
第二部分、数据挖掘过程。 授人以鱼不如授人以渔,这个部分的重点是让你能够在思想和行为上都做足准备,全面细致地了解数挖掘方法的实施过程。从理论到实战搞懂“数据挖掘”这个词是如何一步步变具体的。
第三部分、算法详解。 涉及数据挖掘的分类、聚类、回归、关联分析这四大问题,以及自然语言处理的部分知识。着重介绍核心算法的理念、优缺点、应用场景,让你能够快速上手应用。每个模块的最后一个课时,都会通过实践案例,让你掌握实战处理技巧。
彩蛋: 专栏的最后会提供数据挖掘
为你的升职加薪打牢基础
《数据分析工具 Excel》课程涵盖四个任务。任务一介绍 Excel 基础操作,包括数据表必学操作。任务二讲解 Excel 常用函数,分上下两部分助力高效办公。任务三聚焦数据透视表及切片器制作。任务四涉及 Excel 数据看板,包含数据可视化图表以及电商平台销售和用户分析的数据看板制作。本课程助你熟练运用 Excel 进行数据分析。
熟练运用Excel进行数据分析
《数据分析名企实战案例讲解》课程包含五个任务。任务一通过拼多多案例介绍 ARRR 转化模型,涵盖案例背景、模型流程各环节讲解及实战应用。任务二以滴滴出行为例讲解 RFM 模型,包括案例背景、模型介绍、滴滴实战及运营策略。任务三分析阿里从场货人到人货场的变革,涉及案例背景、商业模式演变及盒马鲜生的应用。任务四揭秘抖音让人上瘾的原因,包含案例背景、推荐系统架构和协同过滤推荐算法。任务五以京东为例讲解 A/B Test,包括案例背景、概念原理、应用场景及电商实验案例。本课程通过名企案例深入剖析数据分析在实际中的应用。
名企实战案例宝典
《数据分析通用流程》课程包括两个任务。任务一养成数据分析能力,涵盖能力认知、破除思维误区和习惯养成。任务二讲解数据分析通用流程并结合案例,有流程简介、常见场景及 案例,最后进行案例对比与总结。课程适合初学者和有经验者,把握数据分析规律,提升数据分析能力。
把握数据分析规律,提升分析能力
本课程将从底层到应用层贯穿整个思路,结合硅谷一线大厂的最佳实践和顶级开源软件的应用,来讲数据结构「是什么、为什么、怎么做」,从而让你明白这些数据结构为什么存在以及在什么情况下可以最好地解决什么样的问题,进而在编码上面有质的飞跃。
五大模块,带你攻克数据结构实战:
模块一 数组与链表。 先带你回顾时间复杂度和空间复杂度、深入数组和链表的内存结构。
模块二 哈希表。 这个模块将会带你通过比特币挖矿的案例,来理解哈希函数和哈希碰撞的本质。
模块三 树。 在树的模块中,讲解树的结构化特性。会以MySQL语法树为例,看树是如何在 Amazon AWS 中以超大型数据库查询起到中流砥柱的作用的,后半部分则会拆解 LSM 树在 Apache 项目中的应用。
模块四 图。 图也是在大厂应用非常广泛的数据结构之一。会以 Apache Spark 为例,来看看有向无环图是如何优化大规模分布式运算顺序的。利用 Uber 的车辆调度算法,深入浅出的帮你掌握图是怎样实现这些硅谷一线大厂核心功能的。
模块五 数据结构组合拳。 在实战中一定会融合使用多个数据结构去实现业务逻辑。这个模