找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 6|回复: 0

大数据实战 快餐数仓项目(资料完整)

[复制链接]

2万

主题

149

回帖

16万

积分

管理员

积分
160951
发表于 6 天前 | 显示全部楼层 |阅读模式 IP:山东省济南市 联通

登录后更精彩...O(∩_∩)O...

您需要 登录 才可以下载或查看,没有账号?立即注册

×
资源来自网络分享,侵权请告知删除。
免费容易导致链接很快失效,
如失效,请联系管理


大数据实战 快餐数仓项目(资料完整)


大家好,我是本课程的讲师周志垒。企业中有了海量数据就会使用大数据相关计算框架进行分析处理,在早期大数据处理中,我们会选择使用MapReduce分析处理海量数据,MapReduce存在计算慢、代码编写复杂、不支持流式计算及性能上的一些问题,Apache Spark计算框架的出现解决了MapReduce计算框架以上各种问题,Apache Spark是新一代的大数据计算框架,支持针对批量数据及流式数据进行处理,在数据处理上相对比MapReduce性能上提升很多,不仅编程方便还支持SQL处理数据、流式编程等。

在本课程内容全面涵盖了Spark生态系统的各个技术点,包含Spark架构、Spark任务提交、Spark数据处理模型、Spark资源调度、Shuffle原理、内存管理、参数优化、SparkSQL、SparkStreaming、各阶段源码分析等内容,此课程不仅面相项目开发人员,对于研究Spark的群体此课程都是非常有学习指导意义的课程。

如果正在学习大数据,对大数据Spark计算技术不熟悉,甚至工作中正在使用大数据,那么Spark一定是大数据技术中的重中之重,选择这门课程可以让你对Spark的底层原理、企业级实战应用有更深层次的理解,快点加入课程提升自己的技术吧。

目录:

1-scala语言、函数式编程、数据集处理、iterator设计模式实现
2-scala语言、流程控制、高级函数
3-scala语言、集合容器、iterator设计模式源码分析
4-scala语言、match、caseclass、implicitt、sparkwordcount
5-spark-core、复习hadoop生态、梳理术语、hadoopRDD源码分析
6-spark-core、wordcount案例源码分析、图解
7-spark-core、集合操作API、pvuv分析、RDD源码分析
8-spark-core、聚合计算API、combineByKey、分区调优
9-spark-core、二次排序、分组取TopN、算子综合应用
10-spark-core、集群框架图解、角色功能介绍、官网学习、搭建
11-spark-core、history服务、standaloneHA、资源调度参数
12-spark-core、基于yarn的集群搭建、配置、资源调度参数、优化jars
13-spark-core-源码、RpcEnv、standaloneMaster启动分析
14-spark-core-源码、Worker启动、sparksubmit提交、Driver启动
15-park-core-源码、Application注册、Executor资源申请
16-spark-core-源码、sparkContext、DAGScheduler、stage划分
17-spark-core-源码、TaskScheduler、Executor运行Task、SparkEnv
18-spark-core-源码、MemoryManager、BlockManager
19-spark-core-源码、Dependency、SortShuffleManager
20-spark-core-源码、SortShuffleWriter、内存缓冲区buffer
21-spark-core-源码、SortShuffleWriter、内存缓冲区buffer
22-spark-core-源码、UnsafeShuffleWriter、Tungsten、Unsafe、堆外
23-spark-core-源码、ShuffleReader、Tracker、Scheduler完整调度
24-spark-core-源码、RDD持久化、检查点、广播变量、累加器
25-spark-core-源码、RDD持久化、检查点、广播变量、累加器
26-spark-sql、大数据中的SQL组成原理
27-spark-sql、datafram到dataset开发
28-spark-sql、整合hive的metastore搭建企业级数仓1
29-spark-sql、整合hive的metastore搭建企业级数仓2
30-spark-sql、复杂sql、函数、自定义函数、开窗over函数、OLAP
31-spark-sql-源码、sql解析、dataset到rdd的执行计划
32-spark-sql-源码、antlr4的sql解析、AST语法树的逻辑到物理转换
33-spark-sql-源码、逻辑计划、优化器、物理计划、转换RDD
34-spark-streaming、流式计算之微批计算原理及standalone
35-spark-streaming、api、ha、检查点、窗口等机制
36-spark-streaming、整合MQ-kafka开发
37-spark-streaming、源码分析、流式微批任务的调度原理
38-spark-streaming
资料

下载地址:
链接: https://pan.baidu.com/s/1-Zov1v-yVXG2tn4ftMvPiQ


获取提取码:

试读已结束,请付费阅读全文。

  本文只能试读90%,付费后可阅读全文。 

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|哩布大模型|Civitai大模型|IP定位|图反推|站长素材|deepseek|即梦视频|阿狗工具|花瓣网|pinterest|php手册|宝塔文档|CyberChef|猫捉鱼铃|手机版|小黑屋|下载狗|IPS|在线工具|分享屋 ( 鲁ICP备2021028754号 )

GMT+8, 2024-11-14 12:04

Powered by 分享屋 X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表