获取内容资料
大数据AI

【大课】2022尚硅谷大数据大神班V9【2022年9月完结】

尚硅谷大数据大神班课程内容无缝对接企业需求,对标BAT等大厂。本课程分5个阶段:

阶段一:JavaSE基础核心:本阶段除了JavaSE中要求大家必会的常见知识外,重点加强了数据结构思想、集合源码分析,逐步培养大家深入学习的能力,此外为大数据框架学习打好基础,加强对SQL的讲解,重点培养学生数据处理思想。

阶段二:Hadoop生态体系架构:本阶段以Hadoop生态系统为主,是大数据主要框架的入门阶段。根据课程的前后关联性,先后为Linux、Hadoop、Hive、Zookeeper、Flume、Kafka、电商数据采集项目。课程顺序经过精心调研安排,符合学习的基本认知规律。每个框架的讲解都是从基础的安装部署和架构讲解入手,穿插经典实操案例,配以关键源码解读。阶段最后安排讲解数据仓库采集系统,对各种框架融会贯通,带领学员回顾所学框架的同时,迅速增长实际开发经验。

阶段三:Spark生态体系架构:本阶段课程进入进阶阶段,主要讲解核心大数据框架Spark和HBase,对两大框架进行了深入讲解,包括两大框架的基本安装部署以及深入源码解读。此外,本阶段还包含三大项目——离线数据仓库项目、用户画像项目和项目实战。前两大项目均采用新架构体系、稳定的框架选型、经典的理论解读,手把手教你如何从0到1搭建一个功能完善的大数据系统。内容涵盖绝大部分大数据经典流行框架、绝大部分经典需求实现,并配合企业级部署调优讲解,助力学员迅速增长开发经验,适配大部分企业的大数据开发需求。项目实战项目主要锻炼学生动手实战能力,根据前两个项目所学,自己独立按照企业需求完成开发任务。

阶段四:Flink生态体系架构:本阶段课程以时下流行的大数据处理框架Flink为中心,从架构讲起,详细讲解了各种层面API的使用,并对Flink的高级应用场景进行了案例化讲解,还配备了详细的源码解读和优化技巧。本阶段还围绕Flink讲解了大数据领域另一个十分重要的项目——Flink实时数据仓库项目。本项目与离线数仓项目可以无缝对接,两大项目共同组成一个完整的企业级大数据架构。课程中包含深入数仓理论讲解、实用高效的实时问题解决方案。通过学习本项目,可以迅速掌握实时开发的重点难点,掌握多种实时难点问题解决方案,对实时领域框架的搭配应用融会贯通,提升开发和调优经验。本阶段还配备项目实战阶段,主要锻炼学生动手实战能力,根据已学内容,在讲师指导下独立完成开发任务。此外,本阶段课程还将讲解时下流行的热点问题项目,数据湖 or K8S or 技术中台,成熟的技术课程可以使学员更广泛了解大数据的发展趋势,掌握更多更热门的大数据技术,例如Hudi、K8S、数据治理等。在本阶段课程的最后是企业级的项目调优课程,通过搭建一个企业级的大数据集群,对项目中可能发生的高频热点问题、面试常见问题给出多角度解答,问题多、范围广、覆盖全,有助学员提升开发经验,熟悉开发环境。

阶段五:就业指导:本阶段课程主要围绕学员的就业需求,在真正就业前,帮助学员多维度复习巩固所学知识和项目,串讲经典高频面试题,传授面试答题技巧,总结项目开发经验,手把手简历指导,解决学员在就业过程中遇到的各种难题。

课程目录

01Javase

Day-01

Day-01.xmind

code

HelloWorld.class

HelloWorld.java

TestOne.java

TestThree.java

TestTwo.java

homework

尚硅谷_01_Java基础语法_homework.md

尚硅谷_01_Java基础语法_homework_参考答案.md

尚硅谷_01_Java基础语法_homework.assets

1.jpg

3.jpg

4.jpg

5.jpg

8.png

9.png

image-20211219152628406.png

note

尚硅谷-第1章 Java概述

尚硅谷-第1章 Java概述.zip

尚硅谷-第2章 Java基础语法

尚硅谷-第2章 Java基础语法.zip

resources

video

day01-01-Java发展简史.mp4

day01-02-Java跨平台的原理和JVM.mp4

day01-03-安装JDK.mp4

day01-04-配置环境变量.mp4

day01-05-编写源文件和编译源文件.mp4

day01-06-使用editplus编写java文件.mp4

day01-07-安装editplus.mp4

day01-08-设置编译和运行工具.mp4

day01-09-注释.mp4

day01-10-关键字.mp4

day01-11-标识符.mp4

day01-12-声明和使用变量.mp4

Day-02

day02晨测.txt

code

DAY02-novideo

DAY02

DAY02.zip

video

DAY02-video

DAY02

DAY02.zip

video

day02-01-晨测.mp4

day02-02-基础数据类型和引用数据类型.mp4

day02-03-变量的三要素和声明与赋值.mp4

day02-04-计算机底层使用二进制.mp4

day02-05-八种基础数据类型所占的内存空间和取值范围.mp4

day02-06-计算机底层使用二进制补码存储和运算数据.mp4

day02-07-char型表示字符.mp4

day02-08-强制类型转换和自动类型转换.mp4

day02-09-算术运算符.mp4

day02-10-关系运算符和逻辑运算符.mp4

day02-11-赋值运算符.mp4

day02-12-位运算符.mp4

homework

Day-03

day-03晨测.txt

code

TestFour.java

TestOne.java

TestThree.java

TestTwo.java

DAY03-video

DAY03

DAY03.zip

video

day03-01-晨测.mp4

day03-02-复习.mp4

day03-03-Scanner键盘输入.mp4

day03-04-if-else和多重if-else结构.mp4

day03-05-嵌套的if-else结构.mp4

day03-06-switch-case结构.mp4

day03-07-while循环.mp4

day03-08-while循环的练习.mp4

homework

Day-04

晨测04.txt

练习.txt

code

DAY04-video

DAY04

DAY04.zip

video

day04-01-晨测.mp4

day04-02-复习.mp4

day04-03-do-while循环的特点1.mp4

day04-04-do-while循环的特点2.mp4

day04-05-do-while循环的练习.mp4

day04-06-for循环的特点.mp4

day04-07-break关键字.mp4

day04-08-continue关键字.mp4

day04-09-二重循环的概念.mp4

day04-09-二重循环的练习.mp4

day04-10-二重循环的练习1.mp4

day04-11-二重循环的练习2.mp4

homework

.idea

homework.iml

misc.xml

modules.xml

workspace.xml

Day-05

晨测.txt

code

DAY05-video

DAY05

DAY05.zip

video

day05-01-晨测.mp4

day05-02-复习.mp4

day05-03-数组的相关概念.mp4

day05-04-一维数组的声明和初始化.mp4

day05-05-数组的遍历.mp4

day05-06-数组的常见算法和二分查找的理论.mp4

day05-07-二分查找的代码解析.mp4

day05-08-数组元素的交换.mp4

day05-09-冒泡排序.mp4

day05-10-一维数组的内存分析.mp4

day05-11-二维数组.mp4

homework

Day-06

晨测.txt

DAY06-video

DAY06

DAY06.zip

video

day06-01-晨测.mp4

day06-02-在idea下创建工程和模块.mp4

day06-03-类和对象的概念.mp4

day06-04-创建一个类和使用类创建对象.mp4

day06-05-包,导包,和包作用概念.mp4

day06-06-类的普通属性的特点.mp4

day06-07-方法的访问修饰符方法的返回类型.mp4

day06-08-无参方法的练习.mp4

day06-09-在工程中删除和附加模块.mp4

day06-10-移除和附加module.mp4

day06-11-无参方法练习1.mp4

Day-07

晨测.txt

DAY07

DAY07.zip

video

day07-01-晨测.mp4

day07-02-定义和使用带参的方法.mp4

day07-03-使用基础类型传参的特点.mp4

day07-04-引用数据类型传参.mp4

day07-05-引用数据类型传参和基础数据类型传参的内存分析.mp4

day07-06-方法调用时的内存分析.mp4

day07-07-属性和局部变量额区别.mp4

day07-08-变长参数组.mp4

day07-09-方法重载.mp4

day07-10-对象数组.mp4

day07-11-构造器的概念和作用(1).mp4

day07-11-构造器的概念和作用.mp4

day07-12-构造器的特点(1).mp4

day07-12-构造器的特点.mp4

Day-08

DAY08-video

DAY08

DAY08.zip

video

day08-01-晨测1.mp4

day08-02-晨测2.mp4

day08-03-静态属性的特点和内存分析.mp4

day08-04-静态的方法的特点和内存分析.mp4

day08-09-封装的概念和私有成员公开getset方法.mp4

day08-10-继承的基本概念.mp4

day08-11-继承的特点.mp4

day08-12-方法重写.mp4

day08-13-方法重写时子类方法签名和父类方法签名不同的特点.mp4

Day-09

晨测.txt

DAY09-video

DAY09

DAY09.zip

video

day09-01-晨测.mp4

day09-02-复习.mp4

day09-03-继承状态下父类之间的构造器调用特点.mp4

day09-04-通过构造器给普通属性赋初始值.mp4

day09-05-普通代码块给属性赋值.mp4

day09-06-类的加载顺序及使用静态代码块给静态属性赋值.mp4

day09-07-Object根父类和Object类中的方法.mp4

day09-08-引用和对象的关系.mp4

day09-09-重写toString和equals方法的意义.mp4

day09-10-final关键字.mp4

day09-11-多态的概念和实现方式.mp4

day09-12-向上转型和向下转型和instanceof关键字.mp4

Day-10

晨测.txt

DAY10-video

DAY10

DAY10.zip

video

day10-01-晨测.mp4

day10-02-抽象关键字和抽象类抽象方法.mp4

day10-03-抽象父类的子类特点.mp4

day10-04-接口的概念和接口的定义.mp4

day10-05-jdk1.8之后接口中声明两种带有方法体的方法.mp4

day10-06-接口和实现类之间的关系及接口的继承.mp4

day10-07-接口中的命名冲突和比较对象大小的接口.mp4

day10-08-JDK1.5之前的枚举1.mp4

day10-09-JDK1.5之前的枚举2.mp4

day10-10-JDK1.5之后的枚举1.mp4

Day-11

晨测.txt

DAY11-video

DAY11

DAY11.zip

video

day11-01-01-晨测.mp4

day11-02-枚举类提供的常用方法.mp4

day11-03-包装类.mp4

day11-04-静态成员内部类的特点.mp4

day11-05-普通成员内部类的特点.mp4

day11-06-局部内部类的特点.mp4

day11-07-匿名内部类的特点.mp4

day11-08-匿名内部类的使用方式.mp4

day11-09-三个系统提供的基础注解.mp4

day11-10-使用junit测试.mp4

Day-12

晨测.txt

DAY12-novideo

DAY12

DAY12.zip

video

DAY12-video

DAY12

DAY12.zip

video

day12-01-晨测.mp4

day12-02-junit剩下的几个注解.mp4

day12-03-元注解.mp4

day12-04-自定义注解.mp4

day12-05-异常的概念和抛出异常的机制.mp4

day12-06-受检异常和非受检异常.mp4

day12-07-try-catch结构.mp4

day12-08-try-catch-finally.mp4

day12-09-throw关键字和throws关键字.mp4

day12-10-自定义异常.mp4

Day-13

测试题(晨测).txt

DAY13-video

DAY13

DAY13.zip

video

day13-01-晨测.mp4

day13-02-多线程的相关概念.mp4

day13-03-在Java语言中开启子线程的两种方式.mp4

day13-04-开启多个子线程.mp4

day13-05-Thread类的构造方法.mp4

day13-06-Thread类的常用方法1.mp4

day13-07-Thread类的常用方法2.mp4

day13-08-龟兔赛跑.mp4

day13-09-线程安全问题.mp4

Day-14

晨测.txt

DAY14-video

DAY14

DAY14.zip

video

day14-01-晨测.mp4

day14-02-各种不同的锁对象.mp4

day14-03-同步代码块和同步方法的特点.mp4

day14-04-一个生产者与一个消费者的问题.mp4

day14-05-多个生产者与多个消费者的问题.mp4

day14-06-线程的声明周期.mp4

day14-07-线程的生命周期和死锁.mp4

day14-08-Math类的常用方法1.mp4

day14-09-math包下的类和Random类.mp4

day14-10-jdk1.8之前的日期处理.mp4

day14-11-jdk1.8之后的日期处理.mp4

Day-15

晨测.txt

DAY15-video

DAY15

DAY15.zip

video

day15-01-晨测.mp4

day15-02-数组的扩容.mp4

day15-03-数组的指定下标移除元素和指定下标新增元素.mp4

day15-04-String创建对象的特点和String内存结构的特点.mp4

day15-04-String在拼接字符串时各种情况的内存特点.mp4

day15-05-String的常用方法1.mp4

day15-06-String的常用方法2.mp4

day15-07-String的常用方法3.mp4

day15-08-StringBuffer和StringBuilder.mp4

Day-16

晨测.txt

DAY16-video

DAY16

DAY16.zip

video

day16-01-晨测.mp4

day16-02-集合框架体系图和集合的意义.mp4

day16-03-Collection的常用方法.mp4

day16-04-Collection接口的遍历.mp4

day16-05-迭代器的底层工作原理.mp4

day16-06-List接口的特点和List接口的独有方法.mp4

day16-07-List接口的遍历(1).mp4

day16-07-List接口的遍历.mp4

day16-08-ArrayList底层实现的原理和代码阅读1(1).mp4

day16-08-ArrayList底层实现的原理和代码阅读1.mp4

day16-09-ArrayList底层原码2.mp4

day16-10-LinkedList的特点和底层实现.mp4

Day-17

HashSet存值的图示.pptx

晨测.txt

DAY17-video

DAY17

DAY17.zip

video

day18-01-晨测.mp4

day18-02-Set接口的特点.mp4

day18-03-Set接口实现类的底层都是Map接口的实现类.mp4

day18-04-HashSet去重的原理.mp4

day18-05-重写hashCode和equals方法.mp4

day18-06-LinkedHashSet的特点.mp4

day18-07-TreeSet的特点和自然排序.mp4

day18-08-自然排序的升序与降序.mp4

day18-09-定制排序.mp4

day18-10-Collections工具类.mp4

Day-18

晨测.txt

DAY18-video

DAY18

DAY18.zip

video

day18-01-晨测.mp4

day18-02-map接口的常用方法1.mp4

day18-03-map接口的遍历.mp4

day18-04-HashMap底层源码.mp4

day18-05-泛型的概念和泛型的引入.mp4

day18-06-在类声明时使用泛型的具体步骤.mp4

day18-07-在接口声明时声明和使用泛型的步骤.mp4

day18-08-泛型的上限和泛型的通配.mp4

day18-09-泛型的集合.mp4

Day-19

DAY19-video

DAY19

DAY19.zip

video

day19-01-晨测.mp4

day19-02-使用绝对路径或者相对路径创建File对象.mp4

day19-03-File类的常用方法.mp4

day19-04-File类的常用方法.mp4

day19-05-流的特点和分类.mp4

day19-06-字节输入流.mp4

day19-07-字节输出流和文件复制.mp4

day19-08-字符流和缓冲流.mp4

day19-09-转换流.mp4

day19-10-对象流.mp4

Day-20

DAY20-video

DAY20

DAY20.zip

video

day20-01-晨测.mp4

day20-02-网络通讯的基础知识.mp4

day20-03-TCP协议和UDP协议的特点.mp4

day20-04-客户端与服务器双向单次通讯String.mp4

day20-05-客户端与服务器通讯的注意点.mp4

day20-06-客户端与服务器双向多次通讯String.mp4

day20-07-客户端与服务器双向多次传递Object.mp4

day20-08-让客户端的错误输入可以重复输入用户名密码.mp4

Day-21

DAY21-video

DAY21

DAY21.zip

video

day21-01-晨测.mp4

day21-02-读取硬盘文件数据验证用户名密码的正确性.mp4

day21-03-获取类类对象的四种方式.mp4

day21-04-获取类的信息和类的属性信息.mp4

day21-05-获取类的方法信息.mp4

day21-06-获取类的构造器信息.mp4

day21-07-利用反射的方式创建对象和访问对象的普通属性.mp4

day21-08-利用反射的方式访问静态成员和调用方法.mp4

02MySQL

02.MySQL(1).xmind

02.MySQL.xmind

01-课件

尚硅谷00_SQL概述.pptx

尚硅谷01_数据处理之查询.pptx

尚硅谷02_子查询.pptx

尚硅谷03_创建和管理表.pptx

尚硅谷04_数据处理之增删改.pptx

尚硅谷05_约束和分页.pptx

尚硅谷_Mysql安装与使用.pptx

02-资料

02-资料.zip

03-视频

day22-全天视频

Day-22

01-基本查询.sql

02-过滤.sql

03-模糊查询.sql

04-查询.sql

05-多表查询.sql

day22

卸载MySQL.txt

多表查询.xlsx

环境变量配置.xlsx

上午

01-MySQL概述.mp4

02-MySQL卸载.mp4

03-Mysql安装.mp4

04-配置环境变量.mp4

05-SQLYog安装.mp4

06-导入数据.mp4

07-SQLYog设置.mp4

08-基本查询.mp4

下午

01-过滤01.mp4

02-过滤02.mp4

03-模糊查询.mp4

04-排序.mp4

05-多表查询.mp4

代码

01-基本查询.sql

02-过滤.sql

03-模糊查询.sql

04-排序.sql

05-多表查询.sql

day23-全天视频

04-代码

04-代码.zip

05-复习

MySQL复习.md

img

1649637701330.png

1649637780193.png

1649637796385.png

上午

01-复习.mp4

02-多表查询02.mp4

03-飘号和去重.mp4

04-练习-选择与过滤.mp4

05-单行函数01.mp4

06-单行函数02.mp4

07-通用函数.mp4

下午

01-多行函数(组函数).mp4

02-分组和过滤.mp4

03-子查询.mp4

04-练习-多表查询.mp4

作业

03-多表查询.sql

04-分组函数.sql

05-子查询.sql

day24-全天视频

04-代码

04-代码

04-代码.zip

05-复习

05-复习

MySQL复习.md

img

1649637701330.png

1649637780193.png

1649637796385.png

1649723666409.png

day24-上午视频

上午

01-复习.wmv

01-复习2.wmv

02-练习-单行函数.wmv

03-练习-分组函数.wmv

04-练习-子查询.wmv

05-库的操作.wmv

06-表的操作.wmv

07-Mysql的数据类型.wmv

08-对列进行操作.wmv

09-编码集.wmv

day24-下午视频

下午

01-数据之增,删,改.wmv

02-事务.wmv

03-创建表时添加列级约束.wmv

04-创建表时添加表级约束.wmv

05-索引.wmv

06-外键约束.wmv

07-创建表后添加约束.wmv

08-分页.wmv

04-代码

05-复习

03JDBC

01-课件.zip

02资料.zip

03.JDBC.zip

04-代码.zip

05-复习.zip

03-视频

day25-视频

04-代码

JDBCDemo.zip

上午

01-复习.wmv

02-JDBC概述.mp4

03-准备工作.mp4

04-获取Connection方式一.mp4

05-Properties.mp4

06-获取Connection方式二.mp4

07-方式二的优化.mp4

08-获取Connection最终版.mp4

09-JDBCUtils工具类.mp4

10-向表中插入数据.mp4

下午

01-修改表中的数据.mp4

02-删除表中的数据.mp4

03-查询表中所有的数据.mp4

04-事务.mp4

05-数据库连接池.mp4

06-DBUtiLs工具类.mp4

07-不能插入中文问题.mp4

04Maven

Maven.xmind

1.笔记

01_尚硅谷大数据技术之Maven(V4.0).doc

2.资料

apache-maven-3.5.4-bin.zip

apache-maven-3.5.4-src.zip

maven流程图.xlsx

repo.zip

环境变量配置.xlsx

3.视频

day26-视频

4.code

4.code.zip

day01

上午

01-复习.wmv

02-批处理.mp4

03-为什么要使用Maven.mp4

04-Maven是什么.mp4

05-Maven安装.mp4

06-修改本地仓库的路径.mp4

07-配置阿里云镜像.mp4

08-配置Maven编译版本.mp4

09-IDEA中配置Maven.mp4

下午

01-空工程.mp4

02-创建Maven工程.mp4

03-常见问题.mp4

04-第一个Maven程序.mp4

05-无法直接运行单元测试方法的问题.mp4

06-pom和约定的目录结构.mp4

07-约定02.mp4

08-坐标.mp4

09-第二个Maven工程.mp4

day02

01-复习.wmv

02-依赖的范围.mp4

03-依赖的传递性.mp4

04-依赖的原则.mp4

05-依赖的排除.mp4

06-版本的统一管理.mp4

07-仓库.mp4

08-Maven的生命周期.mp4

09-插件和目标.mp4

10-继承.mp4

11-聚合.mp4

12-Maven酷站.mp4

13-常见问题.mp4

14-Maven打包插件.mp4

4.code

4.code.zip

05Linux

linux操作.xmind

linux环境配置.xmind

1.笔记

VMware与CentOS及XShell的安装.docx

尚硅谷大数据技术之Linux(V4.0).docx

2.资料

2.资料.zip

3.视频

day27

day27

Mavencode.zip

Linux视频

day01

01-Linux概述.mp4

02-Linux和Windows的区别.mp4

03-VM安装.mp4

04-虚拟化.mp4

05-Linux安装01.mp4

06-Linux安装02.mp4

07-Linux目录结构.mp4

08-基本命令.mp4

09-一般模式.mp4

10-编辑模式.mp4

11-指令模式.mp4

12-模式间转换.mp4

13-常见错误.mp4

常见错误.xlsx

Maven视频

day02

01-复习.wmv

02-依赖的范围.wmv

03-依赖的传递性.wmv

04-依赖的原则.wmv

05-依赖的排除.wmv

06-版本的统一管理.wmv

07-仓库.wmv

08-Maven的生命周期.wmv

09-插件和目标.wmv

10-继承.wmv

11-聚合.wmv

12-Maven酷站.wmv

13-常见问题.wmv

14-Maven打包插件.wmv

day28

day28

01-复习.wmv

02-网络配置.mp4

03-Xshell安装.mp4

04-XShell配置.mp4

05-Xftp安装.mp4

06-lrzsz.mp4

07-快照.mp4

08-修改主机名.mp4

09-hosts文件.mp4

10-服务的启动和停止.mp4

11-开机自启的设置.mp4

12-关机重启命令.mp4

13-帮助命令.mp4

14-文件目录类01.mp4

15-文件目录类02.mp4

16-时间日期类.mp4

17-用户管理命令.mp4

18-用户组管理命令.mp4

hosts.xlsx

命令的优先级.txt

day29

day29

05-Shell.zip

上午

01-Linux连不上网络的常见解决方案.mp4

02-复习.mp4

03-文件属性.mp4

04-改变权限.mp4

05-修改所属主和所属组.mp4

06-搜索查找类.mp4

07-压缩和解压缩.mp4

08-磁盘分区类.mp4

09-进程线程类.mp4

10-定时任务.mp4

11-rpm包.mp4

12-YUM仓库.mp4

13-克隆虚拟机.mp4

14-常见错误和面试题.mp4

命令的优先级.txt

下午

01-Shell概述.mp4

02-第一个Shell脚本程序.mp4

03-第二个Shell程序.mp4

04-第三个Shell程序.mp4

05-系统变量.mp4

06-自定义变量.mp4

07-特殊变量.mp4

08-单引号和双引号的区别.mp4

09-运算式.mp4

10-条件判断.mp4

05She’ll

shell编程.xmind

1.笔记

尚硅谷大数据技术之Shell(V4.0).docx

2.资料

2.资料.zip

3.视频

day29

05-Shell.zip

上午

01-Linux连不上网络的常见解决方案.wmv

02-复习.wmv

03-文件属性.wmv

04-改变权限.wmv

05-修改所属主和所属组.wmv

06-搜索查找类.wmv

07-压缩和解压缩.wmv

08-磁盘分区类.wmv

09-进程线程类.wmv

10-定时任务.wmv

11-rpm包.wmv

12-YUM仓库.wmv

13-克隆虚拟机.wmv

14-常见错误和面试题.wmv

命令的优先级.txt

下午

01-Shell概述.wmv

02-第一个Shell脚本程序.wmv

03-第二个Shell程序.wmv

04-第三个Shell程序.wmv

05-系统变量.wmv

06-自定义变量.wmv

07-特殊变量.wmv

08-单引号和双引号的区别.wmv

09-运算式.wmv

10-条件判断.wmv

4.code

opt

demo.zip

shelldemo.zip

shelldemo2.zip

shelldemo3.zip

software.zip

06Hadopp

hadoop.xmind

1.笔记

01_尚硅谷大数据技术之大数据概论.docx

02_尚硅谷大数据技术之Hadoop(入门)V4.0.docx

03_尚硅谷大数据技术之Hadoop(HDFS)V4.0.docx

04_尚硅谷大数据技术之Hadoop(MapReduce&Yarn)V4.0(1).docx

04_尚硅谷大数据技术之Hadoop(MapReduce&Yarn)V4.0.docx

05_尚硅谷大数据技术之Hadoop(Yarn)V4.0(1).docx

05_尚硅谷大数据技术之Hadoop(Yarn)V4.0.docx

06_尚硅谷大数据技术之Hadoop(优化&新特性)V4.0.docx

3.代码

3.代码.zip

视频

day30

上午

02-case语句.mp4

02-if语句.mp4

03-for循环.mp4

04-while循环.mp4

05-read.mp4

06-系统函数.mp4

07-自定义函数.mp4

08-Shell工具-cut.mp4

09-Shell工具-awk.mp4

10-正则表达式.mp4

下午

01-大数据概念和特点.mp4

02-大数据应用场景.mp4

03-大数据发展前景.mp4

04-大数据部门组织架构.mp4

05-Hadoop概述.mp4

06-Hadoop三大发行版本.mp4

07-Hadoop优势.mp4

10-Yarn概述.mp4

11-MR概述.mp4

12-HDFS,YARN,MR之间的关系.mp4

13-大数据技术生态体系和推荐系统架构图.mp4

14-Linux配置.mp4

HDFS.xlsx

Linux配置.txt

day31

day02

01-复习.wmv

02-JDK安装.mp4

03-Hadoop安装.mp4

04-Hadoop的目录结构.mp4

05-克隆三台虚拟机.mp4

06-wordcount案例.mp4

07-scp.mp4

08-rsync.mp4

09-SSH.mp4

10-分发脚本xsync.mp4

11-集群规划.mp4

12-集群配置和启动.mp4

13-常见错误-配置错误.mp4

14-常见错误二-重复格式化.mp4

15-jpsall.mp4

clear.sh

Hadoop安装.txt

JDK安装.txt

jpsall

xsync

常见错误.xlsx

本地模式.txt

集群配置和启动.txt

day32

day32

HDFSDemo.zip

day03

01-群起脚本.wmv

02-常用网址.wmv

03-集群测试.wmv

04-集群启动和停止方式总结.wmv

05-历史服务器.wmv

06-日志聚集.wmv

07-时间同步.wmv

08-时间同步2.wmv

09-HDFS概述.wmv

10-HDFS优缺点.wmv

11-HDFS组成架构.wmv

12-文件块大小.wmv

13-Shell操作-上传.wmv

14-Shell操作-下载.wmv

15-Shell操作-其它.wmv

16-windows上Hadoop的配置.wmv

17-API操作-工程的创建.wmv

18-API操作-上传.wmv

19-API操作-下载.wmv

Hadoop中的网址.txt

HDFS.xlsx

myhadoop.sh

新建 Microsoft Excel 工作表.xlsx

day33

01-复习.wmv

02-给main方法传参.wmv

03-第二种方式创建客户端对象.wmv

04-参数的优先级.wmv

05-HDFS写数据流程.wmv

06-节点距离计算.wmv

07-机架感知.wmv

08-HDFS读数据流程.wmv

09-NN和2NN工作机制.wmv

10-fsimage和edits文件.wmv

11-CheckPoint参数设置.wmv

12-DataNode工作机制.wmv

13-数据完整性.wmv

14-掉线时限参数设置.wmv

15-edits文件补充.wmv

16-MR概述.wmv

17-MR优缺点.wmv

18-MR核心思想.wmv

19-MR进程.wmv

20-WordCount源码.wmv

MR核心思想.xlsx

NN和2NN.xlsx

块.xlsx

day34

01-复习.wmv

02-wordcount分析.mp4

03-WC-Mapper实现.mp4

04-WC-Reducer.mp4

05-WC-Driver.mp4

06-常见错误.mp4

07-在集群上运行Job.mp4

08-从本地向集群提交Job.mp4

09-Hadoop序列化框架概述.mp4

10-流量统计分析.mp4

11-流量统计实现.mp4

12-MR的理解.mp4

13-切片与MapTask并行度机制.mp4

14-InputFormat.mp4

InputFormat.txt

MRDemo.zip

MR的理解.txt

day35

01-复习.wmv

02-Debug调试.mp4

03-Debug调试案例.mp4

04-Job提交流程-本地.mp4

05-Job提交流程-集群.mp4

06-Job提交流程总结.mp4

07-切片源码.mp4

08-TextInputFormat的key和value.mp4

09-CombineTextInputFormat.mp4

10-MR工作流程-Job提交.mp4

11-Shuffle机制01.mp4

12-Shuffle机制02.mp4

13-分区的源码.mp4

14-分区的案例.mp4

3.代码.zip

Job提交流程总结.txt

分区的源码.txt

切片源码.txt

day36

01-复习.wmv

02-单词统计分区案例.mp4

03-排序概述.mp4

04-排序案例一.mp4

05-排序案例二.mp4

06-Combiner.mp4

07-OutputFormat.mp4

08-MR工作流程.mp4

09-数据格式的问题.mp4

10-自定义OutputFormat.mp4

11-MapJoin-分析.mp4

12-MapJoin-实现.mp4

Combiner.xlsx

MRDemo.zip

OutputFormat.txt

流.xlsx

day37

01-复习.wmv

02-ReduceJoin分析.mp4

03-ReduceJoin-OrderBean完成.mp4

04-ReduceJoin-Mapper.mp4

05-ReduceJoin-排序.mp4

06-ReduceJoin-分组.mp4

07-ReduceJoin-Reducer.mp4

08-ReduceJoin-Driver.mp4

09-ReduceTask并行度决定机制.mp4

10-MR开发总结.mp4

11-压缩方式的概述.mp4

12-压缩开启.mp4

13-Yarn基础架构.mp4

14-Yarn工作机制.mp4

15-作业提交全过程.mp4

MRDemo.zip

ReduceJoin.xlsx

day38

01-复习.wmv

02-集群练习说明.mp4

03-调度器.mp4

04-FIFO调度器.mp4

05-容量调度器.mp4

06-公平调度器01.mp4

07-公平调度器02.mp4

08-Yarn生产环境配置.mp4

09-多队列配置.mp4

10-向指定队列提交Job.mp4

11-安全模式.mp4

12-元数据丢失演示1.mp4

13-元数据丢失演示2.mp4

14-块数据丢失.mp4

15-HDFS多目录设置.mp4

HDFS故障处理.xlsx

day39

01-复习wmv.mp4

02-添加新数据节点.mp4

03-服务器间数据均衡.mp4

04-白名单.mp4

05-黑名单.mp4

06-MR优化-数据输入.mp4

07-MR优化-Map阶段.mp4

08-MR优化-Reduce阶段.mp4

09-MR优化-IO传输.mp4

10-MR优化-数据倾斜.mp4

11-MR优化-常用的调优参数.mp4

12-MR优化-小文件优化.mp4

13-集群间拷贝.mp4

14-小文件存档.mp4

15-回收站.mp4

SSH.xlsx

数据倾斜.xlsx

添加新节点.txt

资料

22尚硅谷大数据(3.9)等多个文件.zip

集群练习

集群练习 (2).z01

集群练习 (2).z02

集群练习 (2).zip

集群练习.zip

07Zookeeper

zookeeper.xmind

1.笔记

尚硅谷大数据技术之Zookeeper(V4.0).docx

2.资料

apache-zookeeper-3.5.7-bin.tar.gz

ZK本地安装.txt

3.视频

day01

01-ZK概述.mp4

02-ZK特点.mp4

03-ZK数据结构.mp4

04-ZK应用场景.mp4

05-ZK下载.mp4

06-ZK本地安装.mp4

ZK本地安装.txt

day02

01-概述.mp4

02-ZK集群配置.mp4

03-群起脚本.mp4

04-配置参数解读.mp4

05-Leader选举-第一次启动.mp4

06-Leader选举-非第一次启动.mp4

07-ZK命令.mp4

08-监听器原理.mp4

09-写数据流程.mp4

zkCluster.sh

ZK集群.txt

4.code

08Ha

HA(High Availablity).xmind

01-课件

尚硅谷大数据技术之Hadoop(HA)V4.0.docx

02-视频

01-HA准备工作.mp4

02-手动故障转移.mp4

03-自动故障转移.mp4

04-Yarn的HA.mp4

05-恢复到原集群.mp4

NN-HA.xlsx

NN-HA配置.txt

RM-HA配置.txt

准备工作.txt

恢复到原来的集群.txt

03-代码

04_资料

09Hive

大数据技术之Hive.xmind

1.笔记

Hive.xmind

hive阶段常见问题1.0.docx

尚硅谷大数据技术之Hive-4.0.docx

常用函数.txt

手写HQL题目.docx

ppt

Hive优化之大表大表join-大表打散表扩容.ppt

尚硅谷大数据技术之Hive–sort by & limit.ppt

尚硅谷大数据技术之Hive–SQL转化MR.ppt

尚硅谷大数据技术之Hive–元数据访问之内元数据库直连模式.ppt

尚硅谷大数据技术之Hive–元数据访问之内嵌模式.ppt

尚硅谷大数据技术之Hive–元数据访问之远程服务模式.ppt

尚硅谷大数据技术之Hive–前后端数据传输介绍.ppt

尚硅谷大数据技术之Hive–架构原理.ppt

尚硅谷大数据技术之Hive–行转列图示.ppt

尚硅谷大数据技术之Hive-hive执行SQL流程.ppt

尚硅谷大数据技术之Hive-元数据和真实数据 .ppt

尚硅谷大数据技术之Hive-数据类型.vsdx

尚硅谷大数据技术之Hive-窗口函数演示.ppt

尚硅谷大数据技术之Hive-表优化之group by.ppt

尚硅谷大数据技术之Hive-表优化之大表join大表之空key转换.ppt

尚硅谷大数据技术之Hive.pptx

2.资料

uTorrent.v2.21已优化配置.zip

01_jar

apache-hive-3.1.2-bin.tar.gz

mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar

mysql-connector-java-5.1.37.jar

02_data

log.data

100万条大表数据(id除以10取整)

bigtable

10万条小表数据(id为9万+随机数字)

smalltable

company

company_dept.txt

company_emp.txt

guliVideo

user

user.txt

video

1.txt

2.txt

3.txt

4.txt

5.txt

student

student.txt

加递增id的原始数据

ori

动态分区数据

ds1

ds2

原始数据

SogouQ1.txt

含有null的id数据100万条

nullid

03_常用函数

常用函数.txt

04_脚本

hive.sh

hive2.sh

Hive实战.sql

Join.sql

函数.sql

分组.sql

排序.sql

查询.sql

idea依赖jar包

jdbc-drivers.xml

jdbc-drivers.zip

Hive

3.1.2

hive-jdbc-3.1.2-standalone.jar

hive-license.txt

MySQL ConnectorJ

8.0.25

mysql-connector-java-8.0.25.jar

mysql-connector-license.txt

推荐软件

DittoSetup_64bit_3_24_184_0.exe

geek.exe

MouseWithoutBordersSetup.msi

prettyZoo-win.msi

SwitchHosts_installer_4.0.3.6070.exe

uTorrent.v2.21已优化配置.zip

XMind ZEN 9.1.3 Portable便携版

api-ms-win-core-console-l1-1-0.dll

api-ms-win-core-datetime-l1-1-0.dll

api-ms-win-core-debug-l1-1-0.dll

api-ms-win-core-errorhandling-l1-1-0.dll

api-ms-win-core-file-l1-1-0.dll

api-ms-win-core-file-l1-2-0.dll

api-ms-win-core-file-l2-1-0.dll

api-ms-win-core-handle-l1-1-0.dll

api-ms-win-core-heap-l1-1-0.dll

api-ms-win-core-interlocked-l1-1-0.dll

api-ms-win-core-libraryloader-l1-1-0.dll

api-ms-win-core-localization-l1-2-0.dll

api-ms-win-core-memory-l1-1-0.dll

api-ms-win-core-namedpipe-l1-1-0.dll

api-ms-win-core-processenvironment-l1-1-0.dll

api-ms-win-core-processthreads-l1-1-0.dll

api-ms-win-core-processthreads-l1-1-1.dll

api-ms-win-core-profile-l1-1-0.dll

api-ms-win-core-rtlsupport-l1-1-0.dll

api-ms-win-core-string-l1-1-0.dll

api-ms-win-core-synch-l1-1-0.dll

api-ms-win-core-synch-l1-2-0.dll

api-ms-win-core-sysinfo-l1-1-0.dll

api-ms-win-core-timezone-l1-1-0.dll

api-ms-win-core-util-l1-1-0.dll

api-ms-win-crt-conio-l1-1-0.dll

api-ms-win-crt-convert-l1-1-0.dll

api-ms-win-crt-environment-l1-1-0.dll

api-ms-win-crt-filesystem-l1-1-0.dll

api-ms-win-crt-heap-l1-1-0.dll

api-ms-win-crt-locale-l1-1-0.dll

api-ms-win-crt-math-l1-1-0.dll

api-ms-win-crt-multibyte-l1-1-0.dll

api-ms-win-crt-private-l1-1-0.dll

api-ms-win-crt-process-l1-1-0.dll

api-ms-win-crt-runtime-l1-1-0.dll

api-ms-win-crt-stdio-l1-1-0.dll

api-ms-win-crt-string-l1-1-0.dll

api-ms-win-crt-time-l1-1-0.dll

api-ms-win-crt-utility-l1-1-0.dll

blink_image_resources_200_percent.pak

content_resources_200_percent.pak

content_shell.pak

d3dcompiler_47.dll

ffmpeg.dll

file.dat

icudtl.dat

libEGL.dll

libGLESv2.dll

LICENSE.electron.txt

LICENSES.chromium.html

msvcp140.dll

natives_blob.bin

node.dll

ucrtbase.dll

ui_resources_200_percent.pak

Uninstall XMind ZEN.exe

v8_context_snapshot.bin

vcruntime140.dll

views_resources_200_percent.pak

XMind ZEN.exe

卸载.bat

locales

am.pak

ar.pak

bg.pak

bn.pak

ca.pak

cs.pak

da.pak

de.pak

el.pak

en-GB.pak

en-US.pak

es-419.pak

es.pak

et.pak

fa.pak

fake-bidi.pak

fi.pak

fil.pak

fr.pak

gu.pak

he.pak

hi.pak

hr.pak

hu.pak

id.pak

it.pak

ja.pak

kn.pak

ko.pak

lt.pak

lv.pak

ml.pak

mr.pak

ms.pak

nb.pak

nl.pak

pl.pak

pt-BR.pak

pt-PT.pak

ro.pak

ru.pak

sk.pak

sl.pak

sr.pak

sv.pak

sw.pak

ta.pak

te.pak

th.pak

tr.pak

uk.pak

vi.pak

zh-CN.pak

zh-TW.pak

resources

app.asar

electron.asar

elevate.exe

xmind_file.ico

app.asar.unpacked

node_modules

edge-asar-cs

LICENSE.txt

package.json

lib

edge-cs.dll

edge-cs.js

edge-cs-coreclr

edge-cs-coreclr.dll

project.json

src

edge-cs

EdgeCompiler.cs

Properties

AssemblyInfo.cs

edge-cs-coreclr

EdgeCompiler.cs

global.json

gulpfile.js

package.json

project.json

tools

install.js

edge-cs

LICENSE.txt

package.json

lib

edge-cs.dll

edge-cs.js

bootstrap

Dummy.cs

project.json

src

edge-cs

EdgeCompiler.cs

Properties

AssemblyInfo.cs

Edge.js.CSharp

EdgeCompiler.cs

gulpfile.js

package.json

project.json

tools

install.js

electron-edge-js

Dockerfile

LICENSE

package.json

lib

double_edge.js

edge.js

bootstrap

Dummy.cs

project.json

native

win32

ia32

concrt140.dll

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

10.2.0

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

6.5.0

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

7.4.0

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

7.9.0

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

8.2.1

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

8.9.3

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

x64

concrt140.dll

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

10.2.0

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

6.5.0

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

7.4.0

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

7.9.0

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

8.2.1

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

8.9.3

concrt140.dll

edge_coreclr.node

edge_nativeclr.node

msvcp140.dll

vccorlib140.dll

vcruntime140.dll

samples

101_hello_lambda.js

102_hello_function.js

103_hello_file.csx

103_hello_file.js

104_add7_class.js

105_add7_dll.js

106_marshal_v82clr.js

107_marshal_clr2v8.js

108_func.js

108_lambda.js

109_sync.js

110_clr_instance.js

111_clr_listener.js

201_worker.js

202_sql.csx

202_sql.js

203_x509store.js

204_event_log.js

205_soap.csx

205_soap.js

206_registry_read.js

206_registry_write.js

207_unzip.js

207_zip.js

208_convertImage.js

209_websocket.js

210_windows_authentication.js

211_events.js

301_cspyfsps.js

edge.png

readme.txt

src

common

callbackhelper.cpp

clrfuncreflectionwrap.cs

edge.cpp

edge_common.h

utils.cpp

v8synchronizationcontext.cpp

CoreCLREmbedding

coreclrembedding.cpp

coreclrfunc.cpp

coreclrfuncinvokecontext.cpp

coreclrnodejsfunc.cpp

coreclrnodejsfuncinvokecontext.cpp

edge.h

cpprest

include

asyncrt_utils.h

json.h

deps

deps_entry.cpp

deps_entry.h

deps_format.cpp

deps_format.h

deps_resolver.cpp

deps_resolver.h

fxr

fx_muxer.cpp

fx_muxer.h

fx_ver.cpp

fx_ver.h

host

args.cpp

args.h

coreclr.cpp

coreclr.h

error_codes.h

libhost.cpp

libhost.h

runtime_config.cpp

runtime_config.h

json

casablanca

LICENSE.txt

include

stdafx.h

cpprest

asyncrt_utils.h

json.h

details

basic_types.h

cpprest_compat.h

nosal.h

SafeInt3.hpp

src

json

json.cpp

json_parsing.cpp

json_serialization.cpp

utilities

asyncrt_utils.cpp

pal

pal.h

pal.unix.cpp

pal.windows.cpp

pal_utils.cpp

pal_utils.h

trace.cpp

trace.h

dotnet

clractioncontext.cpp

clrfunc.cpp

clrfuncinvokecontext.cpp

clrfuncreflectionwrap.cpp

edge.h

nodejsfunc.cpp

nodejsfuncinvokecontext.cpp

persistentdisposecontext.cpp

utils.cpp

double

Edge.js

dotnet

EdgeJs.cs

dotnetcore

coreclrembedding.cs

nodejsfunc.cs

nodejsfuncinvokecontext.cs

semversion.cs

mono

clractioncontext.cpp

clrfunc.cpp

clrfuncinvokecontext.cpp

clrfuncinvokecontext.cs

dictionary.cpp

edge.h

monoembedding.cpp

monoembedding.cs

nodejsfunc.cpp

nodejsfunc.cs

nodejsfuncinvokecontext.cpp

nodejsfuncinvokecontext.cs

task.cpp

utils.cpp

stress

test.js

tools

build.bat

buildall.bat

build_double.bat

checkplatform.js

coverage.js

download.cs

download.js

install.js

repl.cs

runJsHint.js

test.js

unzip.cs

unzip.vbs

whereis.js

nuget

edge.nuspec

install.ps1

static

native

ReachFramework.dll

System.Printing.dll

XMindShellExt.dll

HQL题目

手写HQL题目02.docx

手写HQL题目02讲解.docx

视频

day01

01-hive-课件介绍.mp4

02-课前准备.mp4

03-hive-课程介绍.mp4

04-hive-基本概念–介绍.mp4

05-Hive-基本概念–hive本质的介绍.mp4

06-Hive-基本概念–hive的架构原理.mp4

07-Hive-基本概念-hive执行机制-与数据库的关系-优缺点.mp4

08-HIve-安装–hive的解压安装.mp4

09-HIve-安装-元数据之derby.mp4

10-HIve-上午回顾.mp4

11-Hive-安装–元数据之Derby的问题.mp4

12-Hive-安装-元数据之Mysql–mysql安装部署.mp4

13-Hive-安装-元数据之mysql–hive元数据切换为mysql存储.mp4

14-Hive-安装-元数据之metastore server方式.mp4

15-Hive-安装-hive的访问方式之JDBC.mp4

16-HIve-idea-连接mysql.mp4

17-Hive-idea-连接-hive2.mp4

day02

18-Hive-昨日回顾.mp4

19-Hive-安装之hive2.sh脚本编写及介绍.mp4

20-Hive-hive的元数据和真实数据及count(1)的问题.mp4

21-HIve-安装之hive的配置参数介绍及交互命令.mp4

22-HIve-安装之hive的三种参数配置方式及优先级.mp4

23-Hive-数据类型-介绍.mp4

24-Hive-数据类型-案例实操.mp4

25-Hive-数据类型-数据类型转换.mp4

26-Hive-DDL数据定义语言-数据库创建修改查询删除.mp4

27-Hive-上午回顾.mp4

28-HIve-DDL数据定义语言之表语句介绍.mp4

29-hive-DDL数据定义语言之管理表的创建.mp4

30-Hive-DDL数据定义语言之外部表的创建.mp4

31-Hive-DDL数据定义语言之内部表和外部表转换.mp4

32-Hive-DDL数据定义语言之修改表.mp4

33-Hive-DML数据操作语言之数据导入loaddata.mp4

34-Hive-DML数据操作之数据导入insert,as select,location.mp4

35-Hive-DML数据操作之数据导出–insert.mp4

36-Hive-DML数据操作之数迁移.mp4

37-Hive-查询之基本查询-全表特定列和列的别名.mp4

day03

38-Hive-昨日回顾.mp4

39-Hive-hive的元数据和真实数据间的关系.mp4

40-Hive-查询–基本查询之算数运算符和常用函数和limit和where.mp4

41-Hive-查询-基本查询-之比较运算符和逻辑运算符.mp4

42-Hive-查询-分组–group by和having.mp4

43-Hive-查询-分组中的reduce个数.mp4

44-Hive-join语句中的等值连接和非等值连接.mp4

45-Hive-join语句中的左连接有链接满链接多表连接笛卡尔积.mp4

46-Hive-排序–全局排序–order by.mp4

47-HIve-排序–分区排序的排序-sort by.mp4

48-Hive-排序-分区排序的分区–distrubte by.mp4

49-Hive-排序-cluster by.mp4

50-hive-上午回顾.mp4

51-Hive-分区表–基本操作.mp4

52-Hive-分区表-二级分区-及-元数据和真实数据的映射关系.mp4

53-HIve-分区表–动态分区.mp4

54-HIve-分桶表.mp4

day04

01-Hive-回顾.mp4

02-Hive-函数-nvl.mp4

03-Hive-函数-case和if.mp4

04-Hive-函数-行转列–concat-concat_ws_collect_setlist.mp4

05-Hive-函数-列转行.mp4

06-Hive-函数-窗口函数-介绍.mp4

07-Hive-上午回顾.mp4

08-Hive-函数-开窗函数之案例1.mp4

09-HIve-函数-开窗函数之案例2.mp4

10-Hive-函数-开窗函数之案例3.mp4

11-Hive-函数-开窗函数之案例4.mp4

12-Hive-函数-开窗函数-之案例5.mp4

13-Hive-函数-开窗函数之案例6.mp4

14-Hive-函数-自定义函数介绍和代码编写.mp4

15-Hive-函数-自定义函数的测试.mp4

day05

04-HIve-压缩–介绍.mp4

05-HIve-压缩-Map阶段的输出压缩.mp4

06-HIve-压缩-Reduce阶段的输出压缩.mp4

07-HIve-存储-存储文件类型介绍.mp4

08-Hive-存储-ORC介绍.mp4

09-Hive-存储-Parquet介绍.mp4

10-Hive-存储-主流文件存储格式对别.mp4

11-HIve-存储-压缩和存储结合测试.mp4

视频

01-Hive-手写SQL-第一题.mp4

02-HIve-手写SQL第二题.mp4

03-Hive-手写SQL第三题.mp4

04-HIve-压缩–介绍.mp4

05-HIve-压缩-Map阶段的输出压缩.mp4

06-HIve-压缩-Reduce阶段的输出压缩.mp4

07-HIve-存储-存储文件类型介绍.mp4

08-Hive-存储-ORC介绍.mp4

09-Hive-存储-Parquet介绍.mp4

10-Hive-存储-主流文件存储格式对别.mp4

11-HIve-存储-压缩和存储结合测试.mp4

day06

01-Hive-昨日回顾.mp4

02-HIve-企业级优化之Explain.mp4

03-HIve-企业级优化之HQL语法优化—Groupby.mp4

04-HIve-企业级优化之HQL语法优化之CBO.mp4

05-Hive-企业级优化之HQL语法优化–谓词下推.mp4

06-HIve-企业级优化之HQL语法优化-MapJoin.mp4

07-Hive-企业级优化之HQL语法优化-SMB和笛卡尔积.mp4

08-Hive-企业级优化之数据倾斜–单表数据倾斜优化.mp4

09-HIve-企业级优化之数据倾斜–join数据倾斜优化.mp4

10-Hive-企业级优化之数据倾斜-join大表join大表,大表打散小表扩容.mp4

11-Hive-企业级优化之Hivejob优化之Map阶段和Reduce阶段.mp4

12-Hive-企业级优化之Hivejob整体优化.mp4

13-Hive-企业级优化之Hive-job整体优化之严格模式.mp4

14-Hive-上午回顾.mp4

15-Hive-实战-背景介绍及数据准备.mp4

16-Hive-实战-案例1.mp4

17-Hive-实战–案例2.mp4

18-Hive-实战-案例3.mp4

19-HIve-实战-案例4.mp4

20-hive-实战–案例5.mp4

21-Hive-实战-案例6.mp4

22-Hive-实战–案例7.mp4

Hive实战.sql

课前准备

1.文档

尚硅谷大数据技术之idea连接HiveServer2.docx

尚硅谷大数据技术之idea连接Linux.docx

尚硅谷大数据技术之idea连接Mysql.docx

2.资料

JetBrainsMono-2.242.zip

10Flume

Flume.xmind

1.笔记

Flume.xmind

尚硅谷大数据技术之Flume.docx

2.资料

apache-flume-1.9.0-bin.tar.gz

3.视频

01-Flume-介绍.mp4

02-Flume-概述–架构介绍.mp4

03-Flume-入门之安装部署.mp4

04-Flume-入门案例01-配置文件编写.mp4

05-Flume-入门案例-02-配置文件编写.mp4

05-Flume-入门案例01-测试.mp4

06-Flume-上午回顾.mp4

06-flume-入门案例-02 测试.mp4

07-Flume-进阶-Flume事务.mp4

08-Flume进阶-Agent内部原理.mp4

09-Flume-企业级案例-复制案例-配置文件编写.mp4

10-FLume-企业级案例-复制案例–测试.mp4

11-Flume-企业级案例-多路复用和拦截器–拦截器的编写.mp4

12-Flume-企业级案例-多路复用和拦截器-agent的配置文件编写.mp4

13-Flume-企业级案例-多路复用和拦截器的使用测试.mp4

14-Flume-企业级案例–聚合案例.mp4

15-Flume-监控.mp4

16-Flume-面试题.mp4

_new_1201-Flume-介绍.mp4

11Kafka

11Kafka.zip

1.笔记

Kafka3.x.xmind

尚硅谷大数据技术之Kafka-3.0.0-授课.docx

ppt

kafka在zookeeper中的内容.pptx

尚硅谷大数据技术之kafka - 分区策略-给定key值.pptx

尚硅谷大数据技术之kafka - 分区策略-给定分区号.pptx

尚硅谷大数据技术之kafka - 分区策略-默认Sticky.pptx

尚硅谷大数据技术之kafka - 分区策略.pptx

尚硅谷大数据技术之kafka.pptx

2.资料

kafka-3.0.0-src.tgz

kafka-3.0.0-src带注释.zip

kafka-eagle-bin-2.0.8.tar.gz

kafka_2.12-3.0.0.tgz

log4j2.xml

相关脚本

kafka.sh

xcall

xsync

zk.sh

day01

01-kafka–课程介绍.mp4

02-kafka-kafka介绍和消息队列特性介绍.mp4

03-kafka-概述–消息队列的两种模式.mp4

04-kafka-概述kafka基础架构.mp4

05-kafka-入门-kafka安装部署.mp4

06-kafka-入门-命令行操作.mp4

07-kafka-上午回顾.mp4

08-kafka-入门-群起脚本编写.mp4

09-kafka-生产者-流程介绍-.mp4

10-kafka-生产者-简单的异步发送.mp4

11-kafka-生产者-带回调函数的异步发送.mp4

kafka-demo.zip

day02

01-kafka-昨日回顾.mp4

02-kafka-生产者–同步发送及同步发送和异步发送对比.mp4

03-Kafka-生产者-分区策略介绍及演示.mp4

04-kafka-生产者-分区源码增值服务.mp4

05-kafka-生产者-自定义分区器的编写和测试.mp4

06=kafka-生产者-提高吞吐量.mp4

07-Kakfa-生产者-数据可靠性保证之ACK应答级别.mp4

08-kafka-生产者-数据可靠性保证-ACK应答机制的ISR队列及总结.mp4

09-kafka-生产者-ack测试.mp4

10-kafka-生产者-精准一次性之幂等性.mp4

11-kafka-生产者-精准一次性之事务.mp4

12-kafka-上午回顾.mp4

13-kafka-生产者-数据有序和数据乱序.mp4

14-kafka-kafkaBroker中zookeeper存储了什么内容.mp4

15-kafka-kafkaBroker中总体工作流程.mp4

16-kafka-kafkaBroker中leader副本选举演示.mp4

17-kafka-kafkaBroker的leader副本选举过程分析.mp4

18-kafka-kafka-Broker的副本之follower故障处理细节.mp4

19-kafka-kafka-Broker的副本之Leader故障处理.mp4

20-kafka-kafkaBroker-的文件存储机制.mp4

21-kafka-kafkaBroker的文件清理策略.mp4

kafka-demo.zip

day03

01-kafka-所有回顾.mp4

02-kafka-kafkaBroker–高效读写数据.mp4

03-kafka-消费者–消费方式.mp4

04-kafka-消费者-消费整体流程.mp4

05-kafka-消费者 - 消费者组原理介绍.mp4

06-kafka-消费者-消费者组初始化流程.mp4

07-kafka-消费者-消费者的详细消费流程介绍.mp4

08-kafka-消费者-一个消费者的代码编写.mp4

09-kafka-消费者-消费者组的代码编写和测试.mp4

10-kafka-消费者-消费者组分区分配介绍.mp4

11-kafka-消费者–分区分配策略之Range.mp4

12-kafka-消费者-分区分配策略之roundrobin.mp4

13-kafka-消费者–分区分配之sticky.mp4

14-kafka-消费者-上午回顾.mp4

15-kafka-消费者–消费者的offset的维护.mp4

16-kafka-消费者–消费者offset自动提交.mp4

17-kafka-消费者的手动提交.mp4

18-kafka-消费者–指定offset消费.mp4

19-kafka-消费者–漏消费和重复消费以及Consumer事务.mp4

20-kafka-消费者-数据积压问题.mp4

21-kafka-监控.mp4

22-kafka-kafka的kraft模式.mp4

12电商数据(数据采集)

01_文档

01_尚硅谷大数据项目之电商数仓(数据采集)之日志数据采集.docx

02_尚硅谷大数据项目之电商数仓(数据采集)之业务数据采集.docx

03_尚硅谷大数据项目之电商数仓(数据采集)之数仓数据同步策略.docx

ppt

尚硅谷大数据技术之Maxwell–MySQL从复制技术.ppt

尚硅谷大数据技术之Maxwell–MySQL从复制技术.pptx

图示

kafkaChannel的三种部署模式.drawio

业务数据全量同步脚本编写逻辑.drawio

数仓图示.drawio

日志采集回顾.drawio

拓展文档

02_尚硅谷大数据Hadoop多目录配置案例实操.docx

尚硅谷大数据技术之业务数建模工具chiner.docx

视频

collection_pro

collection_pro.zip

day01

01-采集项目–资料介绍.mp4

02-采集项目–数仓–数仓介绍.mp4

03-采集项目-数仓-数仓项目架构图示01-数据介绍及采集介绍.mp4

04-采集项目-数仓-数仓项目架构图示02数仓分层.mp4

05-采集项目-数仓-数仓项目架构图03-完整架构.mp4

06-采集项目-数仓-需求分析和技术选型.mp4

07-采集项目-数仓-数仓系统流程设计.mp4

08-采集项目-数仓-框架版本及appache框架版本的选择.mp4

09-采集项目-数仓-集群资源规划.mp4

10-采集项目-数仓-上午回顾.mp4

11-采集项目-用户行为数据-数据埋点.mp4

12-采集项目-用户行为数据–日志内容.mp4

13-采集项目-用户行为数据-日志格式.mp4

14-采集项目-服务器–虚拟机创建和系统安装-.mp4

15-采集项目-服务器–单机配置.mp4

16-采集项目–服务器-三台节点环境配置.mp4

17-采集项目-云服务器选购.mp4

18-虚拟机IP说明及VM软件虚拟网卡.mp4

day02

01-安装linux虚拟机系统的网络问题处理方案.mp4

02-采集项目-前日回顾.mp4

03-采集项目–基本环境准备–环境变量说明.mp4

04-采集项目-数据模拟.mp4

05-采集项目-环境准备–xcall脚本编写.mp4

06-采集项目–环境准备-xsync数据同步脚本编写.mp4

07-采集项目–hadoop–安装部署.mp4

08-采集项目–hadoop–启动及启动脚本的编写.mp4

09-采集项目-hadoop–2nn的bug处理.mp4

10-采集项目–hadoop的项目经验.mp4

11-采集项目-上午回顾.mp4

12-采集项目-zookeeper安装部署.mp4

13-采集项目–kafka安装部署.mp4

14-采集项目-flume安装部署.mp4

15-采集项目-flume项目经验.mp4

16-采集项目-日志采集flume–组件选择.mp4

17-采集项目–日志采集flume–配置文件编写.mp4

18-采集项目-日志采集flume–配置文件测试.mp4

19-采集项目-日志采集flume-拦截器编写.mp4

20-采集项目-日志采集flume-测试.mp4

21-采集项目-日志采集flume-f1.sh 脚本编写.mp4

collection_pro

collection_pro.iml

pom.xml

.idea

.gitignore

compiler.xml

deployment.xml

jarRepositories.xml

misc.xml

sshConfigs.xml

uiDesigner.xml

webServers.xml

workspace.xml

azure

azureSettings.xml

codeStyles

codeStyleConfig.xml

Project.xml

doc

conf

flume-tailDir-kafka.conf

shell

f1.sh

hadoop.sh

kafka.sh

lg.sh

xcall.sh

xsync.sh

zk.sh

src

main

java

com

atguigu

flume

interceptor

ETLInterceptor.java

JSONUtil.java

resources

test

java

target

collection_pro-1.0-SNAPSHOT-jar-with-dependencies.jar

collection_pro-1.0-SNAPSHOT.jar

archive-tmp

classes

com

atguigu

flume

interceptor

ETLInterceptor$Builder.class

ETLInterceptor.class

JSONUtil.class

generated-sources

annotations

maven-archiver

pom.properties

day03

01-采集项目–昨日回顾.mp4

02-采集项目-电商业务介绍及后台体验.mp4

03-采集项目-电商业务表结构介绍.mp4

04-采集项目-mysql数据库安装及gmall数据库初始化.mp4

05-采集项目-模拟数据.mp4

06-采集项目-数据建模工具介绍.mp4

07-采集项目-业务数据同步通道介绍.mp4

08-采集项目-业务数据同步工具-Maxwell介绍及原理.mp4

09-采集项目-上午回顾.mp4

10-采集项目-业务数据同步工具-Maxwell安装和部署配置.mp4

11-采集项目-业务数据同步工具-Maxwell增量数据同步测试.mp4

12-采集项目-业务数据同步工具-Maxwell的启动脚本编写.mp4

13-采集项目-业务数据同步工具-Maxwell的历史数据全量同步.mp4

14-采集项目-业务数据采集模块之业务数据增量同步到kafka.mp4

~uTorrentPartFile_257C1CF4.dat

day04

03-采集项目-离线数仓同步数据-用户行为数据同步–flume配置文件编写及测试.mp4

04-采集项目-离线数仓同步数据-用户行为采集–时间飘移问题解决拦截器编写及测试.mp4

05-采集项目-离线数仓同步数据-用户行为数据同步–拦截器选择的必要性生产中也得用.mp4

06-采集项目-离线数仓同步数据-用户行为数据同步–kafkachannel全链路配置.mp4

07-HQL16道之4.mp4

08-上午回顾.mp4

09-采集项目-离线数仓同步数据-用户行为数据同步全通路测试.mp4

10-采集项目-离线数仓同步数据-业务数据同步策略介绍.mp4

11-采集项目-离线数仓同步数据-业务数据同步工具-dataX的介绍.mp4

12-采集项目-离线数仓同步数据-业务数据同步工具-dataX安装.mp4

13-采集项目-离线数仓同步数据-业务数据同步工具-dataX之mysql道HDFS的同步.mp4

day05

01-采集项目–昨日回顾.mp4

02-采集项目-业务数据同步工具–datax的动态传参.mp4

03-采集项目-业务数据同步工具–dataX的同步HDFS数据到MySQL的案例.mp4

04-采集项目-业务数据同步工具–dataX同步mysql数据和HDFS数null值处理.mp4

05-采集项目-业务数据同步工具-datax优化.mp4

06-采集项目-业务数据全量同步–data的json文件生成脚本.mp4

07-采集项目-业务数据全量同步-datax的json文件批量生成脚本.mp4

08-采集项目-业务数据全量同步–dateX的全部同步脚本.mp4

09-采集项目-业务数增量同步-业务数据消费flume的配置文件编写及拦截其编写及测试.mp4

10-采集项目-业务业务数据同步–Maxwell数据飘移问题.mp4

11-采集项目-业务数据同步–业务数据消费flume启动关闭脚本编写.mp4

12-采集项目-业务数据同步–增量数据的首日全量.mp4

13-采集项目–最终–全部测试01.mp4

14-采集项目–最终–全部测试02.mp4

15-数据仓库准备.mp4

资料

22尚硅谷大数据(3.9)等多个文件

maven

1.2.62.zip

3.0.0.zip

shell

cluster.sh

f1.sh

f2.sh

hadoop.sh

kafka.sh

lg.sh

xcall.sh

xsync.sh

zk.sh

安装包

22尚硅谷大数据(3.9)等多个文件

1. linux

CentOS-7-x86_64-DVD-1804

CentOS-7-x86_64-DVD-1804.iso

sha1sum.txt

sha1sum.txt.asc

sha256sum.txt

sha256sum.txt.asc

1.jdk

jdk-8u212-linux-x64.tar.gz

2.hadoop

hadoop-3.1.3.tar.gz

hadoop-lzo-0.4.20.jar

hadoop-lzo-master.zip

3.flume

apache-flume-1.9.0-bin.tar.gz

4.kafka

kafkatool_64bit.exe

kafka_2.11-2.4.1.tgz

ZooInspector

build

zookeeper-dev-ZooInspector.jar

classes

org

apache

zookeeper

inspector

ZooInspector$1.class

ZooInspector.class

encryption

BasicDataEncryptionManager.class

DataEncryptionManager.class

gui

NodeViewersChangeListener.class

ZooInspectorAboutDialog$1.class

ZooInspectorAboutDialog.class

ZooInspectorConnectionPropertiesDialog$1.class

ZooInspectorConnectionPropertiesDialog$2.class

ZooInspectorConnectionPropertiesDialog$3.class

ZooInspectorConnectionPropertiesDialog.class

ZooInspectorIconResources.class

ZooInspectorNodeViewersDialog$1.class

ZooInspectorNodeViewersDialog$10.class

ZooInspectorNodeViewersDialog$11.class

ZooInspectorNodeViewersDialog$2.class

ZooInspectorNodeViewersDialog$3.class

ZooInspectorNodeViewersDialog$4.class

ZooInspectorNodeViewersDialog$5.class

ZooInspectorNodeViewersDialog$6.class

ZooInspectorNodeViewersDialog$7.class

ZooInspectorNodeViewersDialog$8.class

ZooInspectorNodeViewersDialog$9.class

ZooInspectorNodeViewersDialog.class

ZooInspectorNodeViewersPanel.class

ZooInspectorPanel$1.class

ZooInspectorPanel$2.class

ZooInspectorPanel$3.class

ZooInspectorPanel$4$1.class

ZooInspectorPanel$4.class

ZooInspectorPanel$5$1.class

ZooInspectorPanel$5.class

ZooInspectorPanel$6.class

ZooInspectorPanel$7.class

ZooInspectorPanel$8.class

ZooInspectorPanel$9.class

ZooInspectorPanel.class

ZooInspectorTreeViewer$1.class

ZooInspectorTreeViewer$2.class

ZooInspectorTreeViewer$3.class

ZooInspectorTreeViewer$4.class

ZooInspectorTreeViewer$ZooInspectorTreeCellRenderer.class

ZooInspectorTreeViewer$ZooInspectorTreeNode.class

ZooInspectorTreeViewer.class

nodeviewer

NodeViewerACL$1.class

NodeViewerACL.class

NodeViewerData$1.class

NodeViewerData$2.class

NodeViewerData.class

NodeViewerMetaData$1.class

NodeViewerMetaData.class

ZooInspectorNodeViewer.class

logger

LoggerFactory.class

manager

NodeListener.class

Pair.class

ZooInspectorManager.class

ZooInspectorManagerImpl$NodeWatcher.class

ZooInspectorManagerImpl.class

ZooInspectorNodeManager.class

ZooInspectorNodeTreeManager.class

ZooInspectorReadOnlyManager.class

retry

ZooKeeperRetry.class

config

defaultNodeVeiwers.cfg

icons

edtsrclkup_co.gif

file_obj.gif

fldr_obj.gif

info_obj.gif

jspdecl.gif

launch_run.gif

launch_stop.gif

new_con.gif

refresh.gif

save_edit.gif

search_next.gif

search_prev.gif

trash.gif

lib

jtoaster-1.0.4.jar

log4j-1.2.15.jar

TableLayout-20050920.jar

zookeeper-3.3.0.jar

licences

Apache Software Licence v2.0.txt

epl-v10.html

TableLayoutLicense.txt

src

build.xml

ivy.xml

.svn

entries

config

defaultNodeVeiwers.cfg

.svn

entries

icons

edtsrclkup_co.gif

file_obj.gif

fldr_obj.gif

info_obj.gif

jspdecl.gif

launch_run.gif

launch_stop.gif

new_con.gif

refresh.gif

save_edit.gif

search_next.gif

search_prev.gif

trash.gif

.svn

entries

props

edtsrclkup_co.gif.svn-work

file_obj.gif.svn-work

fldr_obj.gif.svn-work

info_obj.gif.svn-work

jspdecl.gif.svn-work

launch_run.gif.svn-work

launch_stop.gif.svn-work

new_con.gif.svn-work

refresh.gif.svn-work

save_edit.gif.svn-work

search_next.gif.svn-work

search_prev.gif.svn-work

trash.gif.svn-work

lib

jtoaster-1.0.4.jar

.svn

entries

props

jtoaster-1.0.4.jar.svn-work

licences

Apache Software Licence v2.0.txt

epl-v10.html

TableLayoutLicense.txt

.svn

entries

src

.svn

entries

java

.svn

entries

org

.svn

entries

apache

.svn

entries

zookeeper

.svn

entries

inspector

ZooInspector.java

.svn

entries

encryption

BasicDataEncryptionManager.java

DataEncryptionManager.java

.svn

entries

gui

about.html

NodeViewersChangeListener.java

ZooInspectorAboutDialog.java

ZooInspectorConnectionPropertiesDialog.java

ZooInspectorIconResources.java

ZooInspectorNodeViewersDialog.java

ZooInspectorNodeViewersPanel.java

ZooInspectorPanel.java

ZooInspectorTreeViewer.java

.svn

entries

nodeviewer

NodeViewerACL.java

NodeViewerData.java

NodeViewerMetaData.java

ZooInspectorNodeViewer.java

.svn

entries

logger

LoggerFactory.java

.svn

entries

manager

NodeListener.java

Pair.java

ZooInspectorManager.java

ZooInspectorManagerImpl.java

ZooInspectorNodeManager.java

ZooInspectorNodeTreeManager.java

ZooInspectorReadOnlyManager.java

.svn

entries

retry

ZooKeeperRetry.java

.svn

entries

5.zookeeper

apache-zookeeper-3.5.7-bin.tar.gz

6.mysql

mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar

mysql-connector-java-5.1.27-bin.jar

7.hive

apache-hive-3.1.2-bin.tar.gz

8.mock

业务

application.properties

gmall.sql

gmall2020-mock-db-2021-11-14.jar

日志

application.yml

gmall2020-mock-log-2021-01-22.jar

logback.xml

path.json

9.chiner

CHINER-win_v3.5.7.exe

ezdml_setup_win64_v322.exe

13Scala

Scala.xmind

scala回顾.txt

代码

scala0323.zip

高阶函数练习.txt

回顾

安装包

jd-gui-1.6.6-min.jar

scala-2.12.10.tar.gz

scala-2.12.10.zip

笔记

尚硅谷大数据技术之Scala(V4.0).docx

视频

day01

spark0309.zip

day02

01-回顾.mp4

02-方法的定义.mp4

03-方法的简化.mp4

04-reduce.mp4

04-方法的参数.mp4

05-maxBy.mp4

05-函数的定义.mp4

06-中午分享点评.mp4

06-类和对象的创建.mp4

07-定义属性与方法.mp4

07-方法和函数的区别.mp4

08-构造器.mp4

08-高阶函数.mp4

09-高阶函数简化01.mp4

10-高阶函数简化02.mp4

11-匿名函数.mp4

12-柯里化.mp4

13-闭包.mp4

14-递归.mp4

15-map.mp4

day03

01-回顾.mp4

02-filter.mp4

03-groupBy.mp4

04-reduce.mp4

05-maxBy.mp4

06-类和对象的创建.mp4

07-定义属性与方法.mp4

08-构造器.mp4

09-封装.mp4

10-scala的object.mp4

11-伴生类与伴生对象.mp4

12-类型判断与转换.mp4

13-集合介绍.mp4

14-不可变数组.mp4

15-可变数组.mp4

16-中午sql点评.mp4

最大连续登录天数.txt

高阶函数练习.txt

day04

01-回顾.mp4

02-不可变List.mp4

03-可变List.mp4

04-不可变Set.mp4

05-可变Set.mp4

06-元组.mp4

07-不可变Map.mp4

08-可变Map.mp4

09-不可变队列.mp4

10-可变队列.mp4

11-集合常用属性.mp4

12-衍生集合.mp4

13-初级计算函数01.mp4

14-初级计算函数02.mp4

15-map.mp4

16-foreach.mp4

17-flatten.mp4

18-flatMap.mp4

19-filter.mp4

20-groupBy.mp4

21-四个聚合函数.mp4

22-wordcount.mp4

day05

01-回顾.mp4

02-模式匹配语法.mp4

03-匹配类型.mp4

04-匹配元组.mp4

05-匹配对象和样例类.mp4

06-偏函数.mp4

07-异常处理.mp4

08-隐式转换.mp4

09-需求1.mp4

10-需求2.mp4

11-需求3步骤.mp4

12-需求3.mp4

13-出租车司机sql.mp4

14-出租车司机代码实现.mp4

14Spark

hive-on-spark.zip

Spark(1).xmind

Spark.xmind

回顾

spark-core回顾.txt

spark-sql回顾.txt

spark入门回顾.txt

图片

安装包

22尚硅谷大数据(3.9)等多个文件.zip

笔记

01_尚硅谷大数据技术之Spark入门(V4.0).docx

02_尚硅谷大数据技术之SparkCore(V4.0).docx

03_尚硅谷大数据技术之SparkSQL(V4.0).docx

04_尚硅谷大数据技术之SparkStreaming(V4.0).docx

05_尚硅谷大数据技术之Spark内核(V4.0).docx

视频

day01

01-回顾.mp4

03-hadoop与spark历史.mp4

04-MR与spark对比.mp4

05-spark内置模块与特点.mp4

06-spark运行模式介绍.mp4

07-local模式.mp4

08-集群角色介绍.mp4

09-spark-standalone安装.mp4

10-standalone模式任务提交.mp4

11-历史服务器配置.mp4

12-master高可用.mp4

13-standalone client与cluster区别.mp4

14-standalone client与cluster流程.mp4

15-yarn模式任务提交.mp4

16-yarn模式历史服务器搭建.mp4

17-yarn client与cluster区别.mp4

18-yarn client与cluster运行流程.mp4

19-端口号与模式对比.mp4

20-sparksubmit常用参数.mp4

21-用户行为轨迹sql.mp4

22-用户行为轨迹分析代码.mp4

day02

01-回顾.mp4

02-RDD是什么.mp4

03-wordcount流程.mp4

04-RDD五大特性01.mp4

05-RDD五大特性02.mp4

06-通过本地集合创建RDD.mp4

07-创建RDD其他方式.mp4

08-通过本地集合创建RDD的分区数.mp4

09-读取文件创建RDD的分区数.mp4

10-衍生出的新RDD分区数.mp4

11-集合切片规划.mp4

12-map.mp4

13-flatMap.mp4

14-filter.mp4

day03

01-回顾.mp4

02-回顾2.mp4

03-mapPartitions.mp4

04-map与mapPartitions的区别.mp4

05-mapPartitionsWithIndex.mp4

06-groupBy.mp4

07-spark shuffle说明.mp4

08-distinct.mp4

09-coalesce.mp4

10-coalesce分区合并规则.mp4

11-repartition.mp4

12-sortBy.mp4

13-交集、差集、并集.mp4

14-zip.mp4

15-partitionBy.mp4

16-自定义分区器.mp4

17-groupByKey.mp4

18-reduceByKey.mp4

19-案例.mp4

20-reduceByKey实现案例.mp4

21-reduceByKey画图说明.mp4

day04

01-回顾.mp4

02-aggregateByKey.mp4

03-sortByKey.mp4

04-mapValues.mp4

05-join.mp4

06-cogroup.mp4

07-案例.mp4

08-collect.mp4

09-count、first、take.mp4

10-takeOrdered、countByKEY、save.mp4

11-foreach.mp4

12-foreachPartition.mp4

13-序列化原因.mp4

14-设置序列化方式.mp4

15-血统.mp4

16-依赖与stage切分.mp4

17-持久化原因与缓存.mp4

day05

01-回顾.mp4

02-checkpoint.mp4

03-缓存与checkpoint的区别.mp4

04-分区器.mp4

05-累加器.mp4

06-广播变量01.mp4

07-广播变量02.mp4

08-实战-数据与需求介绍.mp4.fiq

09-方案1-sql.mp4

10-方案1-代码.mp4

11-方案2-sql.mp4

12-方案2-代码.mp4

13-方案3.mp4

day06

01-回顾.mp4

02-什么是sparksql.mp4

03-为什么要有sparksql.mp4

04-sparksql原理.mp4

05-什么是DataFrame.mp4

06-什么是DataSet.mp4

07-sparksql特点.mp4

08-创建sparksession.mp4

09-通过toDF方法创建DataFrame.mp4

10-通过读取文件和衍生创建DataFrame.mp4

11-通过createDataFrame方法创建DF.mp4

12-创建DataSet.mp4

13-命令式.mp4

14-声明式.mp4

15-三者转换.mp4

16-自定义UDF函数.mp4

17-案例.mp4

day07

01-回顾.mp4

02-弱类型自定义UDAF函数.mp4

03-强类型自定义UDAF函数.mp4

04-读取文件.mp4

05-读取mysql第一种方式.mp4

06-中午分享说明.mp4

06-中午分享说明.mp4.fiq

07-读取mysql的第二种方式.mp4

08-读取mysql第三种方式.mp4

09-保存数据到文件.mp4

10-写入数据到mysql.mp4

11-spark整合hivemp4.mp4

12-idea操作hive.mp4

13-spark提交流程.mp4

14-spark通信架构.mp4

资料

spark-core数据.zip

15离线数仓

1.笔记

尚硅谷大数据项目之电商数仓(1用户行为采集平台)V5.0.docx

尚硅谷大数据项目之电商数仓(2业务数据采集平台)V5.0.docx

尚硅谷大数据项目之电商数仓(3数仓数据同步策略)V5.0.docx

尚硅谷大数据项目之电商数仓(4电商数据仓库系统)V5.2.docx

尚硅谷大数据项目之电商数仓(5可视化报表)V5.0.docx

2.资料

1.Spark.zip

2.Hive.zip

3.Data.zip

4.DataGrip.zip

5.DolphinScheduler.zip

6.Superset.zip

3.代码

json格式.txt

业务表.xls

导入数据到HDFS步骤.txt

4.图片

数仓架构.png

5.视频

day01

01-数仓的概念.mp4

02-数仓架构.mp4

04-json格式说明.mp4

05-采集回顾-日志格式.mp4

06-采集回顾-电商业务介绍.mp4

07-业务表介绍01.mp4

08-业务表介绍02.mp4

09-数据采集-同步策略回顾.mp4

10-数据采集-业务数据格式回顾.mp4

11-业务对表数据影响大概介绍.mp4

day02

01-回顾.mp4

02-建模的意义.mp4

03-实体关系与规范化.mp4

04-三范式.mp4

05-ER模式.mp4

06-维度模型.mp4

07-事实表介绍.mp4

08-事务型事实表的设计步骤和不足.mp4

09-周期型快照事实表.mp4

10-事实类型.mp4

11-累积型快照事实表.mp4

12-事实表总结.mp4

13-维度表设计.mp4

14-规范化与反规范化.mp4

15-维度变化.mp4

day03

01-回顾.mp4

02-多值维度.mp4

03-多值属性.mp4

04-数据仓库分层规划.mp4

05-数仓构建流程.mp4

06-数据调研.mp4

07-业务调研-业务对表数据的影响.mp4

08-明确作用域.mp4

09-构建业务总线矩阵.mp4

10-指标体系.mp4

11-hive安装与乱码说明.mp4

12-hive on spark环境搭建.mp4

13-datagrip说明.mp4

14-数据的导入.mp4

day04

01-回顾.mp4

02-ODS建模逻辑1.mp4

03-hive复杂数据类型回顾.mp4

04-ODS建模逻辑2.mp4

05-ods日志建表.mp4

06-ods全量表创建.mp4

07-ods增量表创建.mp4

08-ods层日志数据加载脚本.mp4

09-ods层业务数据加载脚本.mp4

10-维度建模-维度表回顾.mp4

11-商品维度建表.mp4

12-商品维度表数据加载.mp4

day05

01-回顾.mp4

02-优惠券维度表.mp4

03-活动维度表.mp4

04-地区维度表.mp4

05-日期维度表.mp4

06-用户维度表-首日加载.mp4

07-用户维度表-每日加载第一种方案.mp4

08-用户维度表-每日加载第二种方案.mp4

09-用户维度表正则匹配手机号和邮箱.mp4

10-dim层首日数据加载脚本.mp4

11-dim层每日数据加载脚本.mp4

12-维度建模-事务型事实表回顾.mp4

13-事实表建模.mp4

14-购物车事实表-首日.mp4

15-购物车事实表-每日.mp4

day06

01-回顾.mp4

02-下单事实表-字段来源介绍.mp4

03-下单事实表-首日数据加载.mp4

04-下单事实表-数据问题.mp4

05-下单事实表-每日数据加载.mp4

06-支付成功事实表-首日数据加载.mp4

07-支付成功事实表-每日数据加载.mp4

08-购物车周期快照事实表数据加载.mp4

09-优惠券支付使用事实表-首日数据加载.mp4

10-优惠券支付使用事实表-每日数据加载.mp4

11-添加收藏事实表-数据加载.mp4

12-购物车快照事实表问题补充.mp4

day07

01-回顾.mp4

02-交易流程累积事实表-首日加载.mp4

03-交易流程累积事实-每日加载.mp4

04-页面浏览事实表-数据加载.mp4

05-用户注册事实表-首日数据加载.mp4

06-用户注册事实表-每日数据加载.mp4

07-用户登录事实表-数据加载.mp4

day08

01-回顾.mp4

02-dwd层首日数据同步脚本.mp4

03-dwd层每日数据同步脚本.mp4

04-dws建表逻辑介绍01.mp4

05-dws建表逻辑介绍02.mp4

06-DWS建表建议.mp4

07-用户商品粒度下单最近1日数据加载.mp4

08-用户商品粒度下单最近1日每日数据加载.mp4

day09

01-回顾.mp4

02-交易域用户粒度加购最近1日首日数据加载.mp4

03-交易域用户粒度加购最近1日每日数据加载.mp4

04-交易域用户粒度支付最近1日数据加载.mp4

05-交易域省份粒度下单最近1日数据加载.mp4

06-交易域用户优惠券粒度支付使用最近1日数据加载.mp4

07-互动域商品粒度收藏商品最近1日数据加载.mp4

08-流量域会话粒度页面浏览最近1日数据加载.mp4

09-流量域访客页面粒度页面浏览最近1日数据加载.mp4

10-最近1日DWS汇总表首日数据加载脚本.mp4

11-最近1日DWS汇总表每日数据加载脚本.mp4

12-中午分享.mp4

13-交易域用户商品粒度订单最近N日数据加载.mp4

14-交易域省份粒度订单最近N日数据加载.mp4

15-dws层最近N日数据加载脚本.mp4

day10

01-交易域用户粒度订单历史至今汇总表首日数据加载.mp4

02-交易域用户粒度订单历史至今汇总表每日数据加载01.mp4

03-交易域用户粒度订单历史至今汇总表每日数据加载02.mp4

04-问题说明.mp4

05-用户域用户粒度登录汇总表数据加载.mp4

06-DWS层历史至今汇总表首日数据加载脚本.mp4

07-DWS层历史至今汇总表每日数据加载脚本.mp4

08-ads建表.mp4

09-各渠道流量统计01.mp4

10-各渠道流量统计02.mp4

day11

1.数仓建模1.mp4

10.求流失用户数.mp4

11.求回流用户数.mp4

12.ads_user_retention分析.mp4

13.ads_user_retention导入.mp4

14.ads_user_stats导入.mp4

15.ads_user_action导入.mp4

16.ads_new_order_user_stats导入.mp4

17.ads_order_continuously_user_count导入方法一.mp4

18.ads_order_continuously_user_count导入方法二.mp4

19.ads_order_continuoursly_user_count导入方法三.mp4

2.数仓建模2.mp4

20.ads_order_continuoursly_user_count断一天也算连续.mp4

21.ads_order_coutinuoursly_user_count导入方法四.mp4

22.ads_order_continuoursly_user_count连续两天断一天也算连续.mp4

23.SQL的运行顺序说明.mp4

24.ads_repeat_purchase_by_tm导入.mp4

25.ads_trade_stats_by_tm导入.mp4

26.ads_trade_stats_by_cate导入.mp4

27.ads_sku_cart_num_top3_by_cate导入.mp4

28.ads_sku_favor_count_top3_by_tm导入.mp4

29.ads_order_to_pay_interval_avg导入.mp4

3.数仓建模3.mp4

30.ads_order_by_province导入.mp4

31.ads_coupon_stats导入.mp4

32.ads层脚本处理.mp4

33.脚本调试.mp4

4.数仓建模4.mp4

5.业务介绍.mp4

6.答疑.mp4

7.ads_page_path分析.mp4

8.ads_page_path导入.mp4

9.答疑一.mp4

数仓建模.txt

课堂随笔.xlsx

DolphinScheduler

1.Flow和Task.mp4

10.创建租户.mp4

11.创建用户.mp4

12.告警组.mp4

13.worker分组.mp4

14.队列管理.mp4

15.Token管理.mp4

16.使用普通用户登入.mp4

17.运行Shell命令的工作流.mp4

18.工作流和实例的关系.mp4

19.带依赖关系的flow.mp4

2.工作流调度引擎介绍.mp4

20.带依赖关系的案例演示1.mp4

21.失败策略.mp4

22.重跑和恢复失败.mp4

23.设置自动重试次数.mp4

24.禁止执行task.mp4

25.配置环境变量.mp4

26.自定义变量.mp4

27.使用系统定义的时间变量.mp4

28.定时调度.mp4

29.邮件告警.mp4

3.DS架构介绍.mp4

30.调度脚本一.mp4

31.调度脚本二.mp4

4.进程规划.mp4

5.在Mysql中建库建表.mp4

6.DS的安装.mp4

7.调节虚拟机内存.mp4

8.安装的常见问题.mp4

9.DS进程的启动和停止.mp4

随笔.txt

HiveOnSpark优化

1.购买云主机.mp4

10.Map端聚合优化GroupBy语句.mp4

11.CommonJoin.mp4

12.MapJoin.mp4

13.BucketMapJoin.mp4

14.groupBy导致的数据倾斜的解决思路.mp4

15.Join导致的数据倾斜的解决思路.mp4

16.Map输入的Task个数.mp4

17.ReduceTask数量的跳转.mp4

18.其他优化.mp4

19.省流版总结.mp4

2.集群规划概述.mp4

3.配置NodeManger提供的资源.mp4

4.配置Container提供的资源上下限.mp4

5.Executor的cores数量.mp4

6.Executor的内存配置.mp4

7.Executor个数的静态分配和动态分配.mp4

8.Driver内存配置.mp4

9.Explain的解释.mp4

省流版.md

随笔.txt

离线数仓全流程调度

1.进度统计.mp4

10.编写flow.mp4

11.每日flow制作.mp4

12.每日调度完成.mp4

13.定时调度.mp4

2.为什么需要把数据导出到Mysql.mp4

3.建库建表.mp4

4.导出之HDFSReader.mp4

5.Mysql的三种写入方式.mp4

6.导出之MysqlWriter.mp4

7.编写导出脚本.mp4

8.调度之前的准备工作.mp4

9.调度前的注意事项.mp4

dws_to_ads.sh

gen_export_config.py

gen_export_config.sh

hdfs_to_mysql.sh

mysql.sql

MysqlInsert的三种方式.txt

process_1657087754035.json

离线数仓可视化

1.SuperSet介绍.mp4

2.安装Conda.mp4

3.安装SuperSet和启动.mp4

4.对接数据源.mp4

5.地图制作.mp4

6.旭日图制作.mp4

7.桑吉图制作.mp4

8.趋势线图制作.mp4

9.看板制作.mp4

尚硅谷大数据项目之电商数仓(4可视化报表)V5.1.docx

6.回顾

16Git

Git.xmind

git仓库地址.txt

Git

1.文档

尚硅谷大数据项目之GitV3.0.docx

2.资料

Git-2.35.1.2-64-bit.exe

sz220309warehouse

sz220309warehouse.zip

视频

1.Git的由来.mp4

10.IDEA配置Git.mp4

11.IDEA创建Git仓库.mp4

12.IDEA基本操作.mp4

13.版本切换.mp4

14.IDEA版本切换.mp4

15.文件比较.mp4

16.IDEA文件比较.mp4

17.忽略文件.mp4

18.Git自检1.mp4

19.分支介绍.mp4

20.分支操作.mp4

21.分支冲突解决.mp4

22.IDEA分支操作.mp4

23.Git远超协作流程.mp4

24.配置本机到远超仓库的免密登录.mp4

25.推送本地仓库到远超.mp4

26.克隆代码到本地.mp4

28.推送到远超拒绝案例.mp4

3.配置用户信息.mp4

30.PullRequest.mp4

31.fork.mp4

32.加入团队.mp4

33.IDEA集成Gitee.mp4

34.IDEA操作Gitee.mp4

35.IDEA处理推送冲突.mp4

36.Git自检下.mp4

37.克隆指定分支更正.mp4

4.初始化Git仓库.mp4

5.Git的工作原则.mp4

6.Git初体验.mp4

7.Git又体验.mp4

8.Git再体验.mp4

9.Git还体验.mp4

Git自检.md

17Redis

redis上课笔记.txt

1.文档

尚硅谷大数据技术之RedisV4.0.docx

2.资料

redis-6.2.1.tar.gz

RedisInsight-v2-win-installer.exe

3.视频

1.NoSQL的介绍.mp4

10.库操作.mp4

11.key操作.mp4

12.string类型操作.mp4

13.list类型操作.mp4

14.set类型操作.mp4

15.hash类型的由来.mp4

16.hash类型操作.mp4

17.zset类型操作.mp4

18.思考题.mp4

19.常见配置说明.mp4

2.Nosql数据库介绍.mp4

20.RDB的备份原理介绍.mp4

21.RDB的备份策略.mp4

22.RDB的特点.mp4

23.AOF的备份原理介绍.mp4

24.AOF的备份策略.mp4

25.AOF的优缺点.mp4

26.备份的选择.mp4

27.Jedis操作.mp4

3.Redis的介绍.mp4

4.Redis的应用场景.mp4

5.Redis的安装.mp4

6.MapReduce说明.mp4

7.配置RedisServer的绑定的IP.mp4

8.启动服务端和客户端.mp4

9.停止服务端和客户端.mp4

settings.xml

省流版.md

18.ES

1.文档

尚硅谷大数据技术之ElasticSearchV2.1.docx

2.资料

elasticsearch-7.8.0-linux-x86_64.tar.gz

elasticsearch-analysis-ik-7.8.0.zip

ES练习空白.md

kibana-7.8.0-linux-x86_64.tar.gz

视频

1.关系型数据库不适合检索.mp4

10.ES的启动.mp4

11.Kibana的安装.mp4

12.ES中的数据类型.mp4

13.ES中集群状态查看命令.mp4

14.Index操作之查看.mp4

15.Index操作之手动创建.mp4

16.Index操作之CRUD.mp4

17.数据CRUD.mp4

18.切词操作.mp4

19.DSL练习之准备数据.mp4

2.检索框架介绍.mp4

20.查询的两种方式.mp4

21.DSL语法简介.mp4

22.DSL练习.mp4

23.聚合的语法格式.mp4

24.聚合练习.mp4

25.别名介绍.mp4

26.别名练习.mp4

27.模板操作.mp4

3.倒排索引.mp4

4.倒排索引工作原理.mp4

5.ES介绍.mp4

6.ES中的术语.mp4

7.REST.mp4

8.ES的安装和配置.mp4

9.Linux内核的配置.mp4

es.sh

ES练习空白.md

es随笔

19Hbase

1.文档

HBase图示.pptx

尚硅谷大数据技术之HBase(V4.2).docx

2.资料

apache-phoenix-5.0.0-HBase-2.0-bin.tar.gz

hbase-2.0.5-bin.tar.gz

rowkey设计原则案例图示.zip

Day02

1.HBase的读流程.mp4

10.删除操作.mp4

11.预分区操作.mp4

12.如何让rowkey散列.mp4

13.Rowkey设计的原则.mp4

14.Rowkey设计案例上.mp4

15.Rowkey设计案例下.mp4

16.HBase进程内存配置.mp4

17.HBase的参数配置.mp4

18.Phoenix介绍.mp4

19.Phoenix的安装.mp4

2.Region的切分策略.mp4

20.Phoenix的启动.mp4

21.Phoenix的使用.mp4

22.Phoenix的注意事项.mp4

23.Phoenix的胖客户端.mp4

24.Phoenix的瘦客户端.mp4

25.二级索引是什么.mp4

26.创建二级索引.mp4

27.复合索引和包含索引.mp4

28.本地索引和全局索引.mp4

29.省流版.mp4

3.Connection介绍.mp4

4.创建和关闭连接.mp4

5.获取Table.mp4

6.封装构造Put的方法.mp4

7.Get查询.mp4

8.Put写入.mp4

9.Scan查询.mp4

Hbase上课笔记.txt

HBase随笔.txt

rowkey设计原则案例图示

rowkey设计原则1.jpg

rowkey设计原则2.jpg

rowkey设计原则3.jpg

rowkey设计原则4.jpg

rowkey设计原则5.jpg

rowkey设计原则6.jpg

rowkey设计原则7.jpg

rowkey设计原则8.jpg

HBase

1.HBase介绍.mp4

10.hbase shell操作之namespace操作.mp4

11.hbase shell操作之table操作.mp4

12.hbase shell操作之数据的增删改查.mp4

13.HBase在HDFS上的存储结构.mp4

14.两种进程的作用.mp4

15.一些概念的解释.mp4

16.RegionServer的结构介绍.mp4

17.RegionServer的写流程.mp4

18.memstore的flush时机.mp4

19.storefile的compact.mp4

2.HBase的官方解释.mp4

3.HBase多版本的解释.mp4

4.HBase的逻辑视图.mp4

5.HBase的术语.mp4

6.卸载HBase.mp4

7.HBase的安装.mp4

8.HBase的群起和群停.mp4

9.重装HBase.mp4

hbase随笔.txt

20Spark实时项目

尚硅谷大数据项目之Spark实时项目V3.2.docx

1.课件

Spark实时项目精确一次性消费.pptx

Spark实时项目需求求解图示.pptx

尚硅谷大数据技术之SparkStreaming(V4.1).docx

尚硅谷大数据项目之Spark实时项目V3.2.docx

2.资料

2.资料.zip

视频

day01

1.SparkStreaming的介绍.mp4

10.SparkStreaming的编程一般过程.mp4

11.SparkStreaming从Kafka消费数据编程.mp4

12.KafkaTool的使用.mp4

13.重装Kafka.mp4

14.WordCount体验.mp4

15.有状态的计算.mp4

16.transform.mp4

17.window操作.mp4

18.reduceByKeyAndWindow.mp4

19.saveAsTextFiles.mp4

2.流式处理和批处理.mp4

20.foreachRDD.mp4

3.SparkStreaming的架构.mp4

4.准实时.mp4

5.Spark的优势.mp4

6.SparkStreaming的特点.mp4

7.直连模式和接收器模式.mp4

8.SparkStreaming编程的一般流程.mp4

9.构造StreamingContext.mp4

offsetexplorer_64bit.exe

随笔.txt

SparkStreaming精确一次性消费

1.SparkStreaming回顾.mp4

10.省流版上午.mp4

11.ExactlyOnce实现方式一.mp4

12.借助事务实现精确一次.mp4

13.事务输出案例建表完成.mp4

14.事务输出案例查询Mysql中的偏移量.mp4

15.事务输出案例编写输出流程.mp4

16.事务输出案例编写事务和调试.mp4

17.不同的计算场景选择不同的精确一次实现方式.mp4

18.Tuple遍历.mp4

19.ConsumerRecord的key.mp4

2.Join操作.mp4

3.消费语义.mp4

4.at most once丢数据演示.mp4

5.at least once编码.mp4

6.代码运行的位置.mp4

7.at least once保证数据不丢.mp4

8.获取偏移量的注意事项.mp4

9.提交偏移量的注意事项.mp4

SparkStreaming省流版.txt

SparkStreaming精确一次性消费省流版.md

类型提示.jpg

Spark实时项目

Day01

1.SparkStreaming项目介绍.mp4

10.KafkaProducerUtil.mp4

11.设置自动创建的topic的参数.mp4

12.log数据模拟.mp4

13.realtimesparkstreaming模块创建.mp4

14.控制抽象.mp4

15.抽取BaseApp.mp4

16.DStreamUtil.mp4

17.测试BaseApp.mp4

18.LogDiversionApp上.mp4

19.问题答疑一部署的集群地址怎么写.mp4

2.SparkStreaming架构介绍.mp4

20.问题答疑二Producer单例和非单例的区别.mp4

21.JSON数据处理案例.mp4

22.分流App完成.mp4

3.SparkStreaming项目技术介绍.mp4

4.SparkStreaming项目模块介绍.mp4

5.创建父工程引入依赖.mp4

6.创建common模块.mp4

7.common模块工具类开发任务.mp4

8.PropertiesUtil.mp4

9.RedisUtil.mp4

课堂随笔.txt

Day02

1.进度统计.mp4

10.历史批次去重.mp4

11.写入HBase.mp4

12.写入redis和测试.mp4

13.可视化hbase方案的选择.mp4

14.使用hive映射hbase.mp4

15.使用superset对接hive.mp4

16.可视化.mp4

17.Canal的介绍.mp4

18.Canal的安装和配置.mp4

19.模拟业务数据.mp4

2.LogDivesion修改.mp4

20.对业务数据库开启binlog记录.mp4

20220719_102604.mp4

20220719_103522.mp4

21.编写CanalClient拉取数据.mp4

22.解析Message.mp4

3.DAU需求介绍.mp4

4.DAU计算思路.mp4

5.封装StartLog.mp4

6.封装日期格式化工具类.mp4

7.封装StartLog下.mp4

8.同批次去重.mp4

9.Redis中K-V的设计.mp4

[feiq]2.LogDivesion修改.mp4

可视化hbase随笔.txt

Day03

1.进度统计.mp4

10.预警需求之生成预警日志.mp4

11.预警需求之写入ES.mp4

12.预警需求测试.mp4

13.预警需求可视化之创建索引模式.mp4

14.预警需求可视化之可视化.mp4

15.几个问题的解释.mp4

16.预警需求数据漂移问题解决思路.mp4

2.GMV需求之建表.mp4

3.GMV之创建JDBCUtil.mp4

4.GMV之封装Bean.mp4

5.GMV之计算GMV.mp4

6.GMV之测试.mp4

7.GMV之可视化.mp4

8.预警需求之介绍.mp4

9.预警需求之过滤得到预警的设备.mp4

Day04

1.购物明细需求讲解.mp4

10.购物明细之关联维度.mp4

11.购物明细之写入ES.mp4

12.购物明细之面板创建.mp4

17.设置缓存中数据的过期时间.mp4

2.购物明细之采集数据.mp4

20220722_102855.mp4

3.购物明细之事实表Join.mp4

4.购物明细之模拟网络延迟数据关联不上.mp4

5.购物明细之无法Join的原因.mp4

6.购物明细之无法Join的解决办法.mp4

7.购物明细之如何缓存数据.mp4

8.购物明细之处理OrderInfo.mp4

21项目实战

在线教育日志及原始表结构说明文档.docx

在线教育离线数仓任务书.docx

大数据设计方案V1.0(1).docx

购买阿里云.mp4

00、无视频自己实现

220309

在线教育参考资料

5个节点电商数仓(1用户行为采集平台).docx

5台节点电商数仓(2业务数据采集平台).docx

5台节点电商数仓(3电商数据仓库系统).docx

8个节点电商数仓(1用户行为采集平台).docx

8台节点电商数仓(2业务数据采集平台).docx

8台节点电商数仓(3电商数据仓库系统).docx

大数据设计方案V1.0.docx

尚硅谷大数据之数仓流程规范.docx

尚硅谷大数据文档格式模板.docx

时间安排规划图.jpg

数据生成器data_mocker

application.yml

application.yml.bak

edu0222.sql

edu2021-mock-2022-06-14.jar

logback.xml

path.json

文档

在线教育日志及原始表结构说明文档.docx

在线教育离线数仓任务书.docx

22Flink

flink.xmind

0309Flink优化

1.笔记

尚硅谷大数据技术之Flink优化_V2.0.docx

2.资料

Flink命令说明.txt

gcviewer-1.36.jar

3.代码

flink-tuning.zip

4.视频

1.文档

01_尚硅谷大数据之Flink.docx

2.数据

2.数据.zip

3.安装包

Another-Redis-Desktop-Manager.1.4.9.exe

flink-1.13.0-bin-scala_2.12.tgz

flink-1.13.0-src.tgz

netcat-win32-1.12.zip

4.代码

4.代码.zip

5.视频

day01

day01笔记.txt

Flink - 01.起源及简介.mp4

Flink - 02.Flink的应用场景.mp4

Flink - 03.有界无界数据、流处理批处理概念辨析.mp4

Flink - 04.flink典型应用场景.mp4

Flink - 05.flink与spark的对比.mp4

Flink - 06.第一个Flink代码-批处理执行wordcount.mp4

Flink - 07.使用流处理方式处理有界流数据.mp4

Flink - 08.使用流处理方式处理无界流数据.mp4

Flink - 09.mp4

Flink - 09.windows下使用nc的简单说明.mp4

Flink - 10.local-cluster模式.mp4

Flink - 11.Standalone下的会话模式部署.mp4

Flink - 12.flink作业的两种提交方式.mp4

Flink - 13.按资源占用区分的三种flink部署模式.mp4

Flink - 14.Yarn资源调度框架下的会话模式.mp4

Flink - 15.Yarn调度框架下的单作业模式.mp4

Flink - 16.Yarn框架下的应用模式.mp4

Flink - 17.部署模式的简单总结.mp4

Flink - 18.Standalone下的高可用设置.mp4

Flink - 19.Yarn模式下的高可用设置.mp4

Flink - 20.lambda表达式的写法.mp4

day02

Flink - 21.昨日知识点回顾.mp4

Flink - 22.运行时架构简介(1).mp4

Flink - 23.JobManager及角色介绍.mp4

Flink - 24.TaskManager介绍.mp4

Flink - 25.作业提交流程详解.mp4

Flink - 26.Yarn模式下作业提交流程详解.mp4

Flink - 27.数据流图.mp4

Flink - 28.程序最大并行度.mp4

Flink - 29.并行度设置的4种方法以及优先级别.mp4

Flink - 30.算子链与合并算子链.mp4

Flink - 31.断开禁用算子链(了解).mp4

Flink - 32.Flink中的作业图与执行图.mp4

Flink - 33.任务插槽与任务插槽的共享机制.mp4

Flink - 34.任务插槽与最大并行度的关系.mp4

Flink - 35.创建执行环境.mp4

Flink - 37.从HDFS读取数据.mp4

Flink - 38.从kafka读取数据.mp4

Flink - 39.自定义数据源.mp4

Flink - 40.Flink支持数据类型及泛型擦除.mp4

Flink - 41.一些问题答疑及map算子.mp4

Flink - 42.filter算子.mp4

Flink - 43.flatmap算子.mp4

Flink - 44.keyby算子.mp4

Flink - 45.keyBy源码分析.mp4

Flink - 46.sum和min聚合函数.mp4

Flink - 47.reduce聚合函数.mp4

keyBy源码分析.txt

day03

01_前面内容回顾.mp4

02_shuffle算子.mp4

03_其他重新分区的算子.mp4

04_不存在的split.mp4

05_connect算子.mp4

06_Union算子.mp4

07_idea的几个配置.mp4

08_Process_NoKey.mp4

09_Process_KeyBy.mp4

10_Rich函数的使用.mp4

11_Kafka_Sink.mp4

12_Redis_sink_string.mp4

13_Reids_sink_list.mp4

14_Redis_sink_set.mp4

15_Redis_sink_hash.mp4

16_有界流数据写入到es中.mp4

17_无界流数据写入到es中.mp4

18_自定义MysqlSink.mp4

19_jdbcSink.mp4

20_执行模式.mp4

day04

01_昨日内容回顾.mp4

02_PV的计算.mp4

03_PV的计算_2.mp4

04_UV的计算.mp4

05_app的市场行为统计.mp4

06_类似的计算_省略.mp4

07_对账功能实现分析.mp4

08_对账功能的具体实现.mp4

09_flink中窗口的理解.mp4

10-基于时间的三种窗口理解.mp4

11_基于时间的滚动窗口.mp4

12_基于时间的滑动窗口.mp4

13_基于时间的会话窗口.mp4

14_基于个数的滚动窗口.mp4

15_基于个数的滑动窗口.mp4

16_增量聚合_Reduce.mp4

17_增量聚合_Aggregate.mp4

18_处理函数的总结.mp4

19_没有keyBy的窗口.mp4

20_窗口旧的写法.mp4

day05

01_昨日内容回顾.mp4

02_事件时间的概念.mp4

03_水印的概念.mp4

04_水印的理解_1.mp4

05_水印的生产机制.mp4

06_水印的生产机制代码理解.mp4

07_迟到数据无法进入窗口.mp4

08_水印生成的源码.mp4

09_自定义水印.mp4

10_多并行度下水印的传递问题.mp4

11_数据倾斜导致的水印不更新_1.mp4

12)数据倾斜导致的水印不更新_2.mp4

13_允许迟到.mp4

14_侧输出流的第一个作用_装载迟到数据.mp4

15_侧输出流的第二个作用_数据的分流.mp4

16_八个process函数.mp4

17_基于处理时间的定时器.mp4

18_基于事件时间的定时器.mp4

19_定时器的练习.mp4

day06

01_昨日内容回顾.mp4

02_状态的概念.mp4

03_Flink状态的分类.mp4

04_Flink的管理状态的分类.mp4

05_算子状态的分类.mp4

06_算子状态_列表状态.mp4

07_KafkaConsume使用联合列表.mp4

07_监控状态的理解.mp4

08_算子状态_广播状态.mp4

08_键控状态_Value.mp4

09_键控状态_List.mp4

10_键控状态_Reduce.mp4

11_键控状态_Aggregate_1.mp4

12_键控状态_Aggregate_2.mp4

13_键控状态_Map.mp4

14_状态后端在1,13之后的分类.mp4

14_状态后端在1.13之前的分类.mp4

15_配置文件中设置状态后端.mp4

16_状态后端在代码中设置.mp4

day07

01_昨日内容回顾.mp4

02_状态的一致性.mp4

03_ckeckpoint的制作过程.mp4

04_barrier的对齐和不对齐.mp4

05_端端端的严格一次.mp4

06_端到端严格一次代码.mp4

07_端到端严格一次验证_1.mp4

08_消费者的隔离级别.mp4

09_从checkpoint恢复状态.mp4

10_savepoint.mp4

11_pv_1.mp4

12_pv_2.mp4

13_UV.mp4

14_热门商品TopN实现思路.mp4

15_TopN的计算具体实现.mp4

16_热门页面练习.mp4

未命名绘图.drawio

day08

01_昨日内容回顾.mp4

02_广告点击统计.mp4

03_恶意登录.mp4

04_订单实时监控.mp4

05_CEP介绍.mp4

06_CEP基本使用.mp4

07_模式循环性.mp4

08_条件.mp4

09_组合模式.mp4

10_循环模式的连续性.mp4

11_模式的可选性.mp4

12_模式组.mp4

13_WithIn.mp4

14_FlatSelect.mp4

未命名绘图.drawio

day09

01_昨日内容回顾.mp4

02_恶意登录.mp4

03_订单实时监控.mp4

04_flink_sql核心概念_动态表和连续查询.mp4

05_flink_table_api基本使用.mp4

06_flink_table_api基本使用_2.mp4

07_table_api读写文件.mp4

08_table_api读写kafka.mp4

09_使用sql语句查询表.mp4

10_使用sql读写文件.mp4

11_使用sql读写Kafka.mp4

12_upsert_kafka.mp4

13_在表中添加处理时间字段.mp4

14_流转成表的时候添加事件时间.mp4

15_在ddl中添加事件时间.mp4

未命名绘图.drawio

清除maven仓库.bat

day10

01_昨日内容回顾.mp4

02_table_api中使用分组窗口.mp4

03_在sql中使用分组窗口.mp4

04_TVF的介绍.mp4

05_tvf中的滚动和滑动.mp4

06_tvf中的累积窗口.mp4

07_tvf用在分组集中.mp4

08_table_Api中使用over窗口.mp4

09_sql中使用over窗口.mp4

10_读写hive.mp4

11_自定义函数介绍.mp4

12_自定义函数_scalar.mp4

12_自定义函数_Table_1.mp4

13_自定义汉是_Table_2.mp4

14_自定义函数_Aggregate.mp4

15_自定义函数_TableAggregate.mp4

正则表达式.mp4

day11

01_昨日内容回顾.mp4

02_窗口的划分.mp4

03_flink的sql客户端.mp4

04_TopN实现思路.mp4

04_窗口的划分.mp4

05_topN的计算.mp4

06_双流join_窗口join.mp4

07_双流join_interval.mp4

08_海量数据去重_1.mp4

09_布隆过滤器.mp4

10_布隆过滤器的使用.mp4

23Docker

docker.rar

视频

01_docker的简介.mp4

02_docker的三个基本概念.mp4

03_docker的安装.mp4

04_docker的安装.mp4

05_安装docjker的要求.mp4

06_镜像的基本操作.mp4

07_容器的基本操作.mp4

08_制作支持java开发的镜像.mp4

09_制作支持ssh连接的镜像.mp4

10_端口映射(1).mp4

10_端口映射.mp4

11_教学环境网络拓扑.mp4

12_注意事项.mp4

13_大数据集群构建脚本_1.mp4

14_容器的启动脚本.mp4

15_集群的使用演示.mp4

24实时数仓

24实时数仓.zip

视频

day01

01_课程文档介绍.mp4

02_数仓的概述.mp4

03_数仓建模理论回顾.mp4

04_数仓的设计.mp4

05_数仓的分层理论.mp4

06_日志数据采集.mp4

07_业务数据的采集.mp4

08_维度层的实现思路.mp4

09_idea中搭建flink开发环境.mp4

10_消费kafka_ods_db数据.mp4

11_封装能够消费topic的基类.mp4

12_数据的清洗_1.mp4

13_数据的清洗_2_解决bootstrap数据同步问题.mp4

数仓分层

day02

01_昨日内容回顾.mp4

02_初始化维度表的配置表.mp4

03_Flink_cdc的介绍.mp4

04_Flink_cdc的基本使用.mp4

05_Flink_cdc读取配置信息.mp4

06_Phoenix中建表_1.mp4

07_Phoenix中建表_2.mp4

08_Phoenix中建表_3_盐表.mp4

09_把数据信息和配置新发送到下游流中.mp4

10_过滤掉不需要的列.mp4

11_自定义Phoenix_sink_1.mp4

12_自定义Phoenix_sink_2.mp4

13_打包到linux执行.mp4

数仓分层

未命名绘图.drawio

day03

01_昨日内容回顾(2).mp4

02_未经加工的事务事实表需求分析.mp4

03_消费ods_log数据.mp4

04_一些问题.mp4

05_对日志数据做过滤.mp4

06_纠正新老客户.mp4

07_日志分流.mp4

08_分流后的数据写入到kafka中.mp4

09_打包到linux执行.mp4

10_UV明细的实现思路.mp4

11_UV详情的实现.mp4

12_打包到linux执行.mp4

day04

01_昨日内容回顾.mp4

02_跳出明细的实现思路.mp4

03_跳出明细的第一种解法.mp4

04_跳出明细的第二种解法.mp4

05_常规join_内连接.mp4

06_常规join_左连接.mp4

07_使用sql的方式消费left_join’数据.mp4

08_使用流的方式消费left_join数据.mp4

09_sql中的Interval_join.mp4

10_时态join.mp4

11_lookup_join.mp4

12_封装sql的baseapp.mp4

13_读取ods_db数据.mp4

14_加购表和字典表的join.mp4

15_加购明细表写入到Kafka中.mp4

day05

01_昨日内容回顾.mp4

02_交易域预处理表实现思路.mp4

03_过滤订单详情表数据.mp4

04_过滤订单表.mp4

05_过滤活动和优惠券表.mp4

day06

01_退单事务事实表实现思路.mp4

02_退单事务事实表.mp4

03_退款成功事务事实表.mp4

04_退款成功事务事实表实现.mp4

05_dwd层其他事务事实表.mp4

day07

01_dws层存储介质的选择.mp4

02_doris的简介.mp4

03_doris的架构.mp4

04_fe的安装和配置.mp4

05_be的安装和配置_1.mp4

05_be的安装和配置_2.mp4

06_用idea去连接fe.mp4

07_fe的扩容.mp4

08_be的扩容.mp4

09_数据划分中的几个基本概念.mp4

10_数据模型中的聚合模型.mp4

11_数据模型中的unique和duplicate.mp4

12_一键安装配置启动.mp4

13_引擎和Range分区.mp4

14_List分区.mp4

15_其他属性.mp4

15_分桶.mp4

day08

01_昨日内容回顾.mp4

02_Aggregate中的rollup.mp4

03_duplicate中的rollup.mp4

04_rollup的注意事项.mp4

05_物化视图.mp4

06_flink流的方式读写doris_1.mp4

07_flink流的方式写入json格式.mp4

08_flink流的方式写入RowData格式.mp4

09_flink流的方式写入POJO格式.mp4

10_关键词粒度统计窗口汇总表需求分析.mp4

11_消费流量域的页面日志.mp4

12_过滤出搜索记录.mp4

13_自定义分词函数_1.mp4

14_自定义分词函数_2.mp4

15_开窗聚合.mp4

16_最终结果写出到doris中.mp4

17_doris的时区问题.mp4

day09

01_昨日碰到的问题.mp4

02_版本渠道访客类型统计指标实现思路.mp4

03_封装可以消费多个topic的baseapp.mp4

04_解析各个流并union成一个流.mp4

05_开窗聚合.mp4

06_解决uv迟到问题.mp4

07_数据写出到doris中.mp4

08_主页和详情页独立访客_封装到bean中.mp4

09_开窗聚合.mp4

10_主页和详情独立访客数据写出到doris中.mp4

day10

01_昨日碰到的问题.mp4

02_昨日内容回顾.mp4

03_用户登录窗口需求分析.mp4

04_过滤所有登录记录.mp4

05_找到当日独立用户和7日回流用户.mp4

06_开窗聚合最后结果写出到Doris中.mp4

07_注册用户各窗口统计.mp4

08_加购独立用户数各窗口统计.mp4

09_支付成功各窗口统计实现思路.mp4

10_支付成功各窗口统计具体实现.mp4

11_数据去重的3中思路.mp4

12_补充维度的思路.mp4

13_按照订单详情id去重.mp4

14_数据封装到pojo中.mp4

15_针对sku_id进行分组开窗聚合.mp4

day11

01_昨日内容回顾.mp4

02_封装查询维度的工具类.mp4

03_工具类的测试.mp4

04_补齐所有维度信息.mp4

05_缓存优化之缓存选择.mp4

06_封装redis工具类型.mp4

07_封装DimUtil工具类_1.mp4

08_redis中数据结构的选择.mp4

09_封装DimUtil工具类型_2.mp4

10_测试缓存.mp4

11_更新缓存.mp4

12_异步优化_1.mp4

13_异步的具体实现.mp4

14_异步常见的问题.mp4

15_数据写出到doris中.mp4

16_省份粒度各窗口统计.mp4

day12

01_ads和可视化的介绍.mp4

02_sugar使用介绍.mp4

03_spring_boot项目的搭建.mp4

04_总的销售额.mp4

05_项目穿透.mp4

06_柱状图.mp4

07_饼图.mp4

08_折线图.mp4

09_字符云.mp4

10_分享.mp4

wyc.zip

25Cdh

01.尚硅谷大数据技术之CDH6.3.2安装(基于阿里云)-v1.5.docx

04.CDH6.3.2安装包

cdh6.3.2[1.93G]

CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel

CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha1

CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha256

manifest.json

cm6.3.1[1.31G]

allkeys.asc

cloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpm

cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpm

cloudera-manager-server-6.3.1-1466458.el7.x86_64.rpm

cloudera-manager-server-db-2-6.3.1-1466458.el7.x86_64.rpm

enterprise-debuginfo-6.3.1-1466458.el7.x86_64.rpm

oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm

视频

03.CDH安装-环境准备2.mp4

04.CDH安装-依赖组件安装.mp4

05.CDH安装-启动server.mp4

06.CDH安装-启动server并部署集群.mp4

07.CDH安装-webui页面简介.mp4

08.CDH安装-配置集群.mp4

(无声音)云服务器购买与配置 01.mp4

(无声音)云服务器购买与配置 02.mp4

26实时实战

在线教育实时数仓任务书.docx

00、无视频自己实现

代码

文档

在线教育日志及原始表结构说明文档.docx

在线教育离线数仓任务书.docx

27Flink 优化

1.笔记

尚硅谷大数据技术之Flink优化_V2.0.docx

2.资料

Flink命令说明.txt

gcviewer-1.36.jar

3.代码

flink-tuning.zip

4.视频

0309Flink调优笔记.txt

checkpoint

TM内存模型

day01

01_课程介绍.mp4

02-资源调优-并行度的考虑.mp4

03-资源调优-TM的slot数考虑.mp4

04-资源调优-内存模型&内存考虑.mp4

05-资源调优-合理利用cpu.mp4

06-执行参数-watermark乱序程度.mp4

07-checkpoint-原理详解&总结.mp4

08-checkpoint-对齐&非对齐检查点.mp4

09-checkpoint-参数设置说明.mp4

10-checkpoint-答疑.mp4

11-上午回顾.mp4

12-checkpoint-怎么看ui.mp4

13-大状态调优-大状态的问题.mp4

14-大状态调优-状态后端回顾&checkpoint路径.mp4

15-大状态调优-rocksdb调优项.mp4

16-大状态调优-rocksdb调优演示.mp4

17-大状态调优-调优效果.mp4

18-Job调优-不使用uid更新代码的问题.mp4

19-Job调优-使用uid成功更新的演示.mp4

20-Job调优-链路延迟&对象重用.mp4

21-Job调优-细粒度滑动窗口问题.mp4

day02

00_课程回顾.mp4

01-checkpoint参数-触发周期演示.mp4

02-反压-原理的理解.mp4

03-反压-缓冲区.mp4

04-反压-现象及危害.mp4

05-反压-定位瓶颈节点.mp4

06-反压-常见原因.mp4

07-反压-分析方法.mp4

08-反压-项目出现反压的场景.mp4

09-数据倾斜-现象&原因.mp4

10-数据倾斜-数据源倾斜.mp4

11-数据倾斜-单表分组聚合(纯流式)倾斜.mp4

12-数据倾斜-单表分组聚合(开窗)倾斜.mp4

13-数据倾斜-项目中的倾斜.mp4

14-数据倾斜-扩展-key分布不均.mp4

15-扩展-keyby底层实现.mp4

16-FlinkSQL优化-minibatch&localglobal.mp4

17-FlinkSQL优化-精确去重倾斜&Filter语法.mp4

18-Flink与Kafka的生产经验.mp4

28面试大保健

28面试大保健.zip

29其它面试

309面试

简历第一节.mp4

简历第三节.mp4

简历第二节.mp4

简历第五节.mp4

简历第六节.mp4

简历第四节.mp4

Hal题打包

22尚硅谷大数据(3.9)等多个文件

Hql题打包

hive阶段的hql

手写HQL题目.docx

海哥HQL

尚硅谷大数据SQL题库 - 答案解析.docx

尚硅谷大数据SQL题库.docx

尚硅谷大数据之HiveSQL基础练习题-参考答案.docx

尚硅谷大数据之HiveSQL基础练习题.docx

端午给的hql

hivesql50道sql.txt

尚硅谷大数据SQL题库 - 中级45道(答案解析).docx

尚硅谷大数据SQL题库 - 初级50道(答案解析).docx

尚硅谷大数据SQL题库 - 高级58道(答案解析).docx

毕业2月班面试大保健

(修订版)狂野大数据-高薪面试宝典详细版_V10.0-V4.pdf

尚硅谷大数据技术之高频面试题8.0.15.docx

尚硅谷大数据技术之高频面试题8.0.6.docx

深圳校区大数据技术之企业真题V1.1.0.doc

海哥串讲

海哥串讲

01_面试大保健_linux_shell.mp4

02_面试大保健_hdfs .mp4

03_面试大保健_shuffle.mp4

04_面试大保健_yarn工作机制.mp4

05_面试大保健_yarn调度器.mp4

06_面试大保健_flume.mp4

07_面试大保健_kafka.mp4

08_面试大保健_hive.mp4

shuffle.png

yarn工作机制.png

尚硅谷大数据SQL题库 - 答案解析.docx

尚硅谷大数据SQL题库.docx

尚硅谷大数据之HiveSQL基础练习题-参考答案.docx

尚硅谷大数据之HiveSQL基础练习题.docx

面试大保健.txt

辅导老师,面试大礼包

02_1某985应届学生毕业45万年薪复习笔记.zip

02_2_某二本非计算机专业16年毕业,50万年薪大佬学习总结.zip

30 附送项目

103_尚硅谷大数据项目之用户画像2.0

画像物料

spark远程提交器.zip

平台数据库脚本.zip

新代码生成器.zip

机器学习模拟数据.zip

视频

clickhouse

1

10、 一些sql说明和导出数据.mp4

11、改表结构.mp4

12、高可用副本.mp4

13、分片集群介绍.mp4

1、clickhouse介绍.mp4

2、clickhouse的特点.mp4

3、clickhouse的安装启动.mp4

4、常用数据类型.mp4

5、常用数据类型.mp4

6、跳数索引.mp4

7、数据过期.mp4

8、replacingmergetree.mp4

9、summingMt.mp4

新建文件夹

2

2、分片副本不同机器问题.mp4

3、追查启动错误.mp4

4、分片的配置.mp4

5、clickhouse分布式表.mp4

6、改为单点.mp4

7、关于扩容balance的问题.mp4

画像

1

10、开发通用sql模块.wmv

1、画像简介.wmv

2、标签管理.wmv

3、画像平台的架构.wmv

4、演示系统.wmv

5、搭建平台.wmv

6、标签的录入.wmv

7、标签任务录入.wmv

8、任务流程.wmv

9、动态建表.wmv

9、搭建任务工程.wmv

2

10、连续值标签.wmv

11、宽表组合思路.wmv

12、代码读取定义建表.wmv

13、pivot介绍.wmv

14、pivot应用到需求.wmv

15、本地执行.wmv

16、发布运行.wmv

17、关于spark环境变量的问题.wmv

1、画像梳理.wmv

2、sql拼接完成.wmv

3、spark环境补充.wmv

4、本地调试.wmv

5、关于80端口占用的问题.wmv

6、打包.wmv

7、jar包上传.wmv

8、远程提交器.wmv

9、尝试调度运行.wmv

3

1、任务三导入clickhouse、建表.wmv

2、建表执行部分.wmv

3、导入数据完成.wmv

4、打包运行发布.wmv

5、作业.wmv

4

10、分群介绍.wmv

11、web开发介绍.wmv

12、springboot的helloworld.wmv

13、springboot接收参数.wmv

1、回顾.wmv

2、起因.wmv

3、bitmap介绍.wmv

4、bitmap与条件筛选.wmv

5、bitmap表的写入.wmv

6、bitmap查询.wmv

7、工程搭建.wmv

8、代码组合sql语句.wmv

9、运行调试代码.wmv

5

10、组合查询sql完整.wmv

11、写入clickhouse人群包.wmv

1、controller层.wmv

2、service层.wmv

3、mapper层.wmv

4、mybatis-plus.wmv

5、分群思路.wmv

6、controller.wmv

7、写入分群基本信息.wmv

8、bitmap查询sql.wmv

9、组合查询sql.wmv

6

10、关于误判.wmv

11、决策树特征权重准确率的打印.wmv

12、关于评估.wmv

13、生成新数据.wmv

1、挖掘与机器学习.wmv

2、机器学习的过程.wmv

3、决策树介绍.wmv

4、机器学习开发调度流程(重要).wmv

5、构建流水线label.wmv

6、构建流水线完成.wmv

7、实现训练过程.wmv

8、实现训练过程代码完成.wmv

9、观察预测结果.wmv

7

10、定义标签.wmv

11、预测阶段代码.wmv

12、完成标签的写入.wmv

13、添加挖掘标签任务.wmv

1、回顾.wmv

2、拟合与剪枝.wmv

3、挖掘标签开发流程.wmv

4、特征选取.wmv

5、特征提取sql1.wmv

6、特征提取sql2.wmv

7、特征提取sql3_加上label.wmv

8、模型训练代码.wmv

9、训练阶段完成.wmv

8

10、总结redis.wmv

11、总结web.wmv

12、总结机器学习.wmv

13、总结机器扩展.wmv

1、分群作业待办.wmv

2、储存入redis.wmv

3、储存入redis调试.wmv

4、更新人数1.wmv

5、预估人数.wmv

6、更新人群包.wmv

8、总结上.wmv

9、总结ck.wmv

课件

课件.zip

软件

clickhouse-client-21.4.6.55-2.noarch.rpm

clickhouse-common-static-21.4.6.55-2.x86_64.rpm

clickhouse-common-static-dbg-21.4.6.55-2.x86_64.rpm

clickhouse-server-21.4.6.55-2.noarch.rpm

Git-2.23.0-64-bit.exe

redis-6.0.8.tar.gz

Mindjet_MindManager_2016_Trial_64_破解版

Mindjet_MindManager_2016_Trial_64.exe

MindManager.exe.baiduyun.p.downloading

微软常用运行库合集 64位_2017.03.11(1).exe

验证码—必看.txt

104_尚硅谷大数据技术之机器学习和推荐系统

1.笔记

1.笔记.zip

2.资料

2.资料.zip

3.代码

01_算法代码_JupyterNotebook.zip

02_项目代码_MovieRecommendSystem.zip

4.视频

000_尚硅谷_机器学习和推荐系统_课程简介.wmv

II_电影推荐项目

037_尚硅谷_电影推荐系统_项目系统设计(上).wmv

038_尚硅谷_电影推荐系统_项目系统设计(中).wmv

039_尚硅谷_电影推荐系统_项目系统设计(下).wmv

040_尚硅谷_电影推荐系统_项目框架搭建.wmv

041_尚硅谷_电影推荐系统_数据加载模块(一).wmv

042_尚硅谷_电影推荐系统_数据加载模块(二).wmv

043_尚硅谷_电影推荐系统_数据加载模块(三).wmv

044_尚硅谷_电影推荐系统_数据加载模块(四).wmv

045_尚硅谷_电影推荐系统_数据加载模块(五).wmv

046_尚硅谷_电影推荐系统_统计推荐模块(上).wmv

047_尚硅谷_电影推荐系统_统计推荐模块(中).wmv

048_尚硅谷_电影推荐系统_统计推荐模块(下).wmv

049_尚硅谷_电影推荐系统_基于LFM的离线推荐模块(上).wmv

050_尚硅谷_电影推荐系统_基于LFM的离线推荐模块(中).wmv

051_尚硅谷_电影推荐系统_基于LFM的离线推荐模块(下).wmv

052_尚硅谷_电影推荐系统_ALS模型评估和参数选取(上).wmv

053_尚硅谷_电影推荐系统_ALS模型评估和参数选取(下).wmv

054_尚硅谷_电影推荐系统_实时推荐模块(一).wmv

055_尚硅谷_电影推荐系统_实时推荐模块(二).wmv

056_尚硅谷_电影推荐系统_实时推荐模块(三).wmv

057_尚硅谷_电影推荐系统_实时推荐模块(四).wmv

058_尚硅谷_电影推荐系统_实时推荐模块(五).wmv

059_尚硅谷_电影推荐系统_实时推荐模块测试.wmv

060_尚硅谷_电影推荐系统_基于内容推荐模块(一).wmv

061_尚硅谷_电影推荐系统_基于内容推荐模块(二).wmv

062_尚硅谷_电影推荐系统_基于内容推荐模块(三).wmv

063_尚硅谷_电影推荐系统_基于内容推荐模块(四).wmv

064_尚硅谷_电影推荐系统_实时系统联调测试(上).wmv

065_尚硅谷_电影推荐系统_实时系统联调测试(下).wmv

I_理论

001_尚硅谷_推荐系统简介_概述.mp4

002_尚硅谷_推荐系统简介_推荐系统算法简介.mp4

003_尚硅谷_推荐系统简介_推荐系统评测.mp4

004_尚硅谷_机器学习入门_数学基础(上).mp4

005_尚硅谷_机器学习入门_数学基础(下).mp4

006_尚硅谷_机器学习入门_机器学习概述.mp4

007_尚硅谷_机器学习入门_监督学习(上).mp4

008_尚硅谷_机器学习入门_监督学习(中).mp4

009_尚硅谷_机器学习入门_监督学习(下).mp4

010_尚硅谷_机器学习模型和算法_python简介.mp4

011_尚硅谷_机器学习模型和算法_python基础语法(上).mp4

012_尚硅谷_机器学习模型和算法_python基础语法(下).mp4

013_尚硅谷_机器学习模型和算法_线性回归(上).mp4

014_尚硅谷_机器学习模型和算法_线性回归最小二乘代码实现(上).mp4

015_尚硅谷_机器学习模型和算法_线性回归最小二乘代码实现(下).mp4

016_尚硅谷_机器学习模型和算法_线性回归(下).mp4

017_尚硅谷_机器学习模型和算法_线性回归梯度下降代码实现.mp4

018_尚硅谷_机器学习模型和算法_线性回归调用sklearn库代码实现.mp4

019_尚硅谷_机器学习模型和算法_K近邻.mp4

020_尚硅谷_机器学习模型和算法_K近邻代码实现(上).mp4

021_尚硅谷_机器学习模型和算法_K近邻代码实现(中)(1).mp4

021_尚硅谷_机器学习模型和算法_K近邻代码实现(中).mp4

022_尚硅谷_机器学习模型和算法_K近邻代码实现(下).mp4

023_尚硅谷_机器学习模型和算法_逻辑回归(上).mp4

024_尚硅谷_机器学习模型和算法_逻辑回归(下).mp4

025_尚硅谷_机器学习模型和算法_决策树.mp4

026_尚硅谷_机器学习模型和算法_K均值聚类.mp4

027_尚硅谷_机器学习模型和算法_K均值聚类代码实现(上).mp4

028_尚硅谷_机器学习模型和算法_K均值聚类代码实现(下).mp4

029_尚硅谷_推荐系统_推荐系统算法详解(一).mp4

030_尚硅谷_推荐系统_推荐系统算法详解(二).mp4

031_尚硅谷_推荐系统_推荐系统算法详解(三).mp4

032_尚硅谷_推荐系统_TF-IDF算法代码示例.mp4

033_尚硅谷_推荐系统_推荐系统算法详解(四).mp4

034_尚硅谷_推荐系统_推荐系统算法详解(五).mp4

035_尚硅谷_推荐系统_LFM梯度下降算法代码实现(上).mp4

036_尚硅谷_推荐系统_LFM梯度下降算法代码实现(下).mp4

105_尚硅谷大数据项目之电商推荐系统

1.笔记.zip

2.资料.zip

3.代码.zip

4.视频

01_尚硅谷_电商推荐系统_课程简介.mp4

02_尚硅谷_电商推荐系统_项目系统设计(上).mp4

03_尚硅谷_电商推荐系统_项目系统设计(中).mp4

04_尚硅谷_电商推荐系统_项目系统设计(下).mp4

05_尚硅谷_电商推荐系统_项目框架搭建.mp4

06_尚硅谷_电商推荐系统_数据加载模块(上).mp4

07_尚硅谷_电商推荐系统_数据加载模块(中).mp4

08_尚硅谷_电商推荐系统_数据加载模块(下).mp4

09_尚硅谷_电商推荐系统_统计推荐模块(上).mp4

10_尚硅谷_电商推荐系统_统计推荐模块(下).mp4

11_尚硅谷_电商推荐系统_基于LFM的离线推荐模块(上).mp4

12_尚硅谷_电商推荐系统_基于LFM的离线推荐模块(中).mp4

13_尚硅谷_电商推荐系统_基于LFM的离线推荐模块(下).mp4

14_尚硅谷_电商推荐系统_ALS模型评估和参数选择(上).mp4

15_尚硅谷_电商推荐系统_ALS模型评估和参数选取(下).mp4

16_尚硅谷_电商推荐系统_实时推荐模块(一).mp4

17_尚硅谷_电商推荐系统_实时推荐模块(二).mp4

18_尚硅谷_电商推荐系统_实时推荐模块(三).mp4

19_尚硅谷_电商推荐系统_实时推荐模块(四).mp4

20_尚硅谷_电商推荐系统_实时推荐模块(五).mp4

21_尚硅谷_电商推荐系统_实时推荐模块(六).mp4

22_尚硅谷_电商推荐系统_实时推荐模块测试.mp4

23_尚硅谷_电商推荐系统_实时系统联调(上).mp4

24_尚硅谷_电商推荐系统_实时系统联调(下).mp4

25_尚硅谷_电商推荐系统_基于内容的离线推荐模块(上).mp4

26_尚硅谷_电商推荐系统_基于内容的离线推荐模块(下).mp4

27_尚硅谷_电商推荐系统_基于ItemCF的离线推荐(上).mp4

28_尚硅谷_电商推荐系统_基于ItemCF的离线推荐(下).mp4

29_尚硅谷_电商推荐系统_项目总结和部署.mp4

Similar Posts

发表评论

邮箱地址不会被公开。 必填项已用*标注