尚硅谷大数据大神班课程内容无缝对接企业需求,对标BAT等大厂。本课程分5个阶段:
阶段一:JavaSE基础核心:本阶段除了JavaSE中要求大家必会的常见知识外,重点加强了数据结构思想、集合源码分析,逐步培养大家深入学习的能力,此外为大数据框架学习打好基础,加强对SQL的讲解,重点培养学生数据处理思想。
阶段二:Hadoop生态体系架构:本阶段以Hadoop生态系统为主,是大数据主要框架的入门阶段。根据课程的前后关联性,先后为Linux、Hadoop、Hive、Zookeeper、Flume、Kafka、电商数据采集项目。课程顺序经过精心调研安排,符合学习的基本认知规律。每个框架的讲解都是从基础的安装部署和架构讲解入手,穿插经典实操案例,配以关键源码解读。阶段最后安排讲解数据仓库采集系统,对各种框架融会贯通,带领学员回顾所学框架的同时,迅速增长实际开发经验。
阶段三:Spark生态体系架构:本阶段课程进入进阶阶段,主要讲解核心大数据框架Spark和HBase,对两大框架进行了深入讲解,包括两大框架的基本安装部署以及深入源码解读。此外,本阶段还包含三大项目——离线数据仓库项目、用户画像项目和项目实战。前两大项目均采用新架构体系、稳定的框架选型、经典的理论解读,手把手教你如何从0到1搭建一个功能完善的大数据系统。内容涵盖绝大部分大数据经典流行框架、绝大部分经典需求实现,并配合企业级部署调优讲解,助力学员迅速增长开发经验,适配大部分企业的大数据开发需求。项目实战项目主要锻炼学生动手实战能力,根据前两个项目所学,自己独立按照企业需求完成开发任务。
阶段四:Flink生态体系架构:本阶段课程以时下流行的大数据处理框架Flink为中心,从架构讲起,详细讲解了各种层面API的使用,并对Flink的高级应用场景进行了案例化讲解,还配备了详细的源码解读和优化技巧。本阶段还围绕Flink讲解了大数据领域另一个十分重要的项目——Flink实时数据仓库项目。本项目与离线数仓项目可以无缝对接,两大项目共同组成一个完整的企业级大数据架构。课程中包含深入数仓理论讲解、实用高效的实时问题解决方案。通过学习本项目,可以迅速掌握实时开发的重点难点,掌握多种实时难点问题解决方案,对实时领域框架的搭配应用融会贯通,提升开发和调优经验。本阶段还配备项目实战阶段,主要锻炼学生动手实战能力,根据已学内容,在讲师指导下独立完成开发任务。此外,本阶段课程还将讲解时下流行的热点问题项目,数据湖 or K8S or 技术中台,成熟的技术课程可以使学员更广泛了解大数据的发展趋势,掌握更多更热门的大数据技术,例如Hudi、K8S、数据治理等。在本阶段课程的最后是企业级的项目调优课程,通过搭建一个企业级的大数据集群,对项目中可能发生的高频热点问题、面试常见问题给出多角度解答,问题多、范围广、覆盖全,有助学员提升开发经验,熟悉开发环境。
阶段五:就业指导:本阶段课程主要围绕学员的就业需求,在真正就业前,帮助学员多维度复习巩固所学知识和项目,串讲经典高频面试题,传授面试答题技巧,总结项目开发经验,手把手简历指导,解决学员在就业过程中遇到的各种难题。
课程目录
01Javase
Day-01
Day-01.xmind
code
HelloWorld.class
HelloWorld.java
TestOne.java
TestThree.java
TestTwo.java
homework
尚硅谷_01_Java基础语法_homework.md
尚硅谷_01_Java基础语法_homework_参考答案.md
尚硅谷_01_Java基础语法_homework.assets
1.jpg
3.jpg
4.jpg
5.jpg
8.png
9.png
image-20211219152628406.png
note
尚硅谷-第1章 Java概述
尚硅谷-第1章 Java概述.zip
尚硅谷-第2章 Java基础语法
尚硅谷-第2章 Java基础语法.zip
resources
video
day01-01-Java发展简史.mp4
day01-02-Java跨平台的原理和JVM.mp4
day01-03-安装JDK.mp4
day01-04-配置环境变量.mp4
day01-05-编写源文件和编译源文件.mp4
day01-06-使用editplus编写java文件.mp4
day01-07-安装editplus.mp4
day01-08-设置编译和运行工具.mp4
day01-09-注释.mp4
day01-10-关键字.mp4
day01-11-标识符.mp4
day01-12-声明和使用变量.mp4
Day-02
day02晨测.txt
code
DAY02-novideo
DAY02
DAY02.zip
video
DAY02-video
DAY02
DAY02.zip
video
day02-01-晨测.mp4
day02-02-基础数据类型和引用数据类型.mp4
day02-03-变量的三要素和声明与赋值.mp4
day02-04-计算机底层使用二进制.mp4
day02-05-八种基础数据类型所占的内存空间和取值范围.mp4
day02-06-计算机底层使用二进制补码存储和运算数据.mp4
day02-07-char型表示字符.mp4
day02-08-强制类型转换和自动类型转换.mp4
day02-09-算术运算符.mp4
day02-10-关系运算符和逻辑运算符.mp4
day02-11-赋值运算符.mp4
day02-12-位运算符.mp4
homework
Day-03
day-03晨测.txt
code
TestFour.java
TestOne.java
TestThree.java
TestTwo.java
DAY03-video
DAY03
DAY03.zip
video
day03-01-晨测.mp4
day03-02-复习.mp4
day03-03-Scanner键盘输入.mp4
day03-04-if-else和多重if-else结构.mp4
day03-05-嵌套的if-else结构.mp4
day03-06-switch-case结构.mp4
day03-07-while循环.mp4
day03-08-while循环的练习.mp4
homework
Day-04
晨测04.txt
练习.txt
code
DAY04-video
DAY04
DAY04.zip
video
day04-01-晨测.mp4
day04-02-复习.mp4
day04-03-do-while循环的特点1.mp4
day04-04-do-while循环的特点2.mp4
day04-05-do-while循环的练习.mp4
day04-06-for循环的特点.mp4
day04-07-break关键字.mp4
day04-08-continue关键字.mp4
day04-09-二重循环的概念.mp4
day04-09-二重循环的练习.mp4
day04-10-二重循环的练习1.mp4
day04-11-二重循环的练习2.mp4
homework
.idea
homework.iml
misc.xml
modules.xml
workspace.xml
Day-05
晨测.txt
code
DAY05-video
DAY05
DAY05.zip
video
day05-01-晨测.mp4
day05-02-复习.mp4
day05-03-数组的相关概念.mp4
day05-04-一维数组的声明和初始化.mp4
day05-05-数组的遍历.mp4
day05-06-数组的常见算法和二分查找的理论.mp4
day05-07-二分查找的代码解析.mp4
day05-08-数组元素的交换.mp4
day05-09-冒泡排序.mp4
day05-10-一维数组的内存分析.mp4
day05-11-二维数组.mp4
homework
Day-06
晨测.txt
DAY06-video
DAY06
DAY06.zip
video
day06-01-晨测.mp4
day06-02-在idea下创建工程和模块.mp4
day06-03-类和对象的概念.mp4
day06-04-创建一个类和使用类创建对象.mp4
day06-05-包,导包,和包作用概念.mp4
day06-06-类的普通属性的特点.mp4
day06-07-方法的访问修饰符方法的返回类型.mp4
day06-08-无参方法的练习.mp4
day06-09-在工程中删除和附加模块.mp4
day06-10-移除和附加module.mp4
day06-11-无参方法练习1.mp4
Day-07
晨测.txt
DAY07
DAY07.zip
video
day07-01-晨测.mp4
day07-02-定义和使用带参的方法.mp4
day07-03-使用基础类型传参的特点.mp4
day07-04-引用数据类型传参.mp4
day07-05-引用数据类型传参和基础数据类型传参的内存分析.mp4
day07-06-方法调用时的内存分析.mp4
day07-07-属性和局部变量额区别.mp4
day07-08-变长参数组.mp4
day07-09-方法重载.mp4
day07-10-对象数组.mp4
day07-11-构造器的概念和作用(1).mp4
day07-11-构造器的概念和作用.mp4
day07-12-构造器的特点(1).mp4
day07-12-构造器的特点.mp4
Day-08
DAY08-video
DAY08
DAY08.zip
video
day08-01-晨测1.mp4
day08-02-晨测2.mp4
day08-03-静态属性的特点和内存分析.mp4
day08-04-静态的方法的特点和内存分析.mp4
day08-09-封装的概念和私有成员公开getset方法.mp4
day08-10-继承的基本概念.mp4
day08-11-继承的特点.mp4
day08-12-方法重写.mp4
day08-13-方法重写时子类方法签名和父类方法签名不同的特点.mp4
Day-09
晨测.txt
DAY09-video
DAY09
DAY09.zip
video
day09-01-晨测.mp4
day09-02-复习.mp4
day09-03-继承状态下父类之间的构造器调用特点.mp4
day09-04-通过构造器给普通属性赋初始值.mp4
day09-05-普通代码块给属性赋值.mp4
day09-06-类的加载顺序及使用静态代码块给静态属性赋值.mp4
day09-07-Object根父类和Object类中的方法.mp4
day09-08-引用和对象的关系.mp4
day09-09-重写toString和equals方法的意义.mp4
day09-10-final关键字.mp4
day09-11-多态的概念和实现方式.mp4
day09-12-向上转型和向下转型和instanceof关键字.mp4
Day-10
晨测.txt
DAY10-video
DAY10
DAY10.zip
video
day10-01-晨测.mp4
day10-02-抽象关键字和抽象类抽象方法.mp4
day10-03-抽象父类的子类特点.mp4
day10-04-接口的概念和接口的定义.mp4
day10-05-jdk1.8之后接口中声明两种带有方法体的方法.mp4
day10-06-接口和实现类之间的关系及接口的继承.mp4
day10-07-接口中的命名冲突和比较对象大小的接口.mp4
day10-08-JDK1.5之前的枚举1.mp4
day10-09-JDK1.5之前的枚举2.mp4
day10-10-JDK1.5之后的枚举1.mp4
Day-11
晨测.txt
DAY11-video
DAY11
DAY11.zip
video
day11-01-01-晨测.mp4
day11-02-枚举类提供的常用方法.mp4
day11-03-包装类.mp4
day11-04-静态成员内部类的特点.mp4
day11-05-普通成员内部类的特点.mp4
day11-06-局部内部类的特点.mp4
day11-07-匿名内部类的特点.mp4
day11-08-匿名内部类的使用方式.mp4
day11-09-三个系统提供的基础注解.mp4
day11-10-使用junit测试.mp4
Day-12
晨测.txt
DAY12-novideo
DAY12
DAY12.zip
video
DAY12-video
DAY12
DAY12.zip
video
day12-01-晨测.mp4
day12-02-junit剩下的几个注解.mp4
day12-03-元注解.mp4
day12-04-自定义注解.mp4
day12-05-异常的概念和抛出异常的机制.mp4
day12-06-受检异常和非受检异常.mp4
day12-07-try-catch结构.mp4
day12-08-try-catch-finally.mp4
day12-09-throw关键字和throws关键字.mp4
day12-10-自定义异常.mp4
Day-13
测试题(晨测).txt
DAY13-video
DAY13
DAY13.zip
video
day13-01-晨测.mp4
day13-02-多线程的相关概念.mp4
day13-03-在Java语言中开启子线程的两种方式.mp4
day13-04-开启多个子线程.mp4
day13-05-Thread类的构造方法.mp4
day13-06-Thread类的常用方法1.mp4
day13-07-Thread类的常用方法2.mp4
day13-08-龟兔赛跑.mp4
day13-09-线程安全问题.mp4
Day-14
晨测.txt
DAY14-video
DAY14
DAY14.zip
video
day14-01-晨测.mp4
day14-02-各种不同的锁对象.mp4
day14-03-同步代码块和同步方法的特点.mp4
day14-04-一个生产者与一个消费者的问题.mp4
day14-05-多个生产者与多个消费者的问题.mp4
day14-06-线程的声明周期.mp4
day14-07-线程的生命周期和死锁.mp4
day14-08-Math类的常用方法1.mp4
day14-09-math包下的类和Random类.mp4
day14-10-jdk1.8之前的日期处理.mp4
day14-11-jdk1.8之后的日期处理.mp4
Day-15
晨测.txt
DAY15-video
DAY15
DAY15.zip
video
day15-01-晨测.mp4
day15-02-数组的扩容.mp4
day15-03-数组的指定下标移除元素和指定下标新增元素.mp4
day15-04-String创建对象的特点和String内存结构的特点.mp4
day15-04-String在拼接字符串时各种情况的内存特点.mp4
day15-05-String的常用方法1.mp4
day15-06-String的常用方法2.mp4
day15-07-String的常用方法3.mp4
day15-08-StringBuffer和StringBuilder.mp4
Day-16
晨测.txt
DAY16-video
DAY16
DAY16.zip
video
day16-01-晨测.mp4
day16-02-集合框架体系图和集合的意义.mp4
day16-03-Collection的常用方法.mp4
day16-04-Collection接口的遍历.mp4
day16-05-迭代器的底层工作原理.mp4
day16-06-List接口的特点和List接口的独有方法.mp4
day16-07-List接口的遍历(1).mp4
day16-07-List接口的遍历.mp4
day16-08-ArrayList底层实现的原理和代码阅读1(1).mp4
day16-08-ArrayList底层实现的原理和代码阅读1.mp4
day16-09-ArrayList底层原码2.mp4
day16-10-LinkedList的特点和底层实现.mp4
Day-17
HashSet存值的图示.pptx
晨测.txt
DAY17-video
DAY17
DAY17.zip
video
day18-01-晨测.mp4
day18-02-Set接口的特点.mp4
day18-03-Set接口实现类的底层都是Map接口的实现类.mp4
day18-04-HashSet去重的原理.mp4
day18-05-重写hashCode和equals方法.mp4
day18-06-LinkedHashSet的特点.mp4
day18-07-TreeSet的特点和自然排序.mp4
day18-08-自然排序的升序与降序.mp4
day18-09-定制排序.mp4
day18-10-Collections工具类.mp4
Day-18
晨测.txt
DAY18-video
DAY18
DAY18.zip
video
day18-01-晨测.mp4
day18-02-map接口的常用方法1.mp4
day18-03-map接口的遍历.mp4
day18-04-HashMap底层源码.mp4
day18-05-泛型的概念和泛型的引入.mp4
day18-06-在类声明时使用泛型的具体步骤.mp4
day18-07-在接口声明时声明和使用泛型的步骤.mp4
day18-08-泛型的上限和泛型的通配.mp4
day18-09-泛型的集合.mp4
Day-19
DAY19-video
DAY19
DAY19.zip
video
day19-01-晨测.mp4
day19-02-使用绝对路径或者相对路径创建File对象.mp4
day19-03-File类的常用方法.mp4
day19-04-File类的常用方法.mp4
day19-05-流的特点和分类.mp4
day19-06-字节输入流.mp4
day19-07-字节输出流和文件复制.mp4
day19-08-字符流和缓冲流.mp4
day19-09-转换流.mp4
day19-10-对象流.mp4
Day-20
DAY20-video
DAY20
DAY20.zip
video
day20-01-晨测.mp4
day20-02-网络通讯的基础知识.mp4
day20-03-TCP协议和UDP协议的特点.mp4
day20-04-客户端与服务器双向单次通讯String.mp4
day20-05-客户端与服务器通讯的注意点.mp4
day20-06-客户端与服务器双向多次通讯String.mp4
day20-07-客户端与服务器双向多次传递Object.mp4
day20-08-让客户端的错误输入可以重复输入用户名密码.mp4
Day-21
DAY21-video
DAY21
DAY21.zip
video
day21-01-晨测.mp4
day21-02-读取硬盘文件数据验证用户名密码的正确性.mp4
day21-03-获取类类对象的四种方式.mp4
day21-04-获取类的信息和类的属性信息.mp4
day21-05-获取类的方法信息.mp4
day21-06-获取类的构造器信息.mp4
day21-07-利用反射的方式创建对象和访问对象的普通属性.mp4
day21-08-利用反射的方式访问静态成员和调用方法.mp4
02MySQL
02.MySQL(1).xmind
02.MySQL.xmind
01-课件
尚硅谷00_SQL概述.pptx
尚硅谷01_数据处理之查询.pptx
尚硅谷02_子查询.pptx
尚硅谷03_创建和管理表.pptx
尚硅谷04_数据处理之增删改.pptx
尚硅谷05_约束和分页.pptx
尚硅谷_Mysql安装与使用.pptx
02-资料
02-资料.zip
03-视频
day22-全天视频
Day-22
01-基本查询.sql
02-过滤.sql
03-模糊查询.sql
04-查询.sql
05-多表查询.sql
day22
卸载MySQL.txt
多表查询.xlsx
环境变量配置.xlsx
上午
01-MySQL概述.mp4
02-MySQL卸载.mp4
03-Mysql安装.mp4
04-配置环境变量.mp4
05-SQLYog安装.mp4
06-导入数据.mp4
07-SQLYog设置.mp4
08-基本查询.mp4
下午
01-过滤01.mp4
02-过滤02.mp4
03-模糊查询.mp4
04-排序.mp4
05-多表查询.mp4
代码
01-基本查询.sql
02-过滤.sql
03-模糊查询.sql
04-排序.sql
05-多表查询.sql
day23-全天视频
04-代码
04-代码.zip
05-复习
MySQL复习.md
img
1649637701330.png
1649637780193.png
1649637796385.png
上午
01-复习.mp4
02-多表查询02.mp4
03-飘号和去重.mp4
04-练习-选择与过滤.mp4
05-单行函数01.mp4
06-单行函数02.mp4
07-通用函数.mp4
下午
01-多行函数(组函数).mp4
02-分组和过滤.mp4
03-子查询.mp4
04-练习-多表查询.mp4
作业
03-多表查询.sql
04-分组函数.sql
05-子查询.sql
day24-全天视频
04-代码
04-代码
04-代码.zip
05-复习
05-复习
MySQL复习.md
img
1649637701330.png
1649637780193.png
1649637796385.png
1649723666409.png
day24-上午视频
上午
01-复习.wmv
01-复习2.wmv
02-练习-单行函数.wmv
03-练习-分组函数.wmv
04-练习-子查询.wmv
05-库的操作.wmv
06-表的操作.wmv
07-Mysql的数据类型.wmv
08-对列进行操作.wmv
09-编码集.wmv
day24-下午视频
下午
01-数据之增,删,改.wmv
02-事务.wmv
03-创建表时添加列级约束.wmv
04-创建表时添加表级约束.wmv
05-索引.wmv
06-外键约束.wmv
07-创建表后添加约束.wmv
08-分页.wmv
04-代码
05-复习
03JDBC
01-课件.zip
02资料.zip
03.JDBC.zip
04-代码.zip
05-复习.zip
03-视频
day25-视频
04-代码
JDBCDemo.zip
上午
01-复习.wmv
02-JDBC概述.mp4
03-准备工作.mp4
04-获取Connection方式一.mp4
05-Properties.mp4
06-获取Connection方式二.mp4
07-方式二的优化.mp4
08-获取Connection最终版.mp4
09-JDBCUtils工具类.mp4
10-向表中插入数据.mp4
下午
01-修改表中的数据.mp4
02-删除表中的数据.mp4
03-查询表中所有的数据.mp4
04-事务.mp4
05-数据库连接池.mp4
06-DBUtiLs工具类.mp4
07-不能插入中文问题.mp4
04Maven
Maven.xmind
1.笔记
01_尚硅谷大数据技术之Maven(V4.0).doc
2.资料
apache-maven-3.5.4-bin.zip
apache-maven-3.5.4-src.zip
maven流程图.xlsx
repo.zip
环境变量配置.xlsx
3.视频
day26-视频
4.code
4.code.zip
day01
上午
01-复习.wmv
02-批处理.mp4
03-为什么要使用Maven.mp4
04-Maven是什么.mp4
05-Maven安装.mp4
06-修改本地仓库的路径.mp4
07-配置阿里云镜像.mp4
08-配置Maven编译版本.mp4
09-IDEA中配置Maven.mp4
下午
01-空工程.mp4
02-创建Maven工程.mp4
03-常见问题.mp4
04-第一个Maven程序.mp4
05-无法直接运行单元测试方法的问题.mp4
06-pom和约定的目录结构.mp4
07-约定02.mp4
08-坐标.mp4
09-第二个Maven工程.mp4
day02
01-复习.wmv
02-依赖的范围.mp4
03-依赖的传递性.mp4
04-依赖的原则.mp4
05-依赖的排除.mp4
06-版本的统一管理.mp4
07-仓库.mp4
08-Maven的生命周期.mp4
09-插件和目标.mp4
10-继承.mp4
11-聚合.mp4
12-Maven酷站.mp4
13-常见问题.mp4
14-Maven打包插件.mp4
4.code
4.code.zip
05Linux
linux操作.xmind
linux环境配置.xmind
1.笔记
VMware与CentOS及XShell的安装.docx
尚硅谷大数据技术之Linux(V4.0).docx
2.资料
2.资料.zip
3.视频
day27
day27
Mavencode.zip
Linux视频
day01
01-Linux概述.mp4
02-Linux和Windows的区别.mp4
03-VM安装.mp4
04-虚拟化.mp4
05-Linux安装01.mp4
06-Linux安装02.mp4
07-Linux目录结构.mp4
08-基本命令.mp4
09-一般模式.mp4
10-编辑模式.mp4
11-指令模式.mp4
12-模式间转换.mp4
13-常见错误.mp4
常见错误.xlsx
Maven视频
day02
01-复习.wmv
02-依赖的范围.wmv
03-依赖的传递性.wmv
04-依赖的原则.wmv
05-依赖的排除.wmv
06-版本的统一管理.wmv
07-仓库.wmv
08-Maven的生命周期.wmv
09-插件和目标.wmv
10-继承.wmv
11-聚合.wmv
12-Maven酷站.wmv
13-常见问题.wmv
14-Maven打包插件.wmv
day28
day28
01-复习.wmv
02-网络配置.mp4
03-Xshell安装.mp4
04-XShell配置.mp4
05-Xftp安装.mp4
06-lrzsz.mp4
07-快照.mp4
08-修改主机名.mp4
09-hosts文件.mp4
10-服务的启动和停止.mp4
11-开机自启的设置.mp4
12-关机重启命令.mp4
13-帮助命令.mp4
14-文件目录类01.mp4
15-文件目录类02.mp4
16-时间日期类.mp4
17-用户管理命令.mp4
18-用户组管理命令.mp4
hosts.xlsx
命令的优先级.txt
day29
day29
05-Shell.zip
上午
01-Linux连不上网络的常见解决方案.mp4
02-复习.mp4
03-文件属性.mp4
04-改变权限.mp4
05-修改所属主和所属组.mp4
06-搜索查找类.mp4
07-压缩和解压缩.mp4
08-磁盘分区类.mp4
09-进程线程类.mp4
10-定时任务.mp4
11-rpm包.mp4
12-YUM仓库.mp4
13-克隆虚拟机.mp4
14-常见错误和面试题.mp4
命令的优先级.txt
下午
01-Shell概述.mp4
02-第一个Shell脚本程序.mp4
03-第二个Shell程序.mp4
04-第三个Shell程序.mp4
05-系统变量.mp4
06-自定义变量.mp4
07-特殊变量.mp4
08-单引号和双引号的区别.mp4
09-运算式.mp4
10-条件判断.mp4
05She’ll
shell编程.xmind
1.笔记
尚硅谷大数据技术之Shell(V4.0).docx
2.资料
2.资料.zip
3.视频
day29
05-Shell.zip
上午
01-Linux连不上网络的常见解决方案.wmv
02-复习.wmv
03-文件属性.wmv
04-改变权限.wmv
05-修改所属主和所属组.wmv
06-搜索查找类.wmv
07-压缩和解压缩.wmv
08-磁盘分区类.wmv
09-进程线程类.wmv
10-定时任务.wmv
11-rpm包.wmv
12-YUM仓库.wmv
13-克隆虚拟机.wmv
14-常见错误和面试题.wmv
命令的优先级.txt
下午
01-Shell概述.wmv
02-第一个Shell脚本程序.wmv
03-第二个Shell程序.wmv
04-第三个Shell程序.wmv
05-系统变量.wmv
06-自定义变量.wmv
07-特殊变量.wmv
08-单引号和双引号的区别.wmv
09-运算式.wmv
10-条件判断.wmv
4.code
opt
demo.zip
shelldemo.zip
shelldemo2.zip
shelldemo3.zip
software.zip
06Hadopp
hadoop.xmind
1.笔记
01_尚硅谷大数据技术之大数据概论.docx
02_尚硅谷大数据技术之Hadoop(入门)V4.0.docx
03_尚硅谷大数据技术之Hadoop(HDFS)V4.0.docx
04_尚硅谷大数据技术之Hadoop(MapReduce&Yarn)V4.0(1).docx
04_尚硅谷大数据技术之Hadoop(MapReduce&Yarn)V4.0.docx
05_尚硅谷大数据技术之Hadoop(Yarn)V4.0(1).docx
05_尚硅谷大数据技术之Hadoop(Yarn)V4.0.docx
06_尚硅谷大数据技术之Hadoop(优化&新特性)V4.0.docx
3.代码
3.代码.zip
视频
day30
上午
02-case语句.mp4
02-if语句.mp4
03-for循环.mp4
04-while循环.mp4
05-read.mp4
06-系统函数.mp4
07-自定义函数.mp4
08-Shell工具-cut.mp4
09-Shell工具-awk.mp4
10-正则表达式.mp4
下午
01-大数据概念和特点.mp4
02-大数据应用场景.mp4
03-大数据发展前景.mp4
04-大数据部门组织架构.mp4
05-Hadoop概述.mp4
06-Hadoop三大发行版本.mp4
07-Hadoop优势.mp4
10-Yarn概述.mp4
11-MR概述.mp4
12-HDFS,YARN,MR之间的关系.mp4
13-大数据技术生态体系和推荐系统架构图.mp4
14-Linux配置.mp4
HDFS.xlsx
Linux配置.txt
day31
day02
01-复习.wmv
02-JDK安装.mp4
03-Hadoop安装.mp4
04-Hadoop的目录结构.mp4
05-克隆三台虚拟机.mp4
06-wordcount案例.mp4
07-scp.mp4
08-rsync.mp4
09-SSH.mp4
10-分发脚本xsync.mp4
11-集群规划.mp4
12-集群配置和启动.mp4
13-常见错误-配置错误.mp4
14-常见错误二-重复格式化.mp4
15-jpsall.mp4
clear.sh
Hadoop安装.txt
JDK安装.txt
jpsall
xsync
常见错误.xlsx
本地模式.txt
集群配置和启动.txt
day32
day32
HDFSDemo.zip
day03
01-群起脚本.wmv
02-常用网址.wmv
03-集群测试.wmv
04-集群启动和停止方式总结.wmv
05-历史服务器.wmv
06-日志聚集.wmv
07-时间同步.wmv
08-时间同步2.wmv
09-HDFS概述.wmv
10-HDFS优缺点.wmv
11-HDFS组成架构.wmv
12-文件块大小.wmv
13-Shell操作-上传.wmv
14-Shell操作-下载.wmv
15-Shell操作-其它.wmv
16-windows上Hadoop的配置.wmv
17-API操作-工程的创建.wmv
18-API操作-上传.wmv
19-API操作-下载.wmv
Hadoop中的网址.txt
HDFS.xlsx
myhadoop.sh
新建 Microsoft Excel 工作表.xlsx
day33
01-复习.wmv
02-给main方法传参.wmv
03-第二种方式创建客户端对象.wmv
04-参数的优先级.wmv
05-HDFS写数据流程.wmv
06-节点距离计算.wmv
07-机架感知.wmv
08-HDFS读数据流程.wmv
09-NN和2NN工作机制.wmv
10-fsimage和edits文件.wmv
11-CheckPoint参数设置.wmv
12-DataNode工作机制.wmv
13-数据完整性.wmv
14-掉线时限参数设置.wmv
15-edits文件补充.wmv
16-MR概述.wmv
17-MR优缺点.wmv
18-MR核心思想.wmv
19-MR进程.wmv
20-WordCount源码.wmv
MR核心思想.xlsx
NN和2NN.xlsx
块.xlsx
day34
01-复习.wmv
02-wordcount分析.mp4
03-WC-Mapper实现.mp4
04-WC-Reducer.mp4
05-WC-Driver.mp4
06-常见错误.mp4
07-在集群上运行Job.mp4
08-从本地向集群提交Job.mp4
09-Hadoop序列化框架概述.mp4
10-流量统计分析.mp4
11-流量统计实现.mp4
12-MR的理解.mp4
13-切片与MapTask并行度机制.mp4
14-InputFormat.mp4
InputFormat.txt
MRDemo.zip
MR的理解.txt
day35
01-复习.wmv
02-Debug调试.mp4
03-Debug调试案例.mp4
04-Job提交流程-本地.mp4
05-Job提交流程-集群.mp4
06-Job提交流程总结.mp4
07-切片源码.mp4
08-TextInputFormat的key和value.mp4
09-CombineTextInputFormat.mp4
10-MR工作流程-Job提交.mp4
11-Shuffle机制01.mp4
12-Shuffle机制02.mp4
13-分区的源码.mp4
14-分区的案例.mp4
3.代码.zip
Job提交流程总结.txt
分区的源码.txt
切片源码.txt
day36
01-复习.wmv
02-单词统计分区案例.mp4
03-排序概述.mp4
04-排序案例一.mp4
05-排序案例二.mp4
06-Combiner.mp4
07-OutputFormat.mp4
08-MR工作流程.mp4
09-数据格式的问题.mp4
10-自定义OutputFormat.mp4
11-MapJoin-分析.mp4
12-MapJoin-实现.mp4
Combiner.xlsx
MRDemo.zip
OutputFormat.txt
流.xlsx
day37
01-复习.wmv
02-ReduceJoin分析.mp4
03-ReduceJoin-OrderBean完成.mp4
04-ReduceJoin-Mapper.mp4
05-ReduceJoin-排序.mp4
06-ReduceJoin-分组.mp4
07-ReduceJoin-Reducer.mp4
08-ReduceJoin-Driver.mp4
09-ReduceTask并行度决定机制.mp4
10-MR开发总结.mp4
11-压缩方式的概述.mp4
12-压缩开启.mp4
13-Yarn基础架构.mp4
14-Yarn工作机制.mp4
15-作业提交全过程.mp4
MRDemo.zip
ReduceJoin.xlsx
day38
01-复习.wmv
02-集群练习说明.mp4
03-调度器.mp4
04-FIFO调度器.mp4
05-容量调度器.mp4
06-公平调度器01.mp4
07-公平调度器02.mp4
08-Yarn生产环境配置.mp4
09-多队列配置.mp4
10-向指定队列提交Job.mp4
11-安全模式.mp4
12-元数据丢失演示1.mp4
13-元数据丢失演示2.mp4
14-块数据丢失.mp4
15-HDFS多目录设置.mp4
HDFS故障处理.xlsx
day39
01-复习wmv.mp4
02-添加新数据节点.mp4
03-服务器间数据均衡.mp4
04-白名单.mp4
05-黑名单.mp4
06-MR优化-数据输入.mp4
07-MR优化-Map阶段.mp4
08-MR优化-Reduce阶段.mp4
09-MR优化-IO传输.mp4
10-MR优化-数据倾斜.mp4
11-MR优化-常用的调优参数.mp4
12-MR优化-小文件优化.mp4
13-集群间拷贝.mp4
14-小文件存档.mp4
15-回收站.mp4
SSH.xlsx
数据倾斜.xlsx
添加新节点.txt
资料
22尚硅谷大数据(3.9)等多个文件.zip
集群练习
集群练习 (2).z01
集群练习 (2).z02
集群练习 (2).zip
集群练习.zip
07Zookeeper
zookeeper.xmind
1.笔记
尚硅谷大数据技术之Zookeeper(V4.0).docx
2.资料
apache-zookeeper-3.5.7-bin.tar.gz
ZK本地安装.txt
3.视频
day01
01-ZK概述.mp4
02-ZK特点.mp4
03-ZK数据结构.mp4
04-ZK应用场景.mp4
05-ZK下载.mp4
06-ZK本地安装.mp4
ZK本地安装.txt
day02
01-概述.mp4
02-ZK集群配置.mp4
03-群起脚本.mp4
04-配置参数解读.mp4
05-Leader选举-第一次启动.mp4
06-Leader选举-非第一次启动.mp4
07-ZK命令.mp4
08-监听器原理.mp4
09-写数据流程.mp4
zkCluster.sh
ZK集群.txt
4.code
08Ha
HA(High Availablity).xmind
01-课件
尚硅谷大数据技术之Hadoop(HA)V4.0.docx
02-视频
01-HA准备工作.mp4
02-手动故障转移.mp4
03-自动故障转移.mp4
04-Yarn的HA.mp4
05-恢复到原集群.mp4
NN-HA.xlsx
NN-HA配置.txt
RM-HA配置.txt
准备工作.txt
恢复到原来的集群.txt
03-代码
04_资料
09Hive
大数据技术之Hive.xmind
1.笔记
Hive.xmind
hive阶段常见问题1.0.docx
尚硅谷大数据技术之Hive-4.0.docx
常用函数.txt
手写HQL题目.docx
ppt
Hive优化之大表大表join-大表打散表扩容.ppt
尚硅谷大数据技术之Hive–sort by & limit.ppt
尚硅谷大数据技术之Hive–SQL转化MR.ppt
尚硅谷大数据技术之Hive–元数据访问之内元数据库直连模式.ppt
尚硅谷大数据技术之Hive–元数据访问之内嵌模式.ppt
尚硅谷大数据技术之Hive–元数据访问之远程服务模式.ppt
尚硅谷大数据技术之Hive–前后端数据传输介绍.ppt
尚硅谷大数据技术之Hive–架构原理.ppt
尚硅谷大数据技术之Hive–行转列图示.ppt
尚硅谷大数据技术之Hive-hive执行SQL流程.ppt
尚硅谷大数据技术之Hive-元数据和真实数据 .ppt
尚硅谷大数据技术之Hive-数据类型.vsdx
尚硅谷大数据技术之Hive-窗口函数演示.ppt
尚硅谷大数据技术之Hive-表优化之group by.ppt
尚硅谷大数据技术之Hive-表优化之大表join大表之空key转换.ppt
尚硅谷大数据技术之Hive.pptx
2.资料
uTorrent.v2.21已优化配置.zip
01_jar
apache-hive-3.1.2-bin.tar.gz
mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar
mysql-connector-java-5.1.37.jar
02_data
log.data
100万条大表数据(id除以10取整)
bigtable
10万条小表数据(id为9万+随机数字)
smalltable
company
company_dept.txt
company_emp.txt
guliVideo
user
user.txt
video
1.txt
2.txt
3.txt
4.txt
5.txt
student
student.txt
加递增id的原始数据
ori
动态分区数据
ds1
ds2
原始数据
SogouQ1.txt
含有null的id数据100万条
nullid
03_常用函数
常用函数.txt
04_脚本
hive.sh
hive2.sh
Hive实战.sql
Join.sql
函数.sql
分组.sql
排序.sql
查询.sql
idea依赖jar包
jdbc-drivers.xml
jdbc-drivers.zip
Hive
3.1.2
hive-jdbc-3.1.2-standalone.jar
hive-license.txt
MySQL ConnectorJ
8.0.25
mysql-connector-java-8.0.25.jar
mysql-connector-license.txt
推荐软件
DittoSetup_64bit_3_24_184_0.exe
geek.exe
MouseWithoutBordersSetup.msi
prettyZoo-win.msi
SwitchHosts_installer_4.0.3.6070.exe
uTorrent.v2.21已优化配置.zip
XMind ZEN 9.1.3 Portable便携版
api-ms-win-core-console-l1-1-0.dll
api-ms-win-core-datetime-l1-1-0.dll
api-ms-win-core-debug-l1-1-0.dll
api-ms-win-core-errorhandling-l1-1-0.dll
api-ms-win-core-file-l1-1-0.dll
api-ms-win-core-file-l1-2-0.dll
api-ms-win-core-file-l2-1-0.dll
api-ms-win-core-handle-l1-1-0.dll
api-ms-win-core-heap-l1-1-0.dll
api-ms-win-core-interlocked-l1-1-0.dll
api-ms-win-core-libraryloader-l1-1-0.dll
api-ms-win-core-localization-l1-2-0.dll
api-ms-win-core-memory-l1-1-0.dll
api-ms-win-core-namedpipe-l1-1-0.dll
api-ms-win-core-processenvironment-l1-1-0.dll
api-ms-win-core-processthreads-l1-1-0.dll
api-ms-win-core-processthreads-l1-1-1.dll
api-ms-win-core-profile-l1-1-0.dll
api-ms-win-core-rtlsupport-l1-1-0.dll
api-ms-win-core-string-l1-1-0.dll
api-ms-win-core-synch-l1-1-0.dll
api-ms-win-core-synch-l1-2-0.dll
api-ms-win-core-sysinfo-l1-1-0.dll
api-ms-win-core-timezone-l1-1-0.dll
api-ms-win-core-util-l1-1-0.dll
api-ms-win-crt-conio-l1-1-0.dll
api-ms-win-crt-convert-l1-1-0.dll
api-ms-win-crt-environment-l1-1-0.dll
api-ms-win-crt-filesystem-l1-1-0.dll
api-ms-win-crt-heap-l1-1-0.dll
api-ms-win-crt-locale-l1-1-0.dll
api-ms-win-crt-math-l1-1-0.dll
api-ms-win-crt-multibyte-l1-1-0.dll
api-ms-win-crt-private-l1-1-0.dll
api-ms-win-crt-process-l1-1-0.dll
api-ms-win-crt-runtime-l1-1-0.dll
api-ms-win-crt-stdio-l1-1-0.dll
api-ms-win-crt-string-l1-1-0.dll
api-ms-win-crt-time-l1-1-0.dll
api-ms-win-crt-utility-l1-1-0.dll
blink_image_resources_200_percent.pak
content_resources_200_percent.pak
content_shell.pak
d3dcompiler_47.dll
ffmpeg.dll
file.dat
icudtl.dat
libEGL.dll
libGLESv2.dll
LICENSE.electron.txt
LICENSES.chromium.html
msvcp140.dll
natives_blob.bin
node.dll
ucrtbase.dll
ui_resources_200_percent.pak
Uninstall XMind ZEN.exe
v8_context_snapshot.bin
vcruntime140.dll
views_resources_200_percent.pak
XMind ZEN.exe
卸载.bat
locales
am.pak
ar.pak
bg.pak
bn.pak
ca.pak
cs.pak
da.pak
de.pak
el.pak
en-GB.pak
en-US.pak
es-419.pak
es.pak
et.pak
fa.pak
fake-bidi.pak
fi.pak
fil.pak
fr.pak
gu.pak
he.pak
hi.pak
hr.pak
hu.pak
id.pak
it.pak
ja.pak
kn.pak
ko.pak
lt.pak
lv.pak
ml.pak
mr.pak
ms.pak
nb.pak
nl.pak
pl.pak
pt-BR.pak
pt-PT.pak
ro.pak
ru.pak
sk.pak
sl.pak
sr.pak
sv.pak
sw.pak
ta.pak
te.pak
th.pak
tr.pak
uk.pak
vi.pak
zh-CN.pak
zh-TW.pak
resources
app.asar
electron.asar
elevate.exe
xmind_file.ico
app.asar.unpacked
node_modules
edge-asar-cs
LICENSE.txt
package.json
lib
edge-cs.dll
edge-cs.js
edge-cs-coreclr
edge-cs-coreclr.dll
project.json
src
edge-cs
EdgeCompiler.cs
Properties
AssemblyInfo.cs
edge-cs-coreclr
EdgeCompiler.cs
global.json
gulpfile.js
package.json
project.json
tools
install.js
edge-cs
LICENSE.txt
package.json
lib
edge-cs.dll
edge-cs.js
bootstrap
Dummy.cs
project.json
src
edge-cs
EdgeCompiler.cs
Properties
AssemblyInfo.cs
Edge.js.CSharp
EdgeCompiler.cs
gulpfile.js
package.json
project.json
tools
install.js
electron-edge-js
Dockerfile
LICENSE
package.json
lib
double_edge.js
edge.js
bootstrap
Dummy.cs
project.json
native
win32
ia32
concrt140.dll
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
10.2.0
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
6.5.0
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
7.4.0
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
7.9.0
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
8.2.1
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
8.9.3
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
x64
concrt140.dll
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
10.2.0
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
6.5.0
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
7.4.0
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
7.9.0
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
8.2.1
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
8.9.3
concrt140.dll
edge_coreclr.node
edge_nativeclr.node
msvcp140.dll
vccorlib140.dll
vcruntime140.dll
samples
101_hello_lambda.js
102_hello_function.js
103_hello_file.csx
103_hello_file.js
104_add7_class.js
105_add7_dll.js
106_marshal_v82clr.js
107_marshal_clr2v8.js
108_func.js
108_lambda.js
109_sync.js
110_clr_instance.js
111_clr_listener.js
201_worker.js
202_sql.csx
202_sql.js
203_x509store.js
204_event_log.js
205_soap.csx
205_soap.js
206_registry_read.js
206_registry_write.js
207_unzip.js
207_zip.js
208_convertImage.js
209_websocket.js
210_windows_authentication.js
211_events.js
301_cspyfsps.js
edge.png
readme.txt
src
common
callbackhelper.cpp
clrfuncreflectionwrap.cs
edge.cpp
edge_common.h
utils.cpp
v8synchronizationcontext.cpp
CoreCLREmbedding
coreclrembedding.cpp
coreclrfunc.cpp
coreclrfuncinvokecontext.cpp
coreclrnodejsfunc.cpp
coreclrnodejsfuncinvokecontext.cpp
edge.h
cpprest
include
asyncrt_utils.h
json.h
deps
deps_entry.cpp
deps_entry.h
deps_format.cpp
deps_format.h
deps_resolver.cpp
deps_resolver.h
fxr
fx_muxer.cpp
fx_muxer.h
fx_ver.cpp
fx_ver.h
host
args.cpp
args.h
coreclr.cpp
coreclr.h
error_codes.h
libhost.cpp
libhost.h
runtime_config.cpp
runtime_config.h
json
casablanca
LICENSE.txt
include
stdafx.h
cpprest
asyncrt_utils.h
json.h
details
basic_types.h
cpprest_compat.h
nosal.h
SafeInt3.hpp
src
json
json.cpp
json_parsing.cpp
json_serialization.cpp
utilities
asyncrt_utils.cpp
pal
pal.h
pal.unix.cpp
pal.windows.cpp
pal_utils.cpp
pal_utils.h
trace.cpp
trace.h
dotnet
clractioncontext.cpp
clrfunc.cpp
clrfuncinvokecontext.cpp
clrfuncreflectionwrap.cpp
edge.h
nodejsfunc.cpp
nodejsfuncinvokecontext.cpp
persistentdisposecontext.cpp
utils.cpp
double
Edge.js
dotnet
EdgeJs.cs
dotnetcore
coreclrembedding.cs
nodejsfunc.cs
nodejsfuncinvokecontext.cs
semversion.cs
mono
clractioncontext.cpp
clrfunc.cpp
clrfuncinvokecontext.cpp
clrfuncinvokecontext.cs
dictionary.cpp
edge.h
monoembedding.cpp
monoembedding.cs
nodejsfunc.cpp
nodejsfunc.cs
nodejsfuncinvokecontext.cpp
nodejsfuncinvokecontext.cs
task.cpp
utils.cpp
stress
test.js
tools
build.bat
buildall.bat
build_double.bat
checkplatform.js
coverage.js
download.cs
download.js
install.js
repl.cs
runJsHint.js
test.js
unzip.cs
unzip.vbs
whereis.js
nuget
edge.nuspec
install.ps1
static
native
ReachFramework.dll
System.Printing.dll
XMindShellExt.dll
HQL题目
手写HQL题目02.docx
手写HQL题目02讲解.docx
视频
day01
01-hive-课件介绍.mp4
02-课前准备.mp4
03-hive-课程介绍.mp4
04-hive-基本概念–介绍.mp4
05-Hive-基本概念–hive本质的介绍.mp4
06-Hive-基本概念–hive的架构原理.mp4
07-Hive-基本概念-hive执行机制-与数据库的关系-优缺点.mp4
08-HIve-安装–hive的解压安装.mp4
09-HIve-安装-元数据之derby.mp4
10-HIve-上午回顾.mp4
11-Hive-安装–元数据之Derby的问题.mp4
12-Hive-安装-元数据之Mysql–mysql安装部署.mp4
13-Hive-安装-元数据之mysql–hive元数据切换为mysql存储.mp4
14-Hive-安装-元数据之metastore server方式.mp4
15-Hive-安装-hive的访问方式之JDBC.mp4
16-HIve-idea-连接mysql.mp4
17-Hive-idea-连接-hive2.mp4
day02
18-Hive-昨日回顾.mp4
19-Hive-安装之hive2.sh脚本编写及介绍.mp4
20-Hive-hive的元数据和真实数据及count(1)的问题.mp4
21-HIve-安装之hive的配置参数介绍及交互命令.mp4
22-HIve-安装之hive的三种参数配置方式及优先级.mp4
23-Hive-数据类型-介绍.mp4
24-Hive-数据类型-案例实操.mp4
25-Hive-数据类型-数据类型转换.mp4
26-Hive-DDL数据定义语言-数据库创建修改查询删除.mp4
27-Hive-上午回顾.mp4
28-HIve-DDL数据定义语言之表语句介绍.mp4
29-hive-DDL数据定义语言之管理表的创建.mp4
30-Hive-DDL数据定义语言之外部表的创建.mp4
31-Hive-DDL数据定义语言之内部表和外部表转换.mp4
32-Hive-DDL数据定义语言之修改表.mp4
33-Hive-DML数据操作语言之数据导入loaddata.mp4
34-Hive-DML数据操作之数据导入insert,as select,location.mp4
35-Hive-DML数据操作之数据导出–insert.mp4
36-Hive-DML数据操作之数迁移.mp4
37-Hive-查询之基本查询-全表特定列和列的别名.mp4
day03
38-Hive-昨日回顾.mp4
39-Hive-hive的元数据和真实数据间的关系.mp4
40-Hive-查询–基本查询之算数运算符和常用函数和limit和where.mp4
41-Hive-查询-基本查询-之比较运算符和逻辑运算符.mp4
42-Hive-查询-分组–group by和having.mp4
43-Hive-查询-分组中的reduce个数.mp4
44-Hive-join语句中的等值连接和非等值连接.mp4
45-Hive-join语句中的左连接有链接满链接多表连接笛卡尔积.mp4
46-Hive-排序–全局排序–order by.mp4
47-HIve-排序–分区排序的排序-sort by.mp4
48-Hive-排序-分区排序的分区–distrubte by.mp4
49-Hive-排序-cluster by.mp4
50-hive-上午回顾.mp4
51-Hive-分区表–基本操作.mp4
52-Hive-分区表-二级分区-及-元数据和真实数据的映射关系.mp4
53-HIve-分区表–动态分区.mp4
54-HIve-分桶表.mp4
day04
01-Hive-回顾.mp4
02-Hive-函数-nvl.mp4
03-Hive-函数-case和if.mp4
04-Hive-函数-行转列–concat-concat_ws_collect_setlist.mp4
05-Hive-函数-列转行.mp4
06-Hive-函数-窗口函数-介绍.mp4
07-Hive-上午回顾.mp4
08-Hive-函数-开窗函数之案例1.mp4
09-HIve-函数-开窗函数之案例2.mp4
10-Hive-函数-开窗函数之案例3.mp4
11-Hive-函数-开窗函数之案例4.mp4
12-Hive-函数-开窗函数-之案例5.mp4
13-Hive-函数-开窗函数之案例6.mp4
14-Hive-函数-自定义函数介绍和代码编写.mp4
15-Hive-函数-自定义函数的测试.mp4
day05
04-HIve-压缩–介绍.mp4
05-HIve-压缩-Map阶段的输出压缩.mp4
06-HIve-压缩-Reduce阶段的输出压缩.mp4
07-HIve-存储-存储文件类型介绍.mp4
08-Hive-存储-ORC介绍.mp4
09-Hive-存储-Parquet介绍.mp4
10-Hive-存储-主流文件存储格式对别.mp4
11-HIve-存储-压缩和存储结合测试.mp4
视频
01-Hive-手写SQL-第一题.mp4
02-HIve-手写SQL第二题.mp4
03-Hive-手写SQL第三题.mp4
04-HIve-压缩–介绍.mp4
05-HIve-压缩-Map阶段的输出压缩.mp4
06-HIve-压缩-Reduce阶段的输出压缩.mp4
07-HIve-存储-存储文件类型介绍.mp4
08-Hive-存储-ORC介绍.mp4
09-Hive-存储-Parquet介绍.mp4
10-Hive-存储-主流文件存储格式对别.mp4
11-HIve-存储-压缩和存储结合测试.mp4
day06
01-Hive-昨日回顾.mp4
02-HIve-企业级优化之Explain.mp4
03-HIve-企业级优化之HQL语法优化—Groupby.mp4
04-HIve-企业级优化之HQL语法优化之CBO.mp4
05-Hive-企业级优化之HQL语法优化–谓词下推.mp4
06-HIve-企业级优化之HQL语法优化-MapJoin.mp4
07-Hive-企业级优化之HQL语法优化-SMB和笛卡尔积.mp4
08-Hive-企业级优化之数据倾斜–单表数据倾斜优化.mp4
09-HIve-企业级优化之数据倾斜–join数据倾斜优化.mp4
10-Hive-企业级优化之数据倾斜-join大表join大表,大表打散小表扩容.mp4
11-Hive-企业级优化之Hivejob优化之Map阶段和Reduce阶段.mp4
12-Hive-企业级优化之Hivejob整体优化.mp4
13-Hive-企业级优化之Hive-job整体优化之严格模式.mp4
14-Hive-上午回顾.mp4
15-Hive-实战-背景介绍及数据准备.mp4
16-Hive-实战-案例1.mp4
17-Hive-实战–案例2.mp4
18-Hive-实战-案例3.mp4
19-HIve-实战-案例4.mp4
20-hive-实战–案例5.mp4
21-Hive-实战-案例6.mp4
22-Hive-实战–案例7.mp4
Hive实战.sql
课前准备
1.文档
尚硅谷大数据技术之idea连接HiveServer2.docx
尚硅谷大数据技术之idea连接Linux.docx
尚硅谷大数据技术之idea连接Mysql.docx
2.资料
JetBrainsMono-2.242.zip
10Flume
Flume.xmind
1.笔记
Flume.xmind
尚硅谷大数据技术之Flume.docx
2.资料
apache-flume-1.9.0-bin.tar.gz
3.视频
01-Flume-介绍.mp4
02-Flume-概述–架构介绍.mp4
03-Flume-入门之安装部署.mp4
04-Flume-入门案例01-配置文件编写.mp4
05-Flume-入门案例-02-配置文件编写.mp4
05-Flume-入门案例01-测试.mp4
06-Flume-上午回顾.mp4
06-flume-入门案例-02 测试.mp4
07-Flume-进阶-Flume事务.mp4
08-Flume进阶-Agent内部原理.mp4
09-Flume-企业级案例-复制案例-配置文件编写.mp4
10-FLume-企业级案例-复制案例–测试.mp4
11-Flume-企业级案例-多路复用和拦截器–拦截器的编写.mp4
12-Flume-企业级案例-多路复用和拦截器-agent的配置文件编写.mp4
13-Flume-企业级案例-多路复用和拦截器的使用测试.mp4
14-Flume-企业级案例–聚合案例.mp4
15-Flume-监控.mp4
16-Flume-面试题.mp4
_new_1201-Flume-介绍.mp4
11Kafka
11Kafka.zip
1.笔记
Kafka3.x.xmind
尚硅谷大数据技术之Kafka-3.0.0-授课.docx
ppt
kafka在zookeeper中的内容.pptx
尚硅谷大数据技术之kafka - 分区策略-给定key值.pptx
尚硅谷大数据技术之kafka - 分区策略-给定分区号.pptx
尚硅谷大数据技术之kafka - 分区策略-默认Sticky.pptx
尚硅谷大数据技术之kafka - 分区策略.pptx
尚硅谷大数据技术之kafka.pptx
2.资料
kafka-3.0.0-src.tgz
kafka-3.0.0-src带注释.zip
kafka-eagle-bin-2.0.8.tar.gz
kafka_2.12-3.0.0.tgz
log4j2.xml
相关脚本
kafka.sh
xcall
xsync
zk.sh
day01
01-kafka–课程介绍.mp4
02-kafka-kafka介绍和消息队列特性介绍.mp4
03-kafka-概述–消息队列的两种模式.mp4
04-kafka-概述kafka基础架构.mp4
05-kafka-入门-kafka安装部署.mp4
06-kafka-入门-命令行操作.mp4
07-kafka-上午回顾.mp4
08-kafka-入门-群起脚本编写.mp4
09-kafka-生产者-流程介绍-.mp4
10-kafka-生产者-简单的异步发送.mp4
11-kafka-生产者-带回调函数的异步发送.mp4
kafka-demo.zip
day02
01-kafka-昨日回顾.mp4
02-kafka-生产者–同步发送及同步发送和异步发送对比.mp4
03-Kafka-生产者-分区策略介绍及演示.mp4
04-kafka-生产者-分区源码增值服务.mp4
05-kafka-生产者-自定义分区器的编写和测试.mp4
06=kafka-生产者-提高吞吐量.mp4
07-Kakfa-生产者-数据可靠性保证之ACK应答级别.mp4
08-kafka-生产者-数据可靠性保证-ACK应答机制的ISR队列及总结.mp4
09-kafka-生产者-ack测试.mp4
10-kafka-生产者-精准一次性之幂等性.mp4
11-kafka-生产者-精准一次性之事务.mp4
12-kafka-上午回顾.mp4
13-kafka-生产者-数据有序和数据乱序.mp4
14-kafka-kafkaBroker中zookeeper存储了什么内容.mp4
15-kafka-kafkaBroker中总体工作流程.mp4
16-kafka-kafkaBroker中leader副本选举演示.mp4
17-kafka-kafkaBroker的leader副本选举过程分析.mp4
18-kafka-kafka-Broker的副本之follower故障处理细节.mp4
19-kafka-kafka-Broker的副本之Leader故障处理.mp4
20-kafka-kafkaBroker-的文件存储机制.mp4
21-kafka-kafkaBroker的文件清理策略.mp4
kafka-demo.zip
day03
01-kafka-所有回顾.mp4
02-kafka-kafkaBroker–高效读写数据.mp4
03-kafka-消费者–消费方式.mp4
04-kafka-消费者-消费整体流程.mp4
05-kafka-消费者 - 消费者组原理介绍.mp4
06-kafka-消费者-消费者组初始化流程.mp4
07-kafka-消费者-消费者的详细消费流程介绍.mp4
08-kafka-消费者-一个消费者的代码编写.mp4
09-kafka-消费者-消费者组的代码编写和测试.mp4
10-kafka-消费者-消费者组分区分配介绍.mp4
11-kafka-消费者–分区分配策略之Range.mp4
12-kafka-消费者-分区分配策略之roundrobin.mp4
13-kafka-消费者–分区分配之sticky.mp4
14-kafka-消费者-上午回顾.mp4
15-kafka-消费者–消费者的offset的维护.mp4
16-kafka-消费者–消费者offset自动提交.mp4
17-kafka-消费者的手动提交.mp4
18-kafka-消费者–指定offset消费.mp4
19-kafka-消费者–漏消费和重复消费以及Consumer事务.mp4
20-kafka-消费者-数据积压问题.mp4
21-kafka-监控.mp4
22-kafka-kafka的kraft模式.mp4
12电商数据(数据采集)
01_文档
01_尚硅谷大数据项目之电商数仓(数据采集)之日志数据采集.docx
02_尚硅谷大数据项目之电商数仓(数据采集)之业务数据采集.docx
03_尚硅谷大数据项目之电商数仓(数据采集)之数仓数据同步策略.docx
ppt
尚硅谷大数据技术之Maxwell–MySQL从复制技术.ppt
尚硅谷大数据技术之Maxwell–MySQL从复制技术.pptx
图示
kafkaChannel的三种部署模式.drawio
业务数据全量同步脚本编写逻辑.drawio
数仓图示.drawio
日志采集回顾.drawio
拓展文档
02_尚硅谷大数据Hadoop多目录配置案例实操.docx
尚硅谷大数据技术之业务数建模工具chiner.docx
视频
collection_pro
collection_pro.zip
day01
01-采集项目–资料介绍.mp4
02-采集项目–数仓–数仓介绍.mp4
03-采集项目-数仓-数仓项目架构图示01-数据介绍及采集介绍.mp4
04-采集项目-数仓-数仓项目架构图示02数仓分层.mp4
05-采集项目-数仓-数仓项目架构图03-完整架构.mp4
06-采集项目-数仓-需求分析和技术选型.mp4
07-采集项目-数仓-数仓系统流程设计.mp4
08-采集项目-数仓-框架版本及appache框架版本的选择.mp4
09-采集项目-数仓-集群资源规划.mp4
10-采集项目-数仓-上午回顾.mp4
11-采集项目-用户行为数据-数据埋点.mp4
12-采集项目-用户行为数据–日志内容.mp4
13-采集项目-用户行为数据-日志格式.mp4
14-采集项目-服务器–虚拟机创建和系统安装-.mp4
15-采集项目-服务器–单机配置.mp4
16-采集项目–服务器-三台节点环境配置.mp4
17-采集项目-云服务器选购.mp4
18-虚拟机IP说明及VM软件虚拟网卡.mp4
day02
01-安装linux虚拟机系统的网络问题处理方案.mp4
02-采集项目-前日回顾.mp4
03-采集项目–基本环境准备–环境变量说明.mp4
04-采集项目-数据模拟.mp4
05-采集项目-环境准备–xcall脚本编写.mp4
06-采集项目–环境准备-xsync数据同步脚本编写.mp4
07-采集项目–hadoop–安装部署.mp4
08-采集项目–hadoop–启动及启动脚本的编写.mp4
09-采集项目-hadoop–2nn的bug处理.mp4
10-采集项目–hadoop的项目经验.mp4
11-采集项目-上午回顾.mp4
12-采集项目-zookeeper安装部署.mp4
13-采集项目–kafka安装部署.mp4
14-采集项目-flume安装部署.mp4
15-采集项目-flume项目经验.mp4
16-采集项目-日志采集flume–组件选择.mp4
17-采集项目–日志采集flume–配置文件编写.mp4
18-采集项目-日志采集flume–配置文件测试.mp4
19-采集项目-日志采集flume-拦截器编写.mp4
20-采集项目-日志采集flume-测试.mp4
21-采集项目-日志采集flume-f1.sh 脚本编写.mp4
collection_pro
collection_pro.iml
pom.xml
.idea
.gitignore
compiler.xml
deployment.xml
jarRepositories.xml
misc.xml
sshConfigs.xml
uiDesigner.xml
webServers.xml
workspace.xml
azure
azureSettings.xml
codeStyles
codeStyleConfig.xml
Project.xml
doc
conf
flume-tailDir-kafka.conf
shell
f1.sh
hadoop.sh
kafka.sh
lg.sh
xcall.sh
xsync.sh
zk.sh
src
main
java
com
atguigu
flume
interceptor
ETLInterceptor.java
JSONUtil.java
resources
test
java
target
collection_pro-1.0-SNAPSHOT-jar-with-dependencies.jar
collection_pro-1.0-SNAPSHOT.jar
archive-tmp
classes
com
atguigu
flume
interceptor
ETLInterceptor$Builder.class
ETLInterceptor.class
JSONUtil.class
generated-sources
annotations
maven-archiver
pom.properties
day03
01-采集项目–昨日回顾.mp4
02-采集项目-电商业务介绍及后台体验.mp4
03-采集项目-电商业务表结构介绍.mp4
04-采集项目-mysql数据库安装及gmall数据库初始化.mp4
05-采集项目-模拟数据.mp4
06-采集项目-数据建模工具介绍.mp4
07-采集项目-业务数据同步通道介绍.mp4
08-采集项目-业务数据同步工具-Maxwell介绍及原理.mp4
09-采集项目-上午回顾.mp4
10-采集项目-业务数据同步工具-Maxwell安装和部署配置.mp4
11-采集项目-业务数据同步工具-Maxwell增量数据同步测试.mp4
12-采集项目-业务数据同步工具-Maxwell的启动脚本编写.mp4
13-采集项目-业务数据同步工具-Maxwell的历史数据全量同步.mp4
14-采集项目-业务数据采集模块之业务数据增量同步到kafka.mp4
~uTorrentPartFile_257C1CF4.dat
day04
03-采集项目-离线数仓同步数据-用户行为数据同步–flume配置文件编写及测试.mp4
04-采集项目-离线数仓同步数据-用户行为采集–时间飘移问题解决拦截器编写及测试.mp4
05-采集项目-离线数仓同步数据-用户行为数据同步–拦截器选择的必要性生产中也得用.mp4
06-采集项目-离线数仓同步数据-用户行为数据同步–kafkachannel全链路配置.mp4
07-HQL16道之4.mp4
08-上午回顾.mp4
09-采集项目-离线数仓同步数据-用户行为数据同步全通路测试.mp4
10-采集项目-离线数仓同步数据-业务数据同步策略介绍.mp4
11-采集项目-离线数仓同步数据-业务数据同步工具-dataX的介绍.mp4
12-采集项目-离线数仓同步数据-业务数据同步工具-dataX安装.mp4
13-采集项目-离线数仓同步数据-业务数据同步工具-dataX之mysql道HDFS的同步.mp4
day05
01-采集项目–昨日回顾.mp4
02-采集项目-业务数据同步工具–datax的动态传参.mp4
03-采集项目-业务数据同步工具–dataX的同步HDFS数据到MySQL的案例.mp4
04-采集项目-业务数据同步工具–dataX同步mysql数据和HDFS数null值处理.mp4
05-采集项目-业务数据同步工具-datax优化.mp4
06-采集项目-业务数据全量同步–data的json文件生成脚本.mp4
07-采集项目-业务数据全量同步-datax的json文件批量生成脚本.mp4
08-采集项目-业务数据全量同步–dateX的全部同步脚本.mp4
09-采集项目-业务数增量同步-业务数据消费flume的配置文件编写及拦截其编写及测试.mp4
10-采集项目-业务业务数据同步–Maxwell数据飘移问题.mp4
11-采集项目-业务数据同步–业务数据消费flume启动关闭脚本编写.mp4
12-采集项目-业务数据同步–增量数据的首日全量.mp4
13-采集项目–最终–全部测试01.mp4
14-采集项目–最终–全部测试02.mp4
15-数据仓库准备.mp4
资料
22尚硅谷大数据(3.9)等多个文件
maven
1.2.62.zip
3.0.0.zip
shell
cluster.sh
f1.sh
f2.sh
hadoop.sh
kafka.sh
lg.sh
xcall.sh
xsync.sh
zk.sh
安装包
22尚硅谷大数据(3.9)等多个文件
1. linux
CentOS-7-x86_64-DVD-1804
CentOS-7-x86_64-DVD-1804.iso
sha1sum.txt
sha1sum.txt.asc
sha256sum.txt
sha256sum.txt.asc
1.jdk
jdk-8u212-linux-x64.tar.gz
2.hadoop
hadoop-3.1.3.tar.gz
hadoop-lzo-0.4.20.jar
hadoop-lzo-master.zip
3.flume
apache-flume-1.9.0-bin.tar.gz
4.kafka
kafkatool_64bit.exe
kafka_2.11-2.4.1.tgz
ZooInspector
build
zookeeper-dev-ZooInspector.jar
classes
org
apache
zookeeper
inspector
ZooInspector$1.class
ZooInspector.class
encryption
BasicDataEncryptionManager.class
DataEncryptionManager.class
gui
NodeViewersChangeListener.class
ZooInspectorAboutDialog$1.class
ZooInspectorAboutDialog.class
ZooInspectorConnectionPropertiesDialog$1.class
ZooInspectorConnectionPropertiesDialog$2.class
ZooInspectorConnectionPropertiesDialog$3.class
ZooInspectorConnectionPropertiesDialog.class
ZooInspectorIconResources.class
ZooInspectorNodeViewersDialog$1.class
ZooInspectorNodeViewersDialog$10.class
ZooInspectorNodeViewersDialog$11.class
ZooInspectorNodeViewersDialog$2.class
ZooInspectorNodeViewersDialog$3.class
ZooInspectorNodeViewersDialog$4.class
ZooInspectorNodeViewersDialog$5.class
ZooInspectorNodeViewersDialog$6.class
ZooInspectorNodeViewersDialog$7.class
ZooInspectorNodeViewersDialog$8.class
ZooInspectorNodeViewersDialog$9.class
ZooInspectorNodeViewersDialog.class
ZooInspectorNodeViewersPanel.class
ZooInspectorPanel$1.class
ZooInspectorPanel$2.class
ZooInspectorPanel$3.class
ZooInspectorPanel$4$1.class
ZooInspectorPanel$4.class
ZooInspectorPanel$5$1.class
ZooInspectorPanel$5.class
ZooInspectorPanel$6.class
ZooInspectorPanel$7.class
ZooInspectorPanel$8.class
ZooInspectorPanel$9.class
ZooInspectorPanel.class
ZooInspectorTreeViewer$1.class
ZooInspectorTreeViewer$2.class
ZooInspectorTreeViewer$3.class
ZooInspectorTreeViewer$4.class
ZooInspectorTreeViewer$ZooInspectorTreeCellRenderer.class
ZooInspectorTreeViewer$ZooInspectorTreeNode.class
ZooInspectorTreeViewer.class
nodeviewer
NodeViewerACL$1.class
NodeViewerACL.class
NodeViewerData$1.class
NodeViewerData$2.class
NodeViewerData.class
NodeViewerMetaData$1.class
NodeViewerMetaData.class
ZooInspectorNodeViewer.class
logger
LoggerFactory.class
manager
NodeListener.class
Pair.class
ZooInspectorManager.class
ZooInspectorManagerImpl$NodeWatcher.class
ZooInspectorManagerImpl.class
ZooInspectorNodeManager.class
ZooInspectorNodeTreeManager.class
ZooInspectorReadOnlyManager.class
retry
ZooKeeperRetry.class
config
defaultNodeVeiwers.cfg
icons
edtsrclkup_co.gif
file_obj.gif
fldr_obj.gif
info_obj.gif
jspdecl.gif
launch_run.gif
launch_stop.gif
new_con.gif
refresh.gif
save_edit.gif
search_next.gif
search_prev.gif
trash.gif
lib
jtoaster-1.0.4.jar
log4j-1.2.15.jar
TableLayout-20050920.jar
zookeeper-3.3.0.jar
licences
Apache Software Licence v2.0.txt
epl-v10.html
TableLayoutLicense.txt
src
build.xml
ivy.xml
.svn
entries
config
defaultNodeVeiwers.cfg
.svn
entries
icons
edtsrclkup_co.gif
file_obj.gif
fldr_obj.gif
info_obj.gif
jspdecl.gif
launch_run.gif
launch_stop.gif
new_con.gif
refresh.gif
save_edit.gif
search_next.gif
search_prev.gif
trash.gif
.svn
entries
props
edtsrclkup_co.gif.svn-work
file_obj.gif.svn-work
fldr_obj.gif.svn-work
info_obj.gif.svn-work
jspdecl.gif.svn-work
launch_run.gif.svn-work
launch_stop.gif.svn-work
new_con.gif.svn-work
refresh.gif.svn-work
save_edit.gif.svn-work
search_next.gif.svn-work
search_prev.gif.svn-work
trash.gif.svn-work
lib
jtoaster-1.0.4.jar
.svn
entries
props
jtoaster-1.0.4.jar.svn-work
licences
Apache Software Licence v2.0.txt
epl-v10.html
TableLayoutLicense.txt
.svn
entries
src
.svn
entries
java
.svn
entries
org
.svn
entries
apache
.svn
entries
zookeeper
.svn
entries
inspector
ZooInspector.java
.svn
entries
encryption
BasicDataEncryptionManager.java
DataEncryptionManager.java
.svn
entries
gui
about.html
NodeViewersChangeListener.java
ZooInspectorAboutDialog.java
ZooInspectorConnectionPropertiesDialog.java
ZooInspectorIconResources.java
ZooInspectorNodeViewersDialog.java
ZooInspectorNodeViewersPanel.java
ZooInspectorPanel.java
ZooInspectorTreeViewer.java
.svn
entries
nodeviewer
NodeViewerACL.java
NodeViewerData.java
NodeViewerMetaData.java
ZooInspectorNodeViewer.java
.svn
entries
logger
LoggerFactory.java
.svn
entries
manager
NodeListener.java
Pair.java
ZooInspectorManager.java
ZooInspectorManagerImpl.java
ZooInspectorNodeManager.java
ZooInspectorNodeTreeManager.java
ZooInspectorReadOnlyManager.java
.svn
entries
retry
ZooKeeperRetry.java
.svn
entries
5.zookeeper
apache-zookeeper-3.5.7-bin.tar.gz
6.mysql
mysql-5.7.28-1.el7.x86_64.rpm-bundle.tar
mysql-connector-java-5.1.27-bin.jar
7.hive
apache-hive-3.1.2-bin.tar.gz
8.mock
业务
application.properties
gmall.sql
gmall2020-mock-db-2021-11-14.jar
日志
application.yml
gmall2020-mock-log-2021-01-22.jar
logback.xml
path.json
9.chiner
CHINER-win_v3.5.7.exe
ezdml_setup_win64_v322.exe
13Scala
Scala.xmind
scala回顾.txt
代码
scala0323.zip
高阶函数练习.txt
回顾
安装包
jd-gui-1.6.6-min.jar
scala-2.12.10.tar.gz
scala-2.12.10.zip
笔记
尚硅谷大数据技术之Scala(V4.0).docx
视频
day01
spark0309.zip
day02
01-回顾.mp4
02-方法的定义.mp4
03-方法的简化.mp4
04-reduce.mp4
04-方法的参数.mp4
05-maxBy.mp4
05-函数的定义.mp4
06-中午分享点评.mp4
06-类和对象的创建.mp4
07-定义属性与方法.mp4
07-方法和函数的区别.mp4
08-构造器.mp4
08-高阶函数.mp4
09-高阶函数简化01.mp4
10-高阶函数简化02.mp4
11-匿名函数.mp4
12-柯里化.mp4
13-闭包.mp4
14-递归.mp4
15-map.mp4
day03
01-回顾.mp4
02-filter.mp4
03-groupBy.mp4
04-reduce.mp4
05-maxBy.mp4
06-类和对象的创建.mp4
07-定义属性与方法.mp4
08-构造器.mp4
09-封装.mp4
10-scala的object.mp4
11-伴生类与伴生对象.mp4
12-类型判断与转换.mp4
13-集合介绍.mp4
14-不可变数组.mp4
15-可变数组.mp4
16-中午sql点评.mp4
最大连续登录天数.txt
高阶函数练习.txt
day04
01-回顾.mp4
02-不可变List.mp4
03-可变List.mp4
04-不可变Set.mp4
05-可变Set.mp4
06-元组.mp4
07-不可变Map.mp4
08-可变Map.mp4
09-不可变队列.mp4
10-可变队列.mp4
11-集合常用属性.mp4
12-衍生集合.mp4
13-初级计算函数01.mp4
14-初级计算函数02.mp4
15-map.mp4
16-foreach.mp4
17-flatten.mp4
18-flatMap.mp4
19-filter.mp4
20-groupBy.mp4
21-四个聚合函数.mp4
22-wordcount.mp4
day05
01-回顾.mp4
02-模式匹配语法.mp4
03-匹配类型.mp4
04-匹配元组.mp4
05-匹配对象和样例类.mp4
06-偏函数.mp4
07-异常处理.mp4
08-隐式转换.mp4
09-需求1.mp4
10-需求2.mp4
11-需求3步骤.mp4
12-需求3.mp4
13-出租车司机sql.mp4
14-出租车司机代码实现.mp4
14Spark
hive-on-spark.zip
Spark(1).xmind
Spark.xmind
回顾
spark-core回顾.txt
spark-sql回顾.txt
spark入门回顾.txt
图片
安装包
22尚硅谷大数据(3.9)等多个文件.zip
笔记
01_尚硅谷大数据技术之Spark入门(V4.0).docx
02_尚硅谷大数据技术之SparkCore(V4.0).docx
03_尚硅谷大数据技术之SparkSQL(V4.0).docx
04_尚硅谷大数据技术之SparkStreaming(V4.0).docx
05_尚硅谷大数据技术之Spark内核(V4.0).docx
视频
day01
01-回顾.mp4
03-hadoop与spark历史.mp4
04-MR与spark对比.mp4
05-spark内置模块与特点.mp4
06-spark运行模式介绍.mp4
07-local模式.mp4
08-集群角色介绍.mp4
09-spark-standalone安装.mp4
10-standalone模式任务提交.mp4
11-历史服务器配置.mp4
12-master高可用.mp4
13-standalone client与cluster区别.mp4
14-standalone client与cluster流程.mp4
15-yarn模式任务提交.mp4
16-yarn模式历史服务器搭建.mp4
17-yarn client与cluster区别.mp4
18-yarn client与cluster运行流程.mp4
19-端口号与模式对比.mp4
20-sparksubmit常用参数.mp4
21-用户行为轨迹sql.mp4
22-用户行为轨迹分析代码.mp4
day02
01-回顾.mp4
02-RDD是什么.mp4
03-wordcount流程.mp4
04-RDD五大特性01.mp4
05-RDD五大特性02.mp4
06-通过本地集合创建RDD.mp4
07-创建RDD其他方式.mp4
08-通过本地集合创建RDD的分区数.mp4
09-读取文件创建RDD的分区数.mp4
10-衍生出的新RDD分区数.mp4
11-集合切片规划.mp4
12-map.mp4
13-flatMap.mp4
14-filter.mp4
day03
01-回顾.mp4
02-回顾2.mp4
03-mapPartitions.mp4
04-map与mapPartitions的区别.mp4
05-mapPartitionsWithIndex.mp4
06-groupBy.mp4
07-spark shuffle说明.mp4
08-distinct.mp4
09-coalesce.mp4
10-coalesce分区合并规则.mp4
11-repartition.mp4
12-sortBy.mp4
13-交集、差集、并集.mp4
14-zip.mp4
15-partitionBy.mp4
16-自定义分区器.mp4
17-groupByKey.mp4
18-reduceByKey.mp4
19-案例.mp4
20-reduceByKey实现案例.mp4
21-reduceByKey画图说明.mp4
day04
01-回顾.mp4
02-aggregateByKey.mp4
03-sortByKey.mp4
04-mapValues.mp4
05-join.mp4
06-cogroup.mp4
07-案例.mp4
08-collect.mp4
09-count、first、take.mp4
10-takeOrdered、countByKEY、save.mp4
11-foreach.mp4
12-foreachPartition.mp4
13-序列化原因.mp4
14-设置序列化方式.mp4
15-血统.mp4
16-依赖与stage切分.mp4
17-持久化原因与缓存.mp4
day05
01-回顾.mp4
02-checkpoint.mp4
03-缓存与checkpoint的区别.mp4
04-分区器.mp4
05-累加器.mp4
06-广播变量01.mp4
07-广播变量02.mp4
08-实战-数据与需求介绍.mp4.fiq
09-方案1-sql.mp4
10-方案1-代码.mp4
11-方案2-sql.mp4
12-方案2-代码.mp4
13-方案3.mp4
day06
01-回顾.mp4
02-什么是sparksql.mp4
03-为什么要有sparksql.mp4
04-sparksql原理.mp4
05-什么是DataFrame.mp4
06-什么是DataSet.mp4
07-sparksql特点.mp4
08-创建sparksession.mp4
09-通过toDF方法创建DataFrame.mp4
10-通过读取文件和衍生创建DataFrame.mp4
11-通过createDataFrame方法创建DF.mp4
12-创建DataSet.mp4
13-命令式.mp4
14-声明式.mp4
15-三者转换.mp4
16-自定义UDF函数.mp4
17-案例.mp4
day07
01-回顾.mp4
02-弱类型自定义UDAF函数.mp4
03-强类型自定义UDAF函数.mp4
04-读取文件.mp4
05-读取mysql第一种方式.mp4
06-中午分享说明.mp4
06-中午分享说明.mp4.fiq
07-读取mysql的第二种方式.mp4
08-读取mysql第三种方式.mp4
09-保存数据到文件.mp4
10-写入数据到mysql.mp4
11-spark整合hivemp4.mp4
12-idea操作hive.mp4
13-spark提交流程.mp4
14-spark通信架构.mp4
资料
spark-core数据.zip
15离线数仓
1.笔记
尚硅谷大数据项目之电商数仓(1用户行为采集平台)V5.0.docx
尚硅谷大数据项目之电商数仓(2业务数据采集平台)V5.0.docx
尚硅谷大数据项目之电商数仓(3数仓数据同步策略)V5.0.docx
尚硅谷大数据项目之电商数仓(4电商数据仓库系统)V5.2.docx
尚硅谷大数据项目之电商数仓(5可视化报表)V5.0.docx
2.资料
1.Spark.zip
2.Hive.zip
3.Data.zip
4.DataGrip.zip
5.DolphinScheduler.zip
6.Superset.zip
3.代码
json格式.txt
业务表.xls
导入数据到HDFS步骤.txt
4.图片
数仓架构.png
5.视频
day01
01-数仓的概念.mp4
02-数仓架构.mp4
04-json格式说明.mp4
05-采集回顾-日志格式.mp4
06-采集回顾-电商业务介绍.mp4
07-业务表介绍01.mp4
08-业务表介绍02.mp4
09-数据采集-同步策略回顾.mp4
10-数据采集-业务数据格式回顾.mp4
11-业务对表数据影响大概介绍.mp4
day02
01-回顾.mp4
02-建模的意义.mp4
03-实体关系与规范化.mp4
04-三范式.mp4
05-ER模式.mp4
06-维度模型.mp4
07-事实表介绍.mp4
08-事务型事实表的设计步骤和不足.mp4
09-周期型快照事实表.mp4
10-事实类型.mp4
11-累积型快照事实表.mp4
12-事实表总结.mp4
13-维度表设计.mp4
14-规范化与反规范化.mp4
15-维度变化.mp4
day03
01-回顾.mp4
02-多值维度.mp4
03-多值属性.mp4
04-数据仓库分层规划.mp4
05-数仓构建流程.mp4
06-数据调研.mp4
07-业务调研-业务对表数据的影响.mp4
08-明确作用域.mp4
09-构建业务总线矩阵.mp4
10-指标体系.mp4
11-hive安装与乱码说明.mp4
12-hive on spark环境搭建.mp4
13-datagrip说明.mp4
14-数据的导入.mp4
day04
01-回顾.mp4
02-ODS建模逻辑1.mp4
03-hive复杂数据类型回顾.mp4
04-ODS建模逻辑2.mp4
05-ods日志建表.mp4
06-ods全量表创建.mp4
07-ods增量表创建.mp4
08-ods层日志数据加载脚本.mp4
09-ods层业务数据加载脚本.mp4
10-维度建模-维度表回顾.mp4
11-商品维度建表.mp4
12-商品维度表数据加载.mp4
day05
01-回顾.mp4
02-优惠券维度表.mp4
03-活动维度表.mp4
04-地区维度表.mp4
05-日期维度表.mp4
06-用户维度表-首日加载.mp4
07-用户维度表-每日加载第一种方案.mp4
08-用户维度表-每日加载第二种方案.mp4
09-用户维度表正则匹配手机号和邮箱.mp4
10-dim层首日数据加载脚本.mp4
11-dim层每日数据加载脚本.mp4
12-维度建模-事务型事实表回顾.mp4
13-事实表建模.mp4
14-购物车事实表-首日.mp4
15-购物车事实表-每日.mp4
day06
01-回顾.mp4
02-下单事实表-字段来源介绍.mp4
03-下单事实表-首日数据加载.mp4
04-下单事实表-数据问题.mp4
05-下单事实表-每日数据加载.mp4
06-支付成功事实表-首日数据加载.mp4
07-支付成功事实表-每日数据加载.mp4
08-购物车周期快照事实表数据加载.mp4
09-优惠券支付使用事实表-首日数据加载.mp4
10-优惠券支付使用事实表-每日数据加载.mp4
11-添加收藏事实表-数据加载.mp4
12-购物车快照事实表问题补充.mp4
day07
01-回顾.mp4
02-交易流程累积事实表-首日加载.mp4
03-交易流程累积事实-每日加载.mp4
04-页面浏览事实表-数据加载.mp4
05-用户注册事实表-首日数据加载.mp4
06-用户注册事实表-每日数据加载.mp4
07-用户登录事实表-数据加载.mp4
day08
01-回顾.mp4
02-dwd层首日数据同步脚本.mp4
03-dwd层每日数据同步脚本.mp4
04-dws建表逻辑介绍01.mp4
05-dws建表逻辑介绍02.mp4
06-DWS建表建议.mp4
07-用户商品粒度下单最近1日数据加载.mp4
08-用户商品粒度下单最近1日每日数据加载.mp4
day09
01-回顾.mp4
02-交易域用户粒度加购最近1日首日数据加载.mp4
03-交易域用户粒度加购最近1日每日数据加载.mp4
04-交易域用户粒度支付最近1日数据加载.mp4
05-交易域省份粒度下单最近1日数据加载.mp4
06-交易域用户优惠券粒度支付使用最近1日数据加载.mp4
07-互动域商品粒度收藏商品最近1日数据加载.mp4
08-流量域会话粒度页面浏览最近1日数据加载.mp4
09-流量域访客页面粒度页面浏览最近1日数据加载.mp4
10-最近1日DWS汇总表首日数据加载脚本.mp4
11-最近1日DWS汇总表每日数据加载脚本.mp4
12-中午分享.mp4
13-交易域用户商品粒度订单最近N日数据加载.mp4
14-交易域省份粒度订单最近N日数据加载.mp4
15-dws层最近N日数据加载脚本.mp4
day10
01-交易域用户粒度订单历史至今汇总表首日数据加载.mp4
02-交易域用户粒度订单历史至今汇总表每日数据加载01.mp4
03-交易域用户粒度订单历史至今汇总表每日数据加载02.mp4
04-问题说明.mp4
05-用户域用户粒度登录汇总表数据加载.mp4
06-DWS层历史至今汇总表首日数据加载脚本.mp4
07-DWS层历史至今汇总表每日数据加载脚本.mp4
08-ads建表.mp4
09-各渠道流量统计01.mp4
10-各渠道流量统计02.mp4
day11
1.数仓建模1.mp4
10.求流失用户数.mp4
11.求回流用户数.mp4
12.ads_user_retention分析.mp4
13.ads_user_retention导入.mp4
14.ads_user_stats导入.mp4
15.ads_user_action导入.mp4
16.ads_new_order_user_stats导入.mp4
17.ads_order_continuously_user_count导入方法一.mp4
18.ads_order_continuously_user_count导入方法二.mp4
19.ads_order_continuoursly_user_count导入方法三.mp4
2.数仓建模2.mp4
20.ads_order_continuoursly_user_count断一天也算连续.mp4
21.ads_order_coutinuoursly_user_count导入方法四.mp4
22.ads_order_continuoursly_user_count连续两天断一天也算连续.mp4
23.SQL的运行顺序说明.mp4
24.ads_repeat_purchase_by_tm导入.mp4
25.ads_trade_stats_by_tm导入.mp4
26.ads_trade_stats_by_cate导入.mp4
27.ads_sku_cart_num_top3_by_cate导入.mp4
28.ads_sku_favor_count_top3_by_tm导入.mp4
29.ads_order_to_pay_interval_avg导入.mp4
3.数仓建模3.mp4
30.ads_order_by_province导入.mp4
31.ads_coupon_stats导入.mp4
32.ads层脚本处理.mp4
33.脚本调试.mp4
4.数仓建模4.mp4
5.业务介绍.mp4
6.答疑.mp4
7.ads_page_path分析.mp4
8.ads_page_path导入.mp4
9.答疑一.mp4
数仓建模.txt
课堂随笔.xlsx
DolphinScheduler
1.Flow和Task.mp4
10.创建租户.mp4
11.创建用户.mp4
12.告警组.mp4
13.worker分组.mp4
14.队列管理.mp4
15.Token管理.mp4
16.使用普通用户登入.mp4
17.运行Shell命令的工作流.mp4
18.工作流和实例的关系.mp4
19.带依赖关系的flow.mp4
2.工作流调度引擎介绍.mp4
20.带依赖关系的案例演示1.mp4
21.失败策略.mp4
22.重跑和恢复失败.mp4
23.设置自动重试次数.mp4
24.禁止执行task.mp4
25.配置环境变量.mp4
26.自定义变量.mp4
27.使用系统定义的时间变量.mp4
28.定时调度.mp4
29.邮件告警.mp4
3.DS架构介绍.mp4
30.调度脚本一.mp4
31.调度脚本二.mp4
4.进程规划.mp4
5.在Mysql中建库建表.mp4
6.DS的安装.mp4
7.调节虚拟机内存.mp4
8.安装的常见问题.mp4
9.DS进程的启动和停止.mp4
随笔.txt
HiveOnSpark优化
1.购买云主机.mp4
10.Map端聚合优化GroupBy语句.mp4
11.CommonJoin.mp4
12.MapJoin.mp4
13.BucketMapJoin.mp4
14.groupBy导致的数据倾斜的解决思路.mp4
15.Join导致的数据倾斜的解决思路.mp4
16.Map输入的Task个数.mp4
17.ReduceTask数量的跳转.mp4
18.其他优化.mp4
19.省流版总结.mp4
2.集群规划概述.mp4
3.配置NodeManger提供的资源.mp4
4.配置Container提供的资源上下限.mp4
5.Executor的cores数量.mp4
6.Executor的内存配置.mp4
7.Executor个数的静态分配和动态分配.mp4
8.Driver内存配置.mp4
9.Explain的解释.mp4
省流版.md
随笔.txt
离线数仓全流程调度
1.进度统计.mp4
10.编写flow.mp4
11.每日flow制作.mp4
12.每日调度完成.mp4
13.定时调度.mp4
2.为什么需要把数据导出到Mysql.mp4
3.建库建表.mp4
4.导出之HDFSReader.mp4
5.Mysql的三种写入方式.mp4
6.导出之MysqlWriter.mp4
7.编写导出脚本.mp4
8.调度之前的准备工作.mp4
9.调度前的注意事项.mp4
dws_to_ads.sh
gen_export_config.py
gen_export_config.sh
hdfs_to_mysql.sh
mysql.sql
MysqlInsert的三种方式.txt
process_1657087754035.json
离线数仓可视化
1.SuperSet介绍.mp4
2.安装Conda.mp4
3.安装SuperSet和启动.mp4
4.对接数据源.mp4
5.地图制作.mp4
6.旭日图制作.mp4
7.桑吉图制作.mp4
8.趋势线图制作.mp4
9.看板制作.mp4
尚硅谷大数据项目之电商数仓(4可视化报表)V5.1.docx
6.回顾
16Git
Git.xmind
git仓库地址.txt
Git
1.文档
尚硅谷大数据项目之GitV3.0.docx
2.资料
Git-2.35.1.2-64-bit.exe
sz220309warehouse
sz220309warehouse.zip
视频
1.Git的由来.mp4
10.IDEA配置Git.mp4
11.IDEA创建Git仓库.mp4
12.IDEA基本操作.mp4
13.版本切换.mp4
14.IDEA版本切换.mp4
15.文件比较.mp4
16.IDEA文件比较.mp4
17.忽略文件.mp4
18.Git自检1.mp4
19.分支介绍.mp4
20.分支操作.mp4
21.分支冲突解决.mp4
22.IDEA分支操作.mp4
23.Git远超协作流程.mp4
24.配置本机到远超仓库的免密登录.mp4
25.推送本地仓库到远超.mp4
26.克隆代码到本地.mp4
28.推送到远超拒绝案例.mp4
3.配置用户信息.mp4
30.PullRequest.mp4
31.fork.mp4
32.加入团队.mp4
33.IDEA集成Gitee.mp4
34.IDEA操作Gitee.mp4
35.IDEA处理推送冲突.mp4
36.Git自检下.mp4
37.克隆指定分支更正.mp4
4.初始化Git仓库.mp4
5.Git的工作原则.mp4
6.Git初体验.mp4
7.Git又体验.mp4
8.Git再体验.mp4
9.Git还体验.mp4
Git自检.md
17Redis
redis上课笔记.txt
1.文档
尚硅谷大数据技术之RedisV4.0.docx
2.资料
redis-6.2.1.tar.gz
RedisInsight-v2-win-installer.exe
3.视频
1.NoSQL的介绍.mp4
10.库操作.mp4
11.key操作.mp4
12.string类型操作.mp4
13.list类型操作.mp4
14.set类型操作.mp4
15.hash类型的由来.mp4
16.hash类型操作.mp4
17.zset类型操作.mp4
18.思考题.mp4
19.常见配置说明.mp4
2.Nosql数据库介绍.mp4
20.RDB的备份原理介绍.mp4
21.RDB的备份策略.mp4
22.RDB的特点.mp4
23.AOF的备份原理介绍.mp4
24.AOF的备份策略.mp4
25.AOF的优缺点.mp4
26.备份的选择.mp4
27.Jedis操作.mp4
3.Redis的介绍.mp4
4.Redis的应用场景.mp4
5.Redis的安装.mp4
6.MapReduce说明.mp4
7.配置RedisServer的绑定的IP.mp4
8.启动服务端和客户端.mp4
9.停止服务端和客户端.mp4
settings.xml
省流版.md
18.ES
1.文档
尚硅谷大数据技术之ElasticSearchV2.1.docx
2.资料
elasticsearch-7.8.0-linux-x86_64.tar.gz
elasticsearch-analysis-ik-7.8.0.zip
ES练习空白.md
kibana-7.8.0-linux-x86_64.tar.gz
视频
1.关系型数据库不适合检索.mp4
10.ES的启动.mp4
11.Kibana的安装.mp4
12.ES中的数据类型.mp4
13.ES中集群状态查看命令.mp4
14.Index操作之查看.mp4
15.Index操作之手动创建.mp4
16.Index操作之CRUD.mp4
17.数据CRUD.mp4
18.切词操作.mp4
19.DSL练习之准备数据.mp4
2.检索框架介绍.mp4
20.查询的两种方式.mp4
21.DSL语法简介.mp4
22.DSL练习.mp4
23.聚合的语法格式.mp4
24.聚合练习.mp4
25.别名介绍.mp4
26.别名练习.mp4
27.模板操作.mp4
3.倒排索引.mp4
4.倒排索引工作原理.mp4
5.ES介绍.mp4
6.ES中的术语.mp4
7.REST.mp4
8.ES的安装和配置.mp4
9.Linux内核的配置.mp4
es.sh
ES练习空白.md
es随笔
19Hbase
1.文档
HBase图示.pptx
尚硅谷大数据技术之HBase(V4.2).docx
2.资料
apache-phoenix-5.0.0-HBase-2.0-bin.tar.gz
hbase-2.0.5-bin.tar.gz
rowkey设计原则案例图示.zip
Day02
1.HBase的读流程.mp4
10.删除操作.mp4
11.预分区操作.mp4
12.如何让rowkey散列.mp4
13.Rowkey设计的原则.mp4
14.Rowkey设计案例上.mp4
15.Rowkey设计案例下.mp4
16.HBase进程内存配置.mp4
17.HBase的参数配置.mp4
18.Phoenix介绍.mp4
19.Phoenix的安装.mp4
2.Region的切分策略.mp4
20.Phoenix的启动.mp4
21.Phoenix的使用.mp4
22.Phoenix的注意事项.mp4
23.Phoenix的胖客户端.mp4
24.Phoenix的瘦客户端.mp4
25.二级索引是什么.mp4
26.创建二级索引.mp4
27.复合索引和包含索引.mp4
28.本地索引和全局索引.mp4
29.省流版.mp4
3.Connection介绍.mp4
4.创建和关闭连接.mp4
5.获取Table.mp4
6.封装构造Put的方法.mp4
7.Get查询.mp4
8.Put写入.mp4
9.Scan查询.mp4
Hbase上课笔记.txt
HBase随笔.txt
rowkey设计原则案例图示
rowkey设计原则1.jpg
rowkey设计原则2.jpg
rowkey设计原则3.jpg
rowkey设计原则4.jpg
rowkey设计原则5.jpg
rowkey设计原则6.jpg
rowkey设计原则7.jpg
rowkey设计原则8.jpg
HBase
1.HBase介绍.mp4
10.hbase shell操作之namespace操作.mp4
11.hbase shell操作之table操作.mp4
12.hbase shell操作之数据的增删改查.mp4
13.HBase在HDFS上的存储结构.mp4
14.两种进程的作用.mp4
15.一些概念的解释.mp4
16.RegionServer的结构介绍.mp4
17.RegionServer的写流程.mp4
18.memstore的flush时机.mp4
19.storefile的compact.mp4
2.HBase的官方解释.mp4
3.HBase多版本的解释.mp4
4.HBase的逻辑视图.mp4
5.HBase的术语.mp4
6.卸载HBase.mp4
7.HBase的安装.mp4
8.HBase的群起和群停.mp4
9.重装HBase.mp4
hbase随笔.txt
20Spark实时项目
尚硅谷大数据项目之Spark实时项目V3.2.docx
1.课件
Spark实时项目精确一次性消费.pptx
Spark实时项目需求求解图示.pptx
尚硅谷大数据技术之SparkStreaming(V4.1).docx
尚硅谷大数据项目之Spark实时项目V3.2.docx
2.资料
2.资料.zip
视频
day01
1.SparkStreaming的介绍.mp4
10.SparkStreaming的编程一般过程.mp4
11.SparkStreaming从Kafka消费数据编程.mp4
12.KafkaTool的使用.mp4
13.重装Kafka.mp4
14.WordCount体验.mp4
15.有状态的计算.mp4
16.transform.mp4
17.window操作.mp4
18.reduceByKeyAndWindow.mp4
19.saveAsTextFiles.mp4
2.流式处理和批处理.mp4
20.foreachRDD.mp4
3.SparkStreaming的架构.mp4
4.准实时.mp4
5.Spark的优势.mp4
6.SparkStreaming的特点.mp4
7.直连模式和接收器模式.mp4
8.SparkStreaming编程的一般流程.mp4
9.构造StreamingContext.mp4
offsetexplorer_64bit.exe
随笔.txt
SparkStreaming精确一次性消费
1.SparkStreaming回顾.mp4
10.省流版上午.mp4
11.ExactlyOnce实现方式一.mp4
12.借助事务实现精确一次.mp4
13.事务输出案例建表完成.mp4
14.事务输出案例查询Mysql中的偏移量.mp4
15.事务输出案例编写输出流程.mp4
16.事务输出案例编写事务和调试.mp4
17.不同的计算场景选择不同的精确一次实现方式.mp4
18.Tuple遍历.mp4
19.ConsumerRecord的key.mp4
2.Join操作.mp4
3.消费语义.mp4
4.at most once丢数据演示.mp4
5.at least once编码.mp4
6.代码运行的位置.mp4
7.at least once保证数据不丢.mp4
8.获取偏移量的注意事项.mp4
9.提交偏移量的注意事项.mp4
SparkStreaming省流版.txt
SparkStreaming精确一次性消费省流版.md
类型提示.jpg
Spark实时项目
Day01
1.SparkStreaming项目介绍.mp4
10.KafkaProducerUtil.mp4
11.设置自动创建的topic的参数.mp4
12.log数据模拟.mp4
13.realtimesparkstreaming模块创建.mp4
14.控制抽象.mp4
15.抽取BaseApp.mp4
16.DStreamUtil.mp4
17.测试BaseApp.mp4
18.LogDiversionApp上.mp4
19.问题答疑一部署的集群地址怎么写.mp4
2.SparkStreaming架构介绍.mp4
20.问题答疑二Producer单例和非单例的区别.mp4
21.JSON数据处理案例.mp4
22.分流App完成.mp4
3.SparkStreaming项目技术介绍.mp4
4.SparkStreaming项目模块介绍.mp4
5.创建父工程引入依赖.mp4
6.创建common模块.mp4
7.common模块工具类开发任务.mp4
8.PropertiesUtil.mp4
9.RedisUtil.mp4
课堂随笔.txt
Day02
1.进度统计.mp4
10.历史批次去重.mp4
11.写入HBase.mp4
12.写入redis和测试.mp4
13.可视化hbase方案的选择.mp4
14.使用hive映射hbase.mp4
15.使用superset对接hive.mp4
16.可视化.mp4
17.Canal的介绍.mp4
18.Canal的安装和配置.mp4
19.模拟业务数据.mp4
2.LogDivesion修改.mp4
20.对业务数据库开启binlog记录.mp4
20220719_102604.mp4
20220719_103522.mp4
21.编写CanalClient拉取数据.mp4
22.解析Message.mp4
3.DAU需求介绍.mp4
4.DAU计算思路.mp4
5.封装StartLog.mp4
6.封装日期格式化工具类.mp4
7.封装StartLog下.mp4
8.同批次去重.mp4
9.Redis中K-V的设计.mp4
[feiq]2.LogDivesion修改.mp4
可视化hbase随笔.txt
Day03
1.进度统计.mp4
10.预警需求之生成预警日志.mp4
11.预警需求之写入ES.mp4
12.预警需求测试.mp4
13.预警需求可视化之创建索引模式.mp4
14.预警需求可视化之可视化.mp4
15.几个问题的解释.mp4
16.预警需求数据漂移问题解决思路.mp4
2.GMV需求之建表.mp4
3.GMV之创建JDBCUtil.mp4
4.GMV之封装Bean.mp4
5.GMV之计算GMV.mp4
6.GMV之测试.mp4
7.GMV之可视化.mp4
8.预警需求之介绍.mp4
9.预警需求之过滤得到预警的设备.mp4
Day04
1.购物明细需求讲解.mp4
10.购物明细之关联维度.mp4
11.购物明细之写入ES.mp4
12.购物明细之面板创建.mp4
17.设置缓存中数据的过期时间.mp4
2.购物明细之采集数据.mp4
20220722_102855.mp4
3.购物明细之事实表Join.mp4
4.购物明细之模拟网络延迟数据关联不上.mp4
5.购物明细之无法Join的原因.mp4
6.购物明细之无法Join的解决办法.mp4
7.购物明细之如何缓存数据.mp4
8.购物明细之处理OrderInfo.mp4
21项目实战
在线教育日志及原始表结构说明文档.docx
在线教育离线数仓任务书.docx
大数据设计方案V1.0(1).docx
购买阿里云.mp4
00、无视频自己实现
220309
在线教育参考资料
5个节点电商数仓(1用户行为采集平台).docx
5台节点电商数仓(2业务数据采集平台).docx
5台节点电商数仓(3电商数据仓库系统).docx
8个节点电商数仓(1用户行为采集平台).docx
8台节点电商数仓(2业务数据采集平台).docx
8台节点电商数仓(3电商数据仓库系统).docx
大数据设计方案V1.0.docx
尚硅谷大数据之数仓流程规范.docx
尚硅谷大数据文档格式模板.docx
时间安排规划图.jpg
数据生成器data_mocker
application.yml
application.yml.bak
edu0222.sql
edu2021-mock-2022-06-14.jar
logback.xml
path.json
文档
在线教育日志及原始表结构说明文档.docx
在线教育离线数仓任务书.docx
22Flink
flink.xmind
0309Flink优化
1.笔记
尚硅谷大数据技术之Flink优化_V2.0.docx
2.资料
Flink命令说明.txt
gcviewer-1.36.jar
3.代码
flink-tuning.zip
4.视频
1.文档
01_尚硅谷大数据之Flink.docx
2.数据
2.数据.zip
3.安装包
Another-Redis-Desktop-Manager.1.4.9.exe
flink-1.13.0-bin-scala_2.12.tgz
flink-1.13.0-src.tgz
netcat-win32-1.12.zip
4.代码
4.代码.zip
5.视频
day01
day01笔记.txt
Flink - 01.起源及简介.mp4
Flink - 02.Flink的应用场景.mp4
Flink - 03.有界无界数据、流处理批处理概念辨析.mp4
Flink - 04.flink典型应用场景.mp4
Flink - 05.flink与spark的对比.mp4
Flink - 06.第一个Flink代码-批处理执行wordcount.mp4
Flink - 07.使用流处理方式处理有界流数据.mp4
Flink - 08.使用流处理方式处理无界流数据.mp4
Flink - 09.mp4
Flink - 09.windows下使用nc的简单说明.mp4
Flink - 10.local-cluster模式.mp4
Flink - 11.Standalone下的会话模式部署.mp4
Flink - 12.flink作业的两种提交方式.mp4
Flink - 13.按资源占用区分的三种flink部署模式.mp4
Flink - 14.Yarn资源调度框架下的会话模式.mp4
Flink - 15.Yarn调度框架下的单作业模式.mp4
Flink - 16.Yarn框架下的应用模式.mp4
Flink - 17.部署模式的简单总结.mp4
Flink - 18.Standalone下的高可用设置.mp4
Flink - 19.Yarn模式下的高可用设置.mp4
Flink - 20.lambda表达式的写法.mp4
day02
Flink - 21.昨日知识点回顾.mp4
Flink - 22.运行时架构简介(1).mp4
Flink - 23.JobManager及角色介绍.mp4
Flink - 24.TaskManager介绍.mp4
Flink - 25.作业提交流程详解.mp4
Flink - 26.Yarn模式下作业提交流程详解.mp4
Flink - 27.数据流图.mp4
Flink - 28.程序最大并行度.mp4
Flink - 29.并行度设置的4种方法以及优先级别.mp4
Flink - 30.算子链与合并算子链.mp4
Flink - 31.断开禁用算子链(了解).mp4
Flink - 32.Flink中的作业图与执行图.mp4
Flink - 33.任务插槽与任务插槽的共享机制.mp4
Flink - 34.任务插槽与最大并行度的关系.mp4
Flink - 35.创建执行环境.mp4
Flink - 37.从HDFS读取数据.mp4
Flink - 38.从kafka读取数据.mp4
Flink - 39.自定义数据源.mp4
Flink - 40.Flink支持数据类型及泛型擦除.mp4
Flink - 41.一些问题答疑及map算子.mp4
Flink - 42.filter算子.mp4
Flink - 43.flatmap算子.mp4
Flink - 44.keyby算子.mp4
Flink - 45.keyBy源码分析.mp4
Flink - 46.sum和min聚合函数.mp4
Flink - 47.reduce聚合函数.mp4
keyBy源码分析.txt
day03
01_前面内容回顾.mp4
02_shuffle算子.mp4
03_其他重新分区的算子.mp4
04_不存在的split.mp4
05_connect算子.mp4
06_Union算子.mp4
07_idea的几个配置.mp4
08_Process_NoKey.mp4
09_Process_KeyBy.mp4
10_Rich函数的使用.mp4
11_Kafka_Sink.mp4
12_Redis_sink_string.mp4
13_Reids_sink_list.mp4
14_Redis_sink_set.mp4
15_Redis_sink_hash.mp4
16_有界流数据写入到es中.mp4
17_无界流数据写入到es中.mp4
18_自定义MysqlSink.mp4
19_jdbcSink.mp4
20_执行模式.mp4
day04
01_昨日内容回顾.mp4
02_PV的计算.mp4
03_PV的计算_2.mp4
04_UV的计算.mp4
05_app的市场行为统计.mp4
06_类似的计算_省略.mp4
07_对账功能实现分析.mp4
08_对账功能的具体实现.mp4
09_flink中窗口的理解.mp4
10-基于时间的三种窗口理解.mp4
11_基于时间的滚动窗口.mp4
12_基于时间的滑动窗口.mp4
13_基于时间的会话窗口.mp4
14_基于个数的滚动窗口.mp4
15_基于个数的滑动窗口.mp4
16_增量聚合_Reduce.mp4
17_增量聚合_Aggregate.mp4
18_处理函数的总结.mp4
19_没有keyBy的窗口.mp4
20_窗口旧的写法.mp4
day05
01_昨日内容回顾.mp4
02_事件时间的概念.mp4
03_水印的概念.mp4
04_水印的理解_1.mp4
05_水印的生产机制.mp4
06_水印的生产机制代码理解.mp4
07_迟到数据无法进入窗口.mp4
08_水印生成的源码.mp4
09_自定义水印.mp4
10_多并行度下水印的传递问题.mp4
11_数据倾斜导致的水印不更新_1.mp4
12)数据倾斜导致的水印不更新_2.mp4
13_允许迟到.mp4
14_侧输出流的第一个作用_装载迟到数据.mp4
15_侧输出流的第二个作用_数据的分流.mp4
16_八个process函数.mp4
17_基于处理时间的定时器.mp4
18_基于事件时间的定时器.mp4
19_定时器的练习.mp4
day06
01_昨日内容回顾.mp4
02_状态的概念.mp4
03_Flink状态的分类.mp4
04_Flink的管理状态的分类.mp4
05_算子状态的分类.mp4
06_算子状态_列表状态.mp4
07_KafkaConsume使用联合列表.mp4
07_监控状态的理解.mp4
08_算子状态_广播状态.mp4
08_键控状态_Value.mp4
09_键控状态_List.mp4
10_键控状态_Reduce.mp4
11_键控状态_Aggregate_1.mp4
12_键控状态_Aggregate_2.mp4
13_键控状态_Map.mp4
14_状态后端在1,13之后的分类.mp4
14_状态后端在1.13之前的分类.mp4
15_配置文件中设置状态后端.mp4
16_状态后端在代码中设置.mp4
day07
01_昨日内容回顾.mp4
02_状态的一致性.mp4
03_ckeckpoint的制作过程.mp4
04_barrier的对齐和不对齐.mp4
05_端端端的严格一次.mp4
06_端到端严格一次代码.mp4
07_端到端严格一次验证_1.mp4
08_消费者的隔离级别.mp4
09_从checkpoint恢复状态.mp4
10_savepoint.mp4
11_pv_1.mp4
12_pv_2.mp4
13_UV.mp4
14_热门商品TopN实现思路.mp4
15_TopN的计算具体实现.mp4
16_热门页面练习.mp4
未命名绘图.drawio
day08
01_昨日内容回顾.mp4
02_广告点击统计.mp4
03_恶意登录.mp4
04_订单实时监控.mp4
05_CEP介绍.mp4
06_CEP基本使用.mp4
07_模式循环性.mp4
08_条件.mp4
09_组合模式.mp4
10_循环模式的连续性.mp4
11_模式的可选性.mp4
12_模式组.mp4
13_WithIn.mp4
14_FlatSelect.mp4
未命名绘图.drawio
day09
01_昨日内容回顾.mp4
02_恶意登录.mp4
03_订单实时监控.mp4
04_flink_sql核心概念_动态表和连续查询.mp4
05_flink_table_api基本使用.mp4
06_flink_table_api基本使用_2.mp4
07_table_api读写文件.mp4
08_table_api读写kafka.mp4
09_使用sql语句查询表.mp4
10_使用sql读写文件.mp4
11_使用sql读写Kafka.mp4
12_upsert_kafka.mp4
13_在表中添加处理时间字段.mp4
14_流转成表的时候添加事件时间.mp4
15_在ddl中添加事件时间.mp4
未命名绘图.drawio
清除maven仓库.bat
day10
01_昨日内容回顾.mp4
02_table_api中使用分组窗口.mp4
03_在sql中使用分组窗口.mp4
04_TVF的介绍.mp4
05_tvf中的滚动和滑动.mp4
06_tvf中的累积窗口.mp4
07_tvf用在分组集中.mp4
08_table_Api中使用over窗口.mp4
09_sql中使用over窗口.mp4
10_读写hive.mp4
11_自定义函数介绍.mp4
12_自定义函数_scalar.mp4
12_自定义函数_Table_1.mp4
13_自定义汉是_Table_2.mp4
14_自定义函数_Aggregate.mp4
15_自定义函数_TableAggregate.mp4
正则表达式.mp4
day11
01_昨日内容回顾.mp4
02_窗口的划分.mp4
03_flink的sql客户端.mp4
04_TopN实现思路.mp4
04_窗口的划分.mp4
05_topN的计算.mp4
06_双流join_窗口join.mp4
07_双流join_interval.mp4
08_海量数据去重_1.mp4
09_布隆过滤器.mp4
10_布隆过滤器的使用.mp4
23Docker
docker.rar
视频
01_docker的简介.mp4
02_docker的三个基本概念.mp4
03_docker的安装.mp4
04_docker的安装.mp4
05_安装docjker的要求.mp4
06_镜像的基本操作.mp4
07_容器的基本操作.mp4
08_制作支持java开发的镜像.mp4
09_制作支持ssh连接的镜像.mp4
10_端口映射(1).mp4
10_端口映射.mp4
11_教学环境网络拓扑.mp4
12_注意事项.mp4
13_大数据集群构建脚本_1.mp4
14_容器的启动脚本.mp4
15_集群的使用演示.mp4
24实时数仓
24实时数仓.zip
视频
day01
01_课程文档介绍.mp4
02_数仓的概述.mp4
03_数仓建模理论回顾.mp4
04_数仓的设计.mp4
05_数仓的分层理论.mp4
06_日志数据采集.mp4
07_业务数据的采集.mp4
08_维度层的实现思路.mp4
09_idea中搭建flink开发环境.mp4
10_消费kafka_ods_db数据.mp4
11_封装能够消费topic的基类.mp4
12_数据的清洗_1.mp4
13_数据的清洗_2_解决bootstrap数据同步问题.mp4
数仓分层
day02
01_昨日内容回顾.mp4
02_初始化维度表的配置表.mp4
03_Flink_cdc的介绍.mp4
04_Flink_cdc的基本使用.mp4
05_Flink_cdc读取配置信息.mp4
06_Phoenix中建表_1.mp4
07_Phoenix中建表_2.mp4
08_Phoenix中建表_3_盐表.mp4
09_把数据信息和配置新发送到下游流中.mp4
10_过滤掉不需要的列.mp4
11_自定义Phoenix_sink_1.mp4
12_自定义Phoenix_sink_2.mp4
13_打包到linux执行.mp4
数仓分层
未命名绘图.drawio
day03
01_昨日内容回顾(2).mp4
02_未经加工的事务事实表需求分析.mp4
03_消费ods_log数据.mp4
04_一些问题.mp4
05_对日志数据做过滤.mp4
06_纠正新老客户.mp4
07_日志分流.mp4
08_分流后的数据写入到kafka中.mp4
09_打包到linux执行.mp4
10_UV明细的实现思路.mp4
11_UV详情的实现.mp4
12_打包到linux执行.mp4
day04
01_昨日内容回顾.mp4
02_跳出明细的实现思路.mp4
03_跳出明细的第一种解法.mp4
04_跳出明细的第二种解法.mp4
05_常规join_内连接.mp4
06_常规join_左连接.mp4
07_使用sql的方式消费left_join’数据.mp4
08_使用流的方式消费left_join数据.mp4
09_sql中的Interval_join.mp4
10_时态join.mp4
11_lookup_join.mp4
12_封装sql的baseapp.mp4
13_读取ods_db数据.mp4
14_加购表和字典表的join.mp4
15_加购明细表写入到Kafka中.mp4
day05
01_昨日内容回顾.mp4
02_交易域预处理表实现思路.mp4
03_过滤订单详情表数据.mp4
04_过滤订单表.mp4
05_过滤活动和优惠券表.mp4
day06
01_退单事务事实表实现思路.mp4
02_退单事务事实表.mp4
03_退款成功事务事实表.mp4
04_退款成功事务事实表实现.mp4
05_dwd层其他事务事实表.mp4
day07
01_dws层存储介质的选择.mp4
02_doris的简介.mp4
03_doris的架构.mp4
04_fe的安装和配置.mp4
05_be的安装和配置_1.mp4
05_be的安装和配置_2.mp4
06_用idea去连接fe.mp4
07_fe的扩容.mp4
08_be的扩容.mp4
09_数据划分中的几个基本概念.mp4
10_数据模型中的聚合模型.mp4
11_数据模型中的unique和duplicate.mp4
12_一键安装配置启动.mp4
13_引擎和Range分区.mp4
14_List分区.mp4
15_其他属性.mp4
15_分桶.mp4
day08
01_昨日内容回顾.mp4
02_Aggregate中的rollup.mp4
03_duplicate中的rollup.mp4
04_rollup的注意事项.mp4
05_物化视图.mp4
06_flink流的方式读写doris_1.mp4
07_flink流的方式写入json格式.mp4
08_flink流的方式写入RowData格式.mp4
09_flink流的方式写入POJO格式.mp4
10_关键词粒度统计窗口汇总表需求分析.mp4
11_消费流量域的页面日志.mp4
12_过滤出搜索记录.mp4
13_自定义分词函数_1.mp4
14_自定义分词函数_2.mp4
15_开窗聚合.mp4
16_最终结果写出到doris中.mp4
17_doris的时区问题.mp4
day09
01_昨日碰到的问题.mp4
02_版本渠道访客类型统计指标实现思路.mp4
03_封装可以消费多个topic的baseapp.mp4
04_解析各个流并union成一个流.mp4
05_开窗聚合.mp4
06_解决uv迟到问题.mp4
07_数据写出到doris中.mp4
08_主页和详情页独立访客_封装到bean中.mp4
09_开窗聚合.mp4
10_主页和详情独立访客数据写出到doris中.mp4
day10
01_昨日碰到的问题.mp4
02_昨日内容回顾.mp4
03_用户登录窗口需求分析.mp4
04_过滤所有登录记录.mp4
05_找到当日独立用户和7日回流用户.mp4
06_开窗聚合最后结果写出到Doris中.mp4
07_注册用户各窗口统计.mp4
08_加购独立用户数各窗口统计.mp4
09_支付成功各窗口统计实现思路.mp4
10_支付成功各窗口统计具体实现.mp4
11_数据去重的3中思路.mp4
12_补充维度的思路.mp4
13_按照订单详情id去重.mp4
14_数据封装到pojo中.mp4
15_针对sku_id进行分组开窗聚合.mp4
day11
01_昨日内容回顾.mp4
02_封装查询维度的工具类.mp4
03_工具类的测试.mp4
04_补齐所有维度信息.mp4
05_缓存优化之缓存选择.mp4
06_封装redis工具类型.mp4
07_封装DimUtil工具类_1.mp4
08_redis中数据结构的选择.mp4
09_封装DimUtil工具类型_2.mp4
10_测试缓存.mp4
11_更新缓存.mp4
12_异步优化_1.mp4
13_异步的具体实现.mp4
14_异步常见的问题.mp4
15_数据写出到doris中.mp4
16_省份粒度各窗口统计.mp4
day12
01_ads和可视化的介绍.mp4
02_sugar使用介绍.mp4
03_spring_boot项目的搭建.mp4
04_总的销售额.mp4
05_项目穿透.mp4
06_柱状图.mp4
07_饼图.mp4
08_折线图.mp4
09_字符云.mp4
10_分享.mp4
wyc.zip
25Cdh
01.尚硅谷大数据技术之CDH6.3.2安装(基于阿里云)-v1.5.docx
04.CDH6.3.2安装包
cdh6.3.2[1.93G]
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha1
CDH-6.3.2-1.cdh6.3.2.p0.1605554-el7.parcel.sha256
manifest.json
cm6.3.1[1.31G]
allkeys.asc
cloudera-manager-agent-6.3.1-1466458.el7.x86_64.rpm
cloudera-manager-daemons-6.3.1-1466458.el7.x86_64.rpm
cloudera-manager-server-6.3.1-1466458.el7.x86_64.rpm
cloudera-manager-server-db-2-6.3.1-1466458.el7.x86_64.rpm
enterprise-debuginfo-6.3.1-1466458.el7.x86_64.rpm
oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm
视频
03.CDH安装-环境准备2.mp4
04.CDH安装-依赖组件安装.mp4
05.CDH安装-启动server.mp4
06.CDH安装-启动server并部署集群.mp4
07.CDH安装-webui页面简介.mp4
08.CDH安装-配置集群.mp4
(无声音)云服务器购买与配置 01.mp4
(无声音)云服务器购买与配置 02.mp4
26实时实战
在线教育实时数仓任务书.docx
00、无视频自己实现
代码
文档
在线教育日志及原始表结构说明文档.docx
在线教育离线数仓任务书.docx
27Flink 优化
1.笔记
尚硅谷大数据技术之Flink优化_V2.0.docx
2.资料
Flink命令说明.txt
gcviewer-1.36.jar
3.代码
flink-tuning.zip
4.视频
0309Flink调优笔记.txt
checkpoint
TM内存模型
day01
01_课程介绍.mp4
02-资源调优-并行度的考虑.mp4
03-资源调优-TM的slot数考虑.mp4
04-资源调优-内存模型&内存考虑.mp4
05-资源调优-合理利用cpu.mp4
06-执行参数-watermark乱序程度.mp4
07-checkpoint-原理详解&总结.mp4
08-checkpoint-对齐&非对齐检查点.mp4
09-checkpoint-参数设置说明.mp4
10-checkpoint-答疑.mp4
11-上午回顾.mp4
12-checkpoint-怎么看ui.mp4
13-大状态调优-大状态的问题.mp4
14-大状态调优-状态后端回顾&checkpoint路径.mp4
15-大状态调优-rocksdb调优项.mp4
16-大状态调优-rocksdb调优演示.mp4
17-大状态调优-调优效果.mp4
18-Job调优-不使用uid更新代码的问题.mp4
19-Job调优-使用uid成功更新的演示.mp4
20-Job调优-链路延迟&对象重用.mp4
21-Job调优-细粒度滑动窗口问题.mp4
day02
00_课程回顾.mp4
01-checkpoint参数-触发周期演示.mp4
02-反压-原理的理解.mp4
03-反压-缓冲区.mp4
04-反压-现象及危害.mp4
05-反压-定位瓶颈节点.mp4
06-反压-常见原因.mp4
07-反压-分析方法.mp4
08-反压-项目出现反压的场景.mp4
09-数据倾斜-现象&原因.mp4
10-数据倾斜-数据源倾斜.mp4
11-数据倾斜-单表分组聚合(纯流式)倾斜.mp4
12-数据倾斜-单表分组聚合(开窗)倾斜.mp4
13-数据倾斜-项目中的倾斜.mp4
14-数据倾斜-扩展-key分布不均.mp4
15-扩展-keyby底层实现.mp4
16-FlinkSQL优化-minibatch&localglobal.mp4
17-FlinkSQL优化-精确去重倾斜&Filter语法.mp4
18-Flink与Kafka的生产经验.mp4
28面试大保健
28面试大保健.zip
29其它面试
309面试
简历第一节.mp4
简历第三节.mp4
简历第二节.mp4
简历第五节.mp4
简历第六节.mp4
简历第四节.mp4
Hal题打包
22尚硅谷大数据(3.9)等多个文件
Hql题打包
hive阶段的hql
手写HQL题目.docx
海哥HQL
尚硅谷大数据SQL题库 - 答案解析.docx
尚硅谷大数据SQL题库.docx
尚硅谷大数据之HiveSQL基础练习题-参考答案.docx
尚硅谷大数据之HiveSQL基础练习题.docx
端午给的hql
hivesql50道sql.txt
尚硅谷大数据SQL题库 - 中级45道(答案解析).docx
尚硅谷大数据SQL题库 - 初级50道(答案解析).docx
尚硅谷大数据SQL题库 - 高级58道(答案解析).docx
毕业2月班面试大保健
(修订版)狂野大数据-高薪面试宝典详细版_V10.0-V4.pdf
尚硅谷大数据技术之高频面试题8.0.15.docx
尚硅谷大数据技术之高频面试题8.0.6.docx
深圳校区大数据技术之企业真题V1.1.0.doc
海哥串讲
海哥串讲
01_面试大保健_linux_shell.mp4
02_面试大保健_hdfs .mp4
03_面试大保健_shuffle.mp4
04_面试大保健_yarn工作机制.mp4
05_面试大保健_yarn调度器.mp4
06_面试大保健_flume.mp4
07_面试大保健_kafka.mp4
08_面试大保健_hive.mp4
shuffle.png
yarn工作机制.png
尚硅谷大数据SQL题库 - 答案解析.docx
尚硅谷大数据SQL题库.docx
尚硅谷大数据之HiveSQL基础练习题-参考答案.docx
尚硅谷大数据之HiveSQL基础练习题.docx
面试大保健.txt
辅导老师,面试大礼包
02_1某985应届学生毕业45万年薪复习笔记.zip
02_2_某二本非计算机专业16年毕业,50万年薪大佬学习总结.zip
30 附送项目
103_尚硅谷大数据项目之用户画像2.0
画像物料
spark远程提交器.zip
平台数据库脚本.zip
新代码生成器.zip
机器学习模拟数据.zip
视频
clickhouse
1
10、 一些sql说明和导出数据.mp4
11、改表结构.mp4
12、高可用副本.mp4
13、分片集群介绍.mp4
1、clickhouse介绍.mp4
2、clickhouse的特点.mp4
3、clickhouse的安装启动.mp4
4、常用数据类型.mp4
5、常用数据类型.mp4
6、跳数索引.mp4
7、数据过期.mp4
8、replacingmergetree.mp4
9、summingMt.mp4
新建文件夹
2
2、分片副本不同机器问题.mp4
3、追查启动错误.mp4
4、分片的配置.mp4
5、clickhouse分布式表.mp4
6、改为单点.mp4
7、关于扩容balance的问题.mp4
画像
1
10、开发通用sql模块.wmv
1、画像简介.wmv
2、标签管理.wmv
3、画像平台的架构.wmv
4、演示系统.wmv
5、搭建平台.wmv
6、标签的录入.wmv
7、标签任务录入.wmv
8、任务流程.wmv
9、动态建表.wmv
9、搭建任务工程.wmv
2
10、连续值标签.wmv
11、宽表组合思路.wmv
12、代码读取定义建表.wmv
13、pivot介绍.wmv
14、pivot应用到需求.wmv
15、本地执行.wmv
16、发布运行.wmv
17、关于spark环境变量的问题.wmv
1、画像梳理.wmv
2、sql拼接完成.wmv
3、spark环境补充.wmv
4、本地调试.wmv
5、关于80端口占用的问题.wmv
6、打包.wmv
7、jar包上传.wmv
8、远程提交器.wmv
9、尝试调度运行.wmv
3
1、任务三导入clickhouse、建表.wmv
2、建表执行部分.wmv
3、导入数据完成.wmv
4、打包运行发布.wmv
5、作业.wmv
4
10、分群介绍.wmv
11、web开发介绍.wmv
12、springboot的helloworld.wmv
13、springboot接收参数.wmv
1、回顾.wmv
2、起因.wmv
3、bitmap介绍.wmv
4、bitmap与条件筛选.wmv
5、bitmap表的写入.wmv
6、bitmap查询.wmv
7、工程搭建.wmv
8、代码组合sql语句.wmv
9、运行调试代码.wmv
5
10、组合查询sql完整.wmv
11、写入clickhouse人群包.wmv
1、controller层.wmv
2、service层.wmv
3、mapper层.wmv
4、mybatis-plus.wmv
5、分群思路.wmv
6、controller.wmv
7、写入分群基本信息.wmv
8、bitmap查询sql.wmv
9、组合查询sql.wmv
6
10、关于误判.wmv
11、决策树特征权重准确率的打印.wmv
12、关于评估.wmv
13、生成新数据.wmv
1、挖掘与机器学习.wmv
2、机器学习的过程.wmv
3、决策树介绍.wmv
4、机器学习开发调度流程(重要).wmv
5、构建流水线label.wmv
6、构建流水线完成.wmv
7、实现训练过程.wmv
8、实现训练过程代码完成.wmv
9、观察预测结果.wmv
7
10、定义标签.wmv
11、预测阶段代码.wmv
12、完成标签的写入.wmv
13、添加挖掘标签任务.wmv
1、回顾.wmv
2、拟合与剪枝.wmv
3、挖掘标签开发流程.wmv
4、特征选取.wmv
5、特征提取sql1.wmv
6、特征提取sql2.wmv
7、特征提取sql3_加上label.wmv
8、模型训练代码.wmv
9、训练阶段完成.wmv
8
10、总结redis.wmv
11、总结web.wmv
12、总结机器学习.wmv
13、总结机器扩展.wmv
1、分群作业待办.wmv
2、储存入redis.wmv
3、储存入redis调试.wmv
4、更新人数1.wmv
5、预估人数.wmv
6、更新人群包.wmv
8、总结上.wmv
9、总结ck.wmv
课件
课件.zip
软件
clickhouse-client-21.4.6.55-2.noarch.rpm
clickhouse-common-static-21.4.6.55-2.x86_64.rpm
clickhouse-common-static-dbg-21.4.6.55-2.x86_64.rpm
clickhouse-server-21.4.6.55-2.noarch.rpm
Git-2.23.0-64-bit.exe
redis-6.0.8.tar.gz
Mindjet_MindManager_2016_Trial_64_破解版
Mindjet_MindManager_2016_Trial_64.exe
MindManager.exe.baiduyun.p.downloading
微软常用运行库合集 64位_2017.03.11(1).exe
验证码—必看.txt
104_尚硅谷大数据技术之机器学习和推荐系统
1.笔记
1.笔记.zip
2.资料
2.资料.zip
3.代码
01_算法代码_JupyterNotebook.zip
02_项目代码_MovieRecommendSystem.zip
4.视频
000_尚硅谷_机器学习和推荐系统_课程简介.wmv
II_电影推荐项目
037_尚硅谷_电影推荐系统_项目系统设计(上).wmv
038_尚硅谷_电影推荐系统_项目系统设计(中).wmv
039_尚硅谷_电影推荐系统_项目系统设计(下).wmv
040_尚硅谷_电影推荐系统_项目框架搭建.wmv
041_尚硅谷_电影推荐系统_数据加载模块(一).wmv
042_尚硅谷_电影推荐系统_数据加载模块(二).wmv
043_尚硅谷_电影推荐系统_数据加载模块(三).wmv
044_尚硅谷_电影推荐系统_数据加载模块(四).wmv
045_尚硅谷_电影推荐系统_数据加载模块(五).wmv
046_尚硅谷_电影推荐系统_统计推荐模块(上).wmv
047_尚硅谷_电影推荐系统_统计推荐模块(中).wmv
048_尚硅谷_电影推荐系统_统计推荐模块(下).wmv
049_尚硅谷_电影推荐系统_基于LFM的离线推荐模块(上).wmv
050_尚硅谷_电影推荐系统_基于LFM的离线推荐模块(中).wmv
051_尚硅谷_电影推荐系统_基于LFM的离线推荐模块(下).wmv
052_尚硅谷_电影推荐系统_ALS模型评估和参数选取(上).wmv
053_尚硅谷_电影推荐系统_ALS模型评估和参数选取(下).wmv
054_尚硅谷_电影推荐系统_实时推荐模块(一).wmv
055_尚硅谷_电影推荐系统_实时推荐模块(二).wmv
056_尚硅谷_电影推荐系统_实时推荐模块(三).wmv
057_尚硅谷_电影推荐系统_实时推荐模块(四).wmv
058_尚硅谷_电影推荐系统_实时推荐模块(五).wmv
059_尚硅谷_电影推荐系统_实时推荐模块测试.wmv
060_尚硅谷_电影推荐系统_基于内容推荐模块(一).wmv
061_尚硅谷_电影推荐系统_基于内容推荐模块(二).wmv
062_尚硅谷_电影推荐系统_基于内容推荐模块(三).wmv
063_尚硅谷_电影推荐系统_基于内容推荐模块(四).wmv
064_尚硅谷_电影推荐系统_实时系统联调测试(上).wmv
065_尚硅谷_电影推荐系统_实时系统联调测试(下).wmv
I_理论
001_尚硅谷_推荐系统简介_概述.mp4
002_尚硅谷_推荐系统简介_推荐系统算法简介.mp4
003_尚硅谷_推荐系统简介_推荐系统评测.mp4
004_尚硅谷_机器学习入门_数学基础(上).mp4
005_尚硅谷_机器学习入门_数学基础(下).mp4
006_尚硅谷_机器学习入门_机器学习概述.mp4
007_尚硅谷_机器学习入门_监督学习(上).mp4
008_尚硅谷_机器学习入门_监督学习(中).mp4
009_尚硅谷_机器学习入门_监督学习(下).mp4
010_尚硅谷_机器学习模型和算法_python简介.mp4
011_尚硅谷_机器学习模型和算法_python基础语法(上).mp4
012_尚硅谷_机器学习模型和算法_python基础语法(下).mp4
013_尚硅谷_机器学习模型和算法_线性回归(上).mp4
014_尚硅谷_机器学习模型和算法_线性回归最小二乘代码实现(上).mp4
015_尚硅谷_机器学习模型和算法_线性回归最小二乘代码实现(下).mp4
016_尚硅谷_机器学习模型和算法_线性回归(下).mp4
017_尚硅谷_机器学习模型和算法_线性回归梯度下降代码实现.mp4
018_尚硅谷_机器学习模型和算法_线性回归调用sklearn库代码实现.mp4
019_尚硅谷_机器学习模型和算法_K近邻.mp4
020_尚硅谷_机器学习模型和算法_K近邻代码实现(上).mp4
021_尚硅谷_机器学习模型和算法_K近邻代码实现(中)(1).mp4
021_尚硅谷_机器学习模型和算法_K近邻代码实现(中).mp4
022_尚硅谷_机器学习模型和算法_K近邻代码实现(下).mp4
023_尚硅谷_机器学习模型和算法_逻辑回归(上).mp4
024_尚硅谷_机器学习模型和算法_逻辑回归(下).mp4
025_尚硅谷_机器学习模型和算法_决策树.mp4
026_尚硅谷_机器学习模型和算法_K均值聚类.mp4
027_尚硅谷_机器学习模型和算法_K均值聚类代码实现(上).mp4
028_尚硅谷_机器学习模型和算法_K均值聚类代码实现(下).mp4
029_尚硅谷_推荐系统_推荐系统算法详解(一).mp4
030_尚硅谷_推荐系统_推荐系统算法详解(二).mp4
031_尚硅谷_推荐系统_推荐系统算法详解(三).mp4
032_尚硅谷_推荐系统_TF-IDF算法代码示例.mp4
033_尚硅谷_推荐系统_推荐系统算法详解(四).mp4
034_尚硅谷_推荐系统_推荐系统算法详解(五).mp4
035_尚硅谷_推荐系统_LFM梯度下降算法代码实现(上).mp4
036_尚硅谷_推荐系统_LFM梯度下降算法代码实现(下).mp4
105_尚硅谷大数据项目之电商推荐系统
1.笔记.zip
2.资料.zip
3.代码.zip
4.视频
01_尚硅谷_电商推荐系统_课程简介.mp4
02_尚硅谷_电商推荐系统_项目系统设计(上).mp4
03_尚硅谷_电商推荐系统_项目系统设计(中).mp4
04_尚硅谷_电商推荐系统_项目系统设计(下).mp4
05_尚硅谷_电商推荐系统_项目框架搭建.mp4
06_尚硅谷_电商推荐系统_数据加载模块(上).mp4
07_尚硅谷_电商推荐系统_数据加载模块(中).mp4
08_尚硅谷_电商推荐系统_数据加载模块(下).mp4
09_尚硅谷_电商推荐系统_统计推荐模块(上).mp4
10_尚硅谷_电商推荐系统_统计推荐模块(下).mp4
11_尚硅谷_电商推荐系统_基于LFM的离线推荐模块(上).mp4
12_尚硅谷_电商推荐系统_基于LFM的离线推荐模块(中).mp4
13_尚硅谷_电商推荐系统_基于LFM的离线推荐模块(下).mp4
14_尚硅谷_电商推荐系统_ALS模型评估和参数选择(上).mp4
15_尚硅谷_电商推荐系统_ALS模型评估和参数选取(下).mp4
16_尚硅谷_电商推荐系统_实时推荐模块(一).mp4
17_尚硅谷_电商推荐系统_实时推荐模块(二).mp4
18_尚硅谷_电商推荐系统_实时推荐模块(三).mp4
19_尚硅谷_电商推荐系统_实时推荐模块(四).mp4
20_尚硅谷_电商推荐系统_实时推荐模块(五).mp4
21_尚硅谷_电商推荐系统_实时推荐模块(六).mp4
22_尚硅谷_电商推荐系统_实时推荐模块测试.mp4
23_尚硅谷_电商推荐系统_实时系统联调(上).mp4
24_尚硅谷_电商推荐系统_实时系统联调(下).mp4
25_尚硅谷_电商推荐系统_基于内容的离线推荐模块(上).mp4
26_尚硅谷_电商推荐系统_基于内容的离线推荐模块(下).mp4
27_尚硅谷_电商推荐系统_基于ItemCF的离线推荐(上).mp4
28_尚硅谷_电商推荐系统_基于ItemCF的离线推荐(下).mp4
29_尚硅谷_电商推荐系统_项目总结和部署.mp4