大数据AI

七月在线spark大数据实战班

当下是大数据时代,为构建大数据平台,技术人员需要对分布式计算平台有一定深入的理解和应用。MapReduce作为一个经典的分布式计算框架,已经广为人知,且得到了广泛的应用,但MapReduce自身存在很多问题,包括迭代式计算和DAG计算等类型的数据挖掘与机器学习算法性能低下,不能很好地利用内存资源,编程复杂度较高等。为了克服MapReduce的众多问题,新型计算框架出现了。Spark已经被不少互联网公司采用,大部分数据挖掘算法和迭代式算法在逐步MapReduce平台迁移到Spark平台中,包括阿里巴巴,腾讯,百度,优酷土豆,360,支付宝等互联网公司已经在线上产品中使用spark,且取得了令人满意的效果,另外,部分省份的运营商也正在尝试使用spark解决数据挖掘和分析问题,部分银行,如工商银行,也正在尝试spark平台。因此中国软件产业培训网决定开展“Spark大数据处理与案例分析高级工程师”实战培训班,本次培训由北京天博信通科技有限公司具体承办,望相关单位收到通知后积极参加。相关培训事宜如下:

七月在线spark大数据实战班

培训时间及地点

2018年12月18日—12月22日   北京(18日全天报到)

课程目标

1、 深入理解Spark计算原理和编程模型,掌握Spark Core和SparkSql、SparkStreaming等上层系统的结合方式

2、深入掌握SparkCore、SparkSql使用调优技巧

3、深入掌握SparkStreaming和SparkMllib使用和调优技巧

4、 深入掌握Spark和其他组件的结合使用

5、 了解Spark与MapReduce分布式计算模型的区别和各自适合的使用场景。

6、 能够使用java、python和scala进行spark应用开发(如果要讲解三种语言开发spark,工作量会非常大,建议只讲解一种(可以根据企业的要求来定,)

7、熟练使用spark、spark streaming、spark SQL、spark mllib

8、深入了解spark在大型互联网的架构和使用场景

培训对象

各地企事业单位大数据产业相关人员,运营商 IT信息化和运维工程师相关人员,金融业信息化相关人员,或对大数据spark感兴趣的相关人员。

颁发证书

参加相关培训并通过考试的学员,可以获得:

1.工业和信息化部全国网络与信息技术项目管理中心颁发的-大数据高级工程师职业技能证书。该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。

注:请学员带一寸彩照2张(背面注明姓名)、身份证复印件一张。

培训特色

本课程基于最新的spark 2讲解,内容涵盖了企业中大数据处理的四大场景:

离线批处理、流式计算、SQL处理、机器学习。Spark是一个广泛应用的分布式内存计算模型,旨在大幅提升的迭代算法和交互低延迟数据挖掘的性能。Spark更适合于迭代运算比较多的ML和DM运算,one stack rule them all!Spark号称一个平台可以适合所有的应用,如SparkSql可以处理结构化数据,SparkStreaming旨在提供实时的计算能力,而SparkMllib则提供了丰富机器学习算法库。

Similar Posts

发表评论

邮箱地址不会被公开。 必填项已用*标注