021-53098865

18018650584


AI 机器学习应用实践
    发布时间: 2018-06-26 17:53    
AI 机器学习应用实践


一、 课程简介  
基于机器学习方法的大数据分析挖掘技术已经逐步地应用到新兴互联网企业(如电子商务网站、搜索引擎、社交网站、互联网广告服务提供商等)、银行金融证券企业、电信运营等行业,给这些行业带来了一定的数据价值增值作用。

互联网+大数据时代的到来,一方面为企业带来了潜在的巨大发展机遇,能有效推动企业的信息化转型升级和科学决策分析;另一方面由于企业缺乏大数据分析挖掘平台建设实施经验,对企业实行大数据商业智能分析决策的发展战略也带来了较大的挑战。

本次课程带大家领略大数据分析挖掘平台和机器学习技术应用实践,以 Spark 大数 据分析挖掘与机器学习平台的深度应用为主题,系统深入的讲解机器学习的算法和应用, 剖析大数据分析与挖掘平台的具体实现与大数据分析应用系统平台架构、大数据分析挖 掘解决方案应用案例。

结合业界使用最广泛的主流大数据分析与机器学习平台技术应用项目,重点剖析Spark 机器学习与分析挖掘平台进行建模应用,根据实际的应用需求实现大数据机器学习与分析挖掘模型,包括分类分析、聚类分析、预测分析、关联分析、协同过滤、精准推荐分析以及其它机器学习分析模型等,并结合实际的机器学习与数据分析挖掘项目的案例操作进行深度剖析和讲解。

此外,近两年来,随着深度学习的发展,机器学习的分支之一:深度学习技术已经逐步地应用到新兴互联网企业(如电子商务网站、搜索引擎、社交网站、互联网广告服务提供商等),应用在这些企业中的文本分析、图像识别、自然语言处理、社交用户网络行为分析等领域,给这些领域的应用和研究带来了很好的效果。

本课程还会讲解深度学习的模型,包括 CNN 卷积神经网络、RNN 循环神经网络(LSTM) 模型的算法及其应用、Connectionist Temporal Classification 算法及其应用,如GoogleNet,Fully Convolutional Networks 模型深入理解与应用,以及深度学习训练数据集的准备,深度学习的发展趋势,文字检测与识别算法的发展历程,以及文本分析在 深度学习技术下的新应用。在深度学习实践方面,本课程基于 Caffe 和 Tensorflow 深度学习平台开展实践教学,对算法的具体内涵和应用场景进行深度剖析和讲解。

本课程在实践方面,结合 Spark Mllib、DL4J 实现分布式并行深度学习平台的实践, 并结合 Caffe 和 TensorFlow 结合 Spark 平台,实现深度学习的并行处理与高精度处理。本课程采用技术原理与项目实战相结合的方式进行教学,在讲授原理的过程中,穿插实际的系统操作,本课程讲师也精心准备的实际的应用案例供学员动手训练。

二、 培训目标  
1. 本课程让学员充分掌握机器学习与大数据分析挖掘平台技术架构、大数据分析建模、大数据分析挖掘应用模型、国内外主流的大数据分析解决方案、以及基于Spark的机器学习平台在大数据分析在搜索引擎、日志分析、电商推荐、社交网络分析、金融客户分析、网页链接分析方面的应用案例。  

2. 本课程强调主流的大数据机器学习与分析挖掘算法技术的应用和分析平台的实施,让学员掌握主流的基于Spark的机器学习算法与平台构建大数据分析挖掘项目平台架构和 实际应用,并用结合实际的生产系统案例进行教学,讲解利用Spark机器学习库在不同场景下进行二次开发运用,实现大数据分析挖掘项目任务目标。  

3. 让学员掌握国内外业界基Spark机器学习的大数据分析挖掘平台项目的应用案例,以大作业的形式,根据需求建立挖掘模型实现数据挖掘平台的应用开发实训操作。  

4. 让学员掌握目前研究界和工业界使用的深度学习算法模型和实践应用平台Caffe和Tensorflow深度学习平台,部署这两个平台,并基于这两个平台运行深度学习算法模型(CNN、LSTM、CTC等),以及应用案例,包括文本分析和图片识别案例。  

三、 培训人群  
1. 大数据分析挖掘应用开发工程师  
2. 大数据分析挖掘项目的规划咨询管理人员  
3. 大数据分析挖掘平台架构师  

四、 培训特色  
定制授课+ 实战案例训练+ 互动咨询讨论,共 4-5 天,本课程采用机器学习算法模型的实践应用和具体的机器学习平台实战相结合的方式来讲解和实操。实验操作中采用目前业界主流的机器学习平台 Spark MLlib/Hadoop Mahout,深度学习平台选择 Caffe 和Tensorflow 作为深度学习的实验平台开展实践训练。

五、 详细大纲与培训内容  

时间 专题 详细内容 实践训练
第一天 机器学习基础
1. 机器学习发展历程  
2. 机器学习的应用场景  
3. 机器学习与统计分析
4. 无监督式学习概述  
5. 有监督式学习概述  
6. 半监督式学习概述  
7. 强化学习概述  


机器学习平台的解决方案和
应用案例
1. Hadoop Mahout/Spark MLib机器学习解决方案  

2. 基于Hadoop Mahout/Spark MLib大数据机器学习分析与数据挖掘平台的方案剖析  

3. 机器学习在电商平台、互联网金融平台中针对用户行为分析、客户分析、个性化推荐、广告精准投放、产品营销应用场景下常用的数据建模方法、建模过程、匹配算法、并行数据挖掘算法、技术原理及其项目应用案例剖析  


基于机器学习方法的数据分析挖掘项目的实施步骤
1. 机器学习大数据分析挖掘解决方案与传统分析方案的剖析比较  
2. 数据分析问题定义、数据整理、数据分析方法选择、数据提取整理、分析结果及结论、实施及建议措施、实施效果评估、项目报告整理与撰写
3. 机器学习数据挖掘过程模型  
4. SEMMA挖掘模型  
5. 5A挖掘模型  
6. CRISP-DM挖掘模型(重点)  
7. 机器学习数据挖掘过程中的:商业理解、数据理解、数据准备、模型建立、模型评估、模型发布  

机器学习项目实施步骤与方案  

第二天 机器学习分析建模技术应用

1. 决策树分析算法、模型设计及其应用  
2. 聚类分析算法、模型设计及其应用  
3. 分类分析算法,模型设计及其应用  
4. 关联规则算法、模型设计及其应用  
5. 贝叶斯算法、模型设计及其应用
6. 时间序列分析算法、模型设计及其应用  
7. 协同过滤与推荐挖掘算法、模型设计及其应用  
8. 基于Mahout机器学习平台的分析建模技术剖析,以及应用案例
9. 基于Spark MLib机器学习平台的分析建模技术剖析,以及应用案例  
10. 选择机器学习数据挖掘模型的方法  
11. 数据挖掘模型训练方法  
12. 调整机器学习算法模型的方法  
13. 机器学习分析模型评估方法  
 



聚类分析挖掘算法的实现原理和技术应用


14.机器学习之聚类分析算法模型及其在Hadoop Mahout和Spark MLlib 中的实现与应用实战,包括:
a) Canopy聚类(canopy clustering)
b) K均值算法(K-means clustering)  
 c) 模糊K均值(Fuzzy K-means clustering)  
 d) EM聚类,即期望最大化聚类(Expectation Maximization)
e) 以上算法在Hadoop Mahout和Spark MLib中的实现原理和实际
场景中的应用案例。  

基于Hadoop Mahout与Spark MLlib
实现聚类分析实验任务  


第三天 分类分析挖掘算法的实现原理和技术应用

15. 机器学习之分类分析算法模型及其在Hadoop Mahout和Spark MLlib 中的实现与应用实战,包括:
f) 决策树算法  
g) 逻辑回归算法(logistics regression)  
h) 贝叶斯算法(Bayesian与Cbeyes)  
i) 支持向量机(Support vector machine)  
j) 以上算法在Hadoop Mahout 和Spark MLlib中的实现原理和实际
场景中的应用案例。  


基于Hadoop Mahout与Spark MLlib
实现分类分析实验任务  

关联分析和推荐分析挖掘算法的实现原理和技术应用

16. 机器学习之关联分析和推荐分析算法模型及其在Hadoop Mahout和Spark MLlib中的实现与应用实战, 包括:
k) 关联规则挖掘算法、频繁模式挖掘算法(parallel FP Growth Algorithm)  
l) 推荐与协同过滤算法  
m) 关联规则挖掘(Apriori)算法及其应用  
n) 以上算法在Hadoop Mahout和Spark MLib中的实现原理和实际
场景中的应用案例

基于Hadoop Mahout和Spark MLlib实现关联分析与推荐系统实验任务  
第四天 深度学习概述
1. 神经网络与深度学习算法原理及应用  
2. 深度学习的发展历程  
3. 深度学习的应用场景  
4. 深度学习在Google、Facebook、IBM中的应用趋势和热点投资领域
5. 神经网络算法Neural Network的实现方法和挖掘模型应用  


深度学习模型及算法实现
6. 神经网络算法Neural Network的实现方法和挖掘模型应用  
7. 深度学习基础知识:人脑视觉机理和特征  
8. 深度学习的基本思想  
9. 浅层学习(Shallow Learning) 和深度学习(Deep  Learning)
10. 深度学习的训练过程
o) 传统神经网络的训练方法  
p) Deep Learning的训练方法
11. 深度学习的常用模型和方法
q) Auto Encoder自动编码器  
r) Sparse Coding稀疏编码
s) Restricted Boltzmann Machine(RBM)限制波尔兹曼机  
t) Deep Belief Networks深信度网络  
u) CNN(Convolutional Neural Network)卷积神经网络  
v) RNN(Recurrent Neural Network)循环神经网络模型  
w) LSTM(Long-Short Term Memory)RNN模型  
x) CTC(Connectionist Temporal Classification)序列标注模型  

深度学习算法模型及其应用案例分析  
基于Caffe的深度学习平台应用实践
12. 基于Caffe实现CNN模型应用,以及算法部署,算法调优,处理效率提升之道  
13. 基于Caffe实现RNN(LSTM)模型应用,以及算法部署,算法调优,处理效率提升之道  
14. 基于Caffe实现CTC模型应用,以及算法部署,算法调优,处理效率提升之道  

利用Caffe运行深度学习算法及应用案例  
第五天 基于Tensorflow的深度学习平台应用实践
15. 基于Tensorflow实现CNN模型应用,以及算法部署,算法调优,处理效率提升之道  
16. 基于Tensorflow实现RNN(LSTM)模型应用,以及算法部署,算法调优, 处理效率提升之道  
17. 基于Tensorflow实现CTC模型应用,以及算法部署,算法调优,处理效率提升之道  

利用Tensorflow 运行深度学习算法及应用案例
DL4J与Spark深度学习应用实践
18. 业界主流的Java深度学习平台DL4J(  DeepLearning4Java)
19. DL4J与GPU的交互  
20. DL4J深度学习算法的应用操作  
21. DL4J卷积网络进行图像分类  
22. DL4J的深度学习任务的并行处理机制  
23. Spark+DL4J的Java深度学习程序开发  
24. Spark+DL4J的Scala深度学习程序开发  

DL4J与Spark的集成深度学习平台的应用操作  
机器学习分析挖掘项目工程师的技能素养(可选)
25. 机器学习项目工程师的必备技术能力  
26. 机器学习项目工程师的业务储备  
27. 机器学习项目工程师的数据洞察能力  
28. 机器学习项目工程师的进阶路线  
29. 机器学习项目工程师的职业素养  


课程总结
30. 机器学习算法与模型讨论  
31. 机器学习项目方案讨论

交流讨论