作者简介
赵卫东,主要负责生和各类机器学习、大数据核心技术和人工智能(机器学习)(商务数据分析)等课程的教学,2011年纽约访问学者。人工智能(机器学习)被评为上海市精品课程以及CMOOC联盟线上线下混合式教学改革项目,获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括机器学习应用和大数据分析等。主持国家自然科学基金2项、国家重点研发计划子课题、上海市浦江人才以及企业合作课题等30多项目。已在Knowledge and InformatioSystems ,InformatioProcessing & Management,InformatioSystems Frontiers,Intelligent Data Analysis,Applied Intelligence等外刊物和学术会议发表100多篇。出版专著、教材《机器学习》《机器学习案例实战》《Python机器学习实战案例》等10多部。获得上海市2015年上海市科技进步二等奖。CDA三级认证数据科学家,腾讯云和百度云机器学习认证讲师。
目录
第 1章 常用机器学习平台
1.1 常用机器学习工具
1.2 TI-ONE平台概述
1.3 PySpark介绍
1.4 TI-ONE机器学习平台主要的组件
1.4.1 数据源组件
1.4.2 机器学习组件
1.4.3 输出组件
1.4.4 模型评估组件
第 2章 银行信用卡风险的可视化分析
2.1 Tableau简介
2.2 客户信用等级影响因素
2.3 客户消费情况对信用等级的影响
2.4 客户拖欠情况对信用等级的影响
2.5 欺诈客户特征分析
第3章 贷款违约行为预测
3.1 建立信用评估模型的必要性
3.2 数据准备与预处理
3.2.1 原始数据集
3.2.2 基础表数据预处理
3.2.3 多表合并
3.3 模型选择
3.3.1 带正则项的Logistic回归模型
3.3.2 朴素贝叶斯模型
3.3.3 随机森林模型
3.3.4 SVM模型
3.4 TI-ONE整体流程
3.4.1 登录TI-ONE
3.4.2 输入工作流名称
3.4.3 上传数据
3.4.4 数据预处理
3.4.5 拆分出验证集
3.4.6 拆分出测试集
3.4.7 模型训练和评估
3.5 客户细分
第4章 保险风险预测
4.1 背景介绍
4.2 数据预处理
4.2.1 数据加载与预览
4.2.2 缺失值处理
4.2.3 属性值的合并与连接
4.2.4 数据转换
4.2.5 数据标准化和归一化
4.3 多维分析
4.4 基于神经网络模型预测保险风险
4.5 使用SVM预测保险风险
第5章 银行客户流失预测
5.1 问题描述
5.2 数据预处理
5.2.1 非数值特征处理
5.2.2 数据离散化处理
5.2.3 数据筛选
5.2.4 数据分割
5.3 数据建模
5.3.1 决策树简介
5.3.2 构建决策树模型
5.4 模型校验评估
5.4.1 混淆矩阵评估
5.4.2 ROC曲线绘制
5.4.3 决策树参数优化
5.4.4 k折交叉验证
5.5 算法性能比较
第6章 基于深度神经网络的股票预测
6.1 股票趋势预测的背景和分析思路
6.2 数据提取
6.3 数据预处理
6.3.1 数据归一化
6.3.2 加窗处理
6.3.3 分割数据集
6.3.4 标签独热编码转化
6.4 模型训练
6.5 算法评估
6.6 算法比较
第7章 保险产品推荐
7.1 保险产品推荐的流程
7.2 数据提取
7.2.1 上传原始文件
7.2.2 读取训练集和检验集
7.3 数据预处理
7.3.1 去重和合并数据集
7.3.2 缺失值处理
7.3.3 特征选择
7.3.4 类型变量独热编码
7.3.5 数值变量规范化
7.3.6 生成训练集和检验集
7.4 构建保险预测模型
7.5 模型评估
第8章 零售商品销售预测
8.1 问题分析
8.2 数据探索
8.2.1 上传原始数据
8.2.2 数据质量评估
8.3 数据预处理
8.3.1 填补缺失值
8.3.2 修正异常值
8.3.3 衍生字段
8.3.4 类型变量数值化和独热编码化
8.3.5 数据导出
8.4 建立销售量预测模型
8.4.1 线性回归模型
8.4.2 Ridge回归模型
8.4.3 Lasso回归模型
8.4.4 Elastic Net回归模型
8.4.5 决策树回归模型
8.4.6 梯度提升树回归模型
8.4.7 随机森林回归模型
8.5 模型评估
第9章 汽车备件销售预测
9.1 数据理解
9.2 数据分析流程
9.2.1 设置数据源
9.2.2 数据预处理
9.2.3 建模分析与评估
9.3 聚类分析
第 10章 火力发电厂工业蒸汽量预测
10.1 确定业务问题
10.2 数据理解
10.3 工业蒸汽量的预测建模过程
10.3.1 设置数据源
10.3.2 数据预处理
10.3.3 建模分析与评估
第 11章 图片风格转化
11.1 CycleGAN原理
11.2 图片风格转化整体流程
11.2.1 设置数据源
11.2.2 数据预处理
11.2.3 模型训练
11.2.4 验证模型参数以及测试集
11.2.5 模型测试——转化图片风格
11.3 运行工作流
11.4 算法比较
11.4.1 CycleGAN与pix2pix模型
11.4.2 CycleGAN与DistanceGAN模型
11.5 使用TensorFlow实现图片风格转化
第 12章 人类活动识别
12.1 问题分析
12.2 数据探索
12.3 数据预处理
12.4 模型构建
12.5 模型评估
第 13章 GRU算法在基于Session的推荐系统的应用
13.1 问题分析
13.2 数据探索与预处理
13.2.1 数据变换
13.2.2 数据过滤
13.2.3 数据分割
13.2.4 格式转换
13.3 构建GRU模型
13.3.1 GRU概述
13.3.2 构建GRU推荐模型
13.4 模型评估
第 14章 人脸老化预测
14.1 问题分析与数据集简介
14.2 图片编码与GAN设计
14.3 模型实现
14.4 实验分析
第 15章 出租车轨迹数据分析
15.1 数据获取
15.2 数据预处理
15.3 数据分析
15.3.1 出租车区域推荐以及交通管理建议
15.3.2 城市规划建议
第 16章 城市声音分类
16.1 数据准备与探索
16.2 数据特征提取
16.3 构建城市声音分类模型
16.3.1 使用MLP训练声音分类模型
16.3.2 使用LSTM与GRU网络训练声音分类模型
16.3.3 使用CNN训练声音分类模型
16.4 声音分类模型评估
16.4.1 MLP网络性能评估
16.4.2 LSTM与GRU网络性能评估
16.4.3 CNN性能评估
参考文献
内容摘要
机器学习已经广泛地应用于各行各业,深度学习的兴起再次推动了人工智能的热潮。本书结合项目实践,首先讨论了主流机器学习平台的主要特点以及机器学习的实战难点。在此基础上,利用主流的机器学习开源平台TensorFlow、OpenVINO、PaddlePaddle等,通过17个实战案例,详细地分析了决策树、随机森林、支持向量机、逻辑回归、贝叶斯网络、聚类、卷积神经网络、循环神经网络、生成对抗网络等机器学习和深度学习算法在金融、零售、汽车、电力、交通、教育等典型领域的应用。
主编推荐
1.作者与多家知名企业合作,开展了多项机器学习数据分析的项目,积累了详细的分析案例。
2.作者是国内早期研究商务智能的学者之一(2001 年起),在国内也是较早开设商务智能等数据分析课程(2003 年起),有一定的影响力。
以下为对购买帮助不大的评价