作者简介
张晓东,硕士,深耕数据分析领域近十年;曾任商业分析师、大数据分析师、算法等职位;及参与近20个项目;曾受聘于呼和浩特市大数据管理局专家库专家,现就职于腾讯无线大连研发中心(世纪鲲鹏)。
目录
第1章 数据分析概述1
1.1 什么是数据挖掘2
1.2 数据挖掘与数据分析的关系6
1.3 数据挖掘与机器学习的关系8
1.4 机器学习算法简介13
第2章 数据思维19
2.1 数据思维认知21
2.2 数据思维认知的主观性与客观性26
2.3 数据挖掘“定律”29
第3章 逻辑回归37
3.1 逻辑回归基础:从线性回归到逻辑回归38
3.2 逻辑回归函数构建41
3.3 逻辑回归问题求解46
3.4 逻辑回归模型评估49
3.5 Python代码实现55
第4章 决策树65
4.1 决策树基础66
4.2 决策树算法70
4.3 Python代码实现86
第5章 朴素贝叶斯95
5.1 概率论基础96
5.2 从贝叶斯公式到朴素贝叶斯分类100
5.3 Python代码实现106
第6章 聚类分析113
6.1 聚类分析基础115
6.2 聚类算法121
6.3 Python代码实现128
第7章 关联规则137
7.1 关联规则基础140
7.2 关联规则算法143
7.3 Python代码实现147
第8章 人工神经网络151
8.1 人工神经网络基础153
8.2 BP(误差逆传播前馈)神经网络158
8.3 Python代码实现164
第9章 集成学习169
9.1 集成学习基础170
9.2 集成学习算法174
参考资料181
内容摘要
本书是一本介绍数据分析相关算法的学习指南,主要包括数据分析及数据挖掘相关概念介绍、数据思维及各种数据分析算法的原理及实现方法。本书的每个数据分析算法都介绍了数学原理、Python代码实现以及实战案例,内容丰富、容易理解。本书共9章,第1章介绍了数据挖掘与数据分析、机器学习之间的关系;第2章介绍了数据分析人员应该具备的数据思维,包括数据思维认知、数据挖掘“定律”;第3~9章介绍了各种数据分析算法的原理、实现方法及实战案例,其中包括逻辑回归、决策树、朴素贝叶斯、聚类分析、关联规划、人工神经网络、集成学习。 本书适合从事数据分析工作的读者自学,也可作为产品经理、运营人员、市场人员和对数据分析感兴趣的读者的参考用书。
主编推荐
"从数据思维到数据分析及挖掘算法
本书深刻阐述了数据思维的重要性,并将数据思维上升到哲学高度。"
媒体评论
"本书深刻阐述了数据思维的重要性,并将数据思维上升到哲学高度。在讲解数据分析技术之前,本书着重对比了数据分析与数据挖掘及机器学习的关系,并层层深入地讲解了机器学习涉及的理论和方法。本书对从数据处理到数据分析进行全流程说明,使读者在实操过程中,对所处阶段及上下文有框架性的认知,并可以有的放矢地进行数据分析。本书不失为数据分析领域的一本好书。
——内蒙古统计局大数据专家,田英辉
本书对经典的机器学习从理论到Python实践逐步深入讲解,使读者知其然也知其所以然。并且本书在理论讲解过程中,联系实际生活中的例子,使读者更容易理解;在Python算法实现过程中,对内置函数及属性进行逐一说明。对学术性或实践性的读者来说,本书是不错的“伴侣”。
——东北财经大学教授,博士生导师,韩超"
以下为对购买帮助不大的评价