Python数据挖掘方法及应用――知识图谱(第2版)
全新正版 极速发货
¥
39.9
7.3折
¥
55
全新
仅1件
作者王术
出版社电子工业
ISBN9787121459696
出版时间2023-07
装帧其他
开本其他
定价55元
货号31811722
上书时间2024-06-07
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
王术,暨南大学伯明翰大学联合学院助理教授。比利时列日大学(与中国农业科学院联合培养)博士。英国伦敦大学国王学院数据科学硕士,华南华南农业大学经济学学士。研究领域为农业经济、环境经济和能源经济及数据科学等交叉学科的研究。曾受国家留学基金委资助公派留学。发表SCI及中文期刊十余篇,其中第1作者SCI一区论文5篇(分别发表于本专业国际顶级期刊)。编写并出版教材3部,掌握计算机编程语言与软件开发能力,精通R语言和Python数据分析。王斌会,暨南大学管理学院教授,博士生导师。国家和省级一流课程获得者,暨南大学“十佳教学名师”。从事数学、统计学及经济管理教学和科研工作37年,发表科研论文100余篇,完成50多项国家和省部级课题,获省部级以上科技进步奖3项,获省部级以上教学成果奖2项,一流课程4门,教学项目10余项。在数据分析和统计建模领域做了大量的基础性研究与开创性工作。出版相关学术专著3部,出版相关教材10余本,开发计算机软件10余套。精通大数据分析及统计语言的编程及数据处理云计算平台的开发。详情见其网站:www.yuque.com/rstat(www.jdwbh.cn/Rstat)
目录
目录
第1部分 数据挖掘基础
第1章 Python数据挖掘基础4
1.1 数据挖掘软件简介5
1.1.1 基本数据挖掘软件5
1.1.2 Python语言介绍6
1.2 Anaconda计算包9
1.2.1 Anaconda的使用9
1.2.2 Jupyter分析平台11
1.2.3 Spyder编程平台15
1.3 Python编程基础17
1.3.1 Python编程入门17
1.3.2 Python数据类型17
1.3.3 Python编程运算21
1.4 Python程序设计23
1.4.1 Python数据分析包24
1.4.2 数值分析包numpy26
1.4.3 基本绘图包matplotlib27
数据及练习134
第2章 数据挖掘的基本方法36
2.1 数据收集过程37
2.1.1 常规数据收集37
2.1.2 大数据的概念42
2.1.3 数据管理46
2.1.4 数据分析包pandas48
2.2 数据的描述分析56
2.2.1 基本统计量56
2.2.2 基于数据框的绘图61
2.3 数据的透视分析65
2.3.1 一维频数分析65
2.3.2 二维集聚分析67
2.3.3 多维透视分析72
数据及练习274
第3章 数据挖掘的统计基础76
3.1 均匀分布及其应用77
3.1.1 均匀分布的概念77
3.1.2 均匀分布的应用78
3.2 正态分布及其应用81
3.2.1 正态分布简介81
3.2.2 基本统计推断85
数据及练习387
第2部分 数值数据的挖掘
第4章 线性相关与回归模型90
4.1 两变量相关与回归分析91
4.1.1 两变量线性相关分析91
4.1.2 两变量线性回归模型93
4.2 多变量相关与回归分析95
4.2.1 多变量线性相关分析95
4.2.2 多变量线性回归模型97
数据及练习4107
第5章 时间序列数据分析110
5.1 时间序列简介111
5.1.1 时间序列的概念111
5.1.2 时间序列的模拟111
5.1.3 股票数据的分析113
5.2 时间序列模型的构建114
5.2.1 ARIMA模型114
5.2.2 ARMA模型的构建119
5.2.3 ARMA模型的建立与检验123
5.3 时间序列模型的应用129
5.3.1 模型的预处理130
5.3.2 模型的估计与检验131
5.3.3 模型的预测分析133
数据及练习5133
第6章 多元数据的统计分析135
6.1 综合评价方法136
6.1.1 综合评价指标体系136
6.1.2 综合评价分析方法138
6.2 主成分分析方法144
6.2.1 主成分分析方法的基本思想144
6.2.2 主成分的基本分析146
6.3 聚类分析方法151
6.3.1 聚类分析方法的概念151
6.3.2 系统聚类方法153
数据及练习6158
第3部分 文本数据的挖掘
第7章 简单文本处理方法162
7.1 字符串处理163
7.1.1 字符串的基本操作163
7.1.2 字符串查询与替换164
7.2 简单文本处理165
7.2.1 文本挖掘的概念165
7.2.2 文本数据的分词167
7.3 网络数据的爬虫170
7.3.1 网页的基础知识170
7.3.2 Python爬虫步骤171
7.3.3 爬虫方法的应用173
数据及练习7180
第8章 社会网络与知识图谱182
8.1 社会网络的初步印象183
8.1.1 社会网络分析概念183
8.1.2 社会网络分析包184
8.2 社会网络图的构建185
8.2.1 社会网络数据形式185
8.2.2 社会网络统计量188
8.2.3 美化社会网络图191
8.3 商业数据知识图谱应用194
8.3.1 关联规则分析概念入门194
8.3.2 关联规则分析基础应用195
8.3.3 关联规则可视化分析197
8.3.4 大样本关联规则实战199
数据及练习8203
第9章 文献计量与知识图谱204
9.1 文献计量研究的框架205
9.2 文献数据的收集与分析206
9.2.1 文献数据的获取206
9.2.2 文献数据的分析209
9.3 科研数据的管理与评价213
9.3.1 科研单位与项目分析213
9.3.2 科研期刊与作者分析215
9.3.3 图谱共现矩阵计算217
9.3.4 共现矩阵的网络图218
数据及练习9221
附录 资源共享平台与云计算平台222
附录A 资源共享平台222
A1 本书的学习网站222
A2 本书自定义函数223
附录B 云计算平台简介225
B1 课程学习平台225
B2 习题解答平台226
参考文献228
内容摘要
本书重点介绍Python语言在数据处理与数据挖掘方面的应用技巧,主要包括数据分析基础知识(数据收集与分析软件、数据挖掘的分析基础、简单数据的统计分析),数据分析高级方法(多元数据的综合分析、时序数据的模型分析),大数据基本处理方法(大数据分析基础应用、文献计量与科研评价、社会网络分析方法、数据分析编程平台)等内容。附录中还提供了Python数据分析相关方法和函数等,方便读者随时查看。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向数据分析的读者,能有效帮助读者提高数据处理与分析的水平,提升工作效率。书中的例子数据、习题数据及相关代码都可在作者的学习博客http://blog.leanote.com/DaPy下载使用,也可登录华信教育资源网http://www.hxedu.com.cn免费下载。
— 没有更多了 —
以下为对购买帮助不大的评价