数据科学导论 基于Python语言 微课版
全新正版 假一赔十 可开发票
¥
31.23
7.4折
¥
42
全新
库存11件
作者朝乐门著
出版社人民邮电出版社
ISBN9787115548207
出版时间2021-01
装帧平装
开本16开
定价42元
货号1202172167
上书时间2025-01-04
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
中国人民大学副教授,博士生导师;国家精品开放在线课程《数据科学导论》负责人;中国计算机学会信息系统专委员会委员、全国高校人工智能与大数据创新联盟专家委员会副主任、国际信息学院联盟iSchools数据科学课程专委会委员、全国高校大数据教育联盟大数据教材专家指导委员会委员、《计算机科学》执行编委;获得国家自然科学基金项目优秀项目、数据科学50人、全国高校大数据教育杰出贡献奖、IBM全球很好教师奖、中国大数据学术创新奖、中国大数据创新百人榜单、全国高校人工智能与大数据学术创新奖等多种奖励30余项。主持完成国家自然科学基金、国家社会科学基金等重要科学研究项目10余项;参与完成核高基、973、863、国家自然科学基金重点项目等10余项。
目录
第1章数据科学的基础理论1
1.1为什么要学习数据科学1
1.2数据科学的定义4
1.3数据科学的知识体系6
1.4数据科学的基本流程8
1.5数据科学与其他学科的区别11
1.5.1学科定位11
1.5.2研究视角13
1.5.3研究范式13
1.6数据科学的人才类型16
1.7数据科学的常用工具19
1.8数据科学的相关应用21
1.9继续学习本章知识23
习题26
第2章统计学与模型29
2.1统计学与数据科学29
2.1.1描述统计与推断统计30
2.1.2基本分析法和元分析法31
2.2统计方法的选择思路32
2.3数据划分及准备方法33
2.3.1自变量与因变量34
2.3.2数据抽样35
2.4参数估计与假设检验37
2.4.1参数估计37
2.4.2假设检验38
2.5常用统计方法及选择39
2.5.1相关分析39
2.5.2回归分析41
2.5.3方差分析41
2.5.4分类分析42
2.5.5聚类分析43
2.5.6时间序列分析44
2.5.7关联规则分析44
2.6统计学面临的挑战45
2.7Python编程实践45
2.8继续学习本章知识53
习题55
第3章机器学习与算法57
3.1数据科学与机器学习57
3.2机器学习的应用步骤60
3.3数据划分及准备方法61
3.4算法类型及选择方法62
3.5模型的评估方法64
3.6机器学习面临的挑战67
3.7Python编程实践68
3.8继续学习本章知识77
习题79
第4章数据可视化81
4.1数据科学与数据可视化81
4.2数据可视化的基本原则84
4.3视觉编码与数据类型84
4.4可视分析学87
4.5常用统计图表89
4.6数据可视化的发展趋势92
4.7Python编程实践93
4.8继续学习本章知识97
习题98
第5章数据加工100
5.1数据科学与数据加工100
5.2探索性数据分析101
5.3数据大小及标准化103
5.4缺失数据及其处理方法104
5.5噪声数据及其处理方法105
5.5.1离群点处理105
5.5.2分箱处理106
5.6数据维度及其降维处理方法108
5.6.1特征选择109
5.6.2主成分分析110
5.7数据脱敏及其处理方法110
5.8数据形态及其规整化方法112
5.9Python编程实践115
5.10继续学习本章知识121
习题122
第6章大数据技术124
6.1数据科学与大数据技术124
6.2Hadoop生态系统125
6.3大数据计算技术与Spark128
6.3.1大数据计算与Lambda架构128
6.3.2Spark的出现及其特点129
6.3.3Spark的计算流程131
6.3.4Spark的关键技术132
6.4大数据管理技术与MongoDB136
6.4.1关系数据库及其优缺点136
6.4.2NoSQL及其数据模型139
6.4.3CAP理论与BASE原则140
6.4.4分片技术与复制技术141
6.4.5MongoDB144
6.5大数据分析技术150
6.5.1Analytics3.0150
6.5.2Gartner分析学价值扶梯模型152
6.5.3数据分析中的陷阱152
6.6Python编程实践154
6.7继续学习本章知识165
习题167
第7章数据产品开发及数据科学中的人文与管理171
7.1数据产品开发及数据科学的人文与管理属性171
7.2数据产品及开发172
7.3数据科学的项目管理174
7.3.1数据科学项目中的主要角色174
7.3.2数据科学项目中的主要活动175
7.4数据能力176
7.4.1关键过程域177
7.4.2成熟度等级179
7.4.3成熟度评价181
7.5数据治理183
7.5.1主要内容183
7.5.2基本过程184
7.5.3参考框架185
7.6数据安全186
7.6.1信息系统安全等级保护186
7.6.2P2DR模型187
7.7数据偏见187
7.7.1数据来源选择偏见188
7.7.2数据加工和准备偏见189
7.7.3算法与模型选择偏见189
7.7.4分析结果的解读和呈现上的偏见189
7.8数据伦理与道德190
7.9继续学习本章知识191
习题191
术语索引193
参考文献198
内容摘要
本书重点讲解数据科学的核心理论与实践应用。全书共7章,主要介绍数据科学的基础理论、统计学与模型、机器学习与算法、数据可视化、数据加工、大数据技术、数据产品开发及数据科学中的人文与管理等内容。本书内容通俗易懂,深入浅出,便于读者理解。
本书可作为数据科学与大数据技术、大数据管理与应用、计算机科学与技术、管理科学与工程、工商管理、数据统计、数据分析、信息管理与信息系统、商业分析等多个专业的教材,也可作为数据科学从业人士的参考用书。
主编推荐
1.作者权威,编写经验丰富,且读者反映良好。
1.内容以实践为主,强化技能训练。 本书通过Python编程实践、书中代码演示和习题等,帮助读者快速掌握数据科学相关技能。
2.实例贴近实际,实用性强。本书案例皆与生活例子相关,更实用。
3.配套资源丰富。本书提供PPT、教学大纲、参考答案等资源,方便读者使用。
— 没有更多了 —
以下为对购买帮助不大的评价