数据科学理论与实践(第2版)/朝乐门朝乐门9787302531913清华大学出版社
¥
0.5
0.1折
¥
69.8
八五品
仅1件
作者朝乐门
出版社清华大学出版社
ISBN9787302531913
出版时间2019-09
装帧平装
开本其他
定价69.8元
货号9787302531913
上书时间2024-12-16
商品详情
- 品相描述:八五品
- 商品描述
-
作者简介
朝乐门,1979年生,中国人民大学数据工程与知识工程重点实验室、信息资源管理学院副教授,博士生导师;章鱼大数据首席数据科学家:中国计算机学会信息系统专委员会委员、ACM高级会员、国际知识管理协会正式委员、全国高校大数据教育联盟大数据教材专家指导委员会委员;获得北京市中青年骨干教师称号、国际知识管理与智力资本杰出成就奖、Emerald/EFMD国际杰出博士论文奖、国家自然科学基金项目优秀项目、中国大数据学术创新奖和中国大数据创新百人等多种奖励30余项。朝乐门是我国第一部系统阐述数据科学理念、理论、方法、技术和工具的重要专著一一《数据科学》(清华大学出版社,2016)的作者,也是数据科学与大数据技术专业第一个领域本体——DataScienceOntology研发团队的总负责人。
目录
第1章 基础理论
如何开始学习
1.1 术语定义
1.2 研究目的
1.3 研究视角
1.4 发展简史
1.5 理论体系
1.6 基本原则
1.7 相关理论
1.8 人才类型
如何继续学习
习题
参考文献
第2章 理论基础
如何开始学习
2.1 数据科学的学科地位
2.2 统计学
2.3 机器学习
2.4 数据可视化
如何继续学习
习题
参考文献
第3章 流程与方法
如何开始学习
3.1 基本流程
3.2 数据加工
3.3 数据审计
3.4 数据分析
3.5 数据可视化
3.6 数据故事化
3.7 数据科学项目管理
3.8 数据科学中的常见错误
如何继续学习
习题
参考文献
第4章 技术与工具
如何开始学习
4.1 数据科学的技术体系
4.2 MapReduce
4.3 Hadoop
4.4 Spark
4.5 NoSQL与NewSQL
4.6 R与Python
4.7 发展趋势
如何继续学习
习题
参考文献
第5章 数据产品及开发
如何开始学习
5.1 定义
5.2 主要特征
5.3 关键活动
5.4 数据柔术
5.5 数据能力
5.6 数据战略
5.7 数据治理
5.8 数据安全、隐私、道德与伦理
如何继续学习
习题
参考文献
第6章 典型案例及实践
如何开始学习
6.1 统计分析
6.2 机器学习
6.3 数据可视化
6.4 Spark编程
6.5 2012年美国总统大选
如何继续学习
习题
参考文献
附录A 本书例题的R语言版代码
附录B 数据科学的重要资源
附录C 术语索引
后记
内容摘要
本书重点讲解数据科学的核心理论与代表性实践,在编写过程中充分借鉴了国外著名大学设立的相关课程以及全球畅销的外文专著,而且也考虑到了国内相关课程定位与专业人才的培养需求。
全书包括数据科学的基础理论、理论基础、流程与方法、技术与工具、数据产品及开发、典型案例及实践和附录等。
本书的读者范围很广,可以满足数据科学与大数据技术、计算机科学与技术、管理工程、工商管理、
数据统计、数据分析、信息管理与信息系统等多个专业的教师、学生(含硕士生和博士生)的教学与自学需要。
主编推荐
(1)国家精品开放在线课程《数据科学导论》的配套教材(2)一本系统讲解全球范围内的数据科学的新理论与代表性实践的教材;
精彩内容
自第1版出版以来,本教材得到了国内外专家的高度评价。目前,国内多数高校的相关课程均选择本教材为指定教材或主要参考书。本书第2版中进行了如下修订。
(1) 调查研究国内外大数据与数据科学相关工作岗位的用人要求及岗位面试题,对第1版内容进行了删减与补充。例如,新增了Lambda架构、A/B测试、Tableau、VizQL技术、大数据/算法偏见、大数据算法与模型、Jupyter Notebook/Lab、Python编程等面试中常见的问题。同时,还补充了数据产品开发、Python/R数据分析等内容,力争使本教材具备更高的实用价值和更多的干货知识。
(2) 调查研究国内外大数据与数据科学相关的国际/国家标准、调研报告和理论研究现状,补充了必要的标准、报告和理论,如《信息技术 大数据 术语》(GB/T 35295—2017)、《信息技术 大数据 技术参考模型》(GB/T 35589—2017)、《信息技术服务 治理 第5部分: 数据治理规范》(GB/T 34960.5—2018)、《数据管理能力成熟度评估模型》(GB/T 36073—2018)以及来自Gartner、DataCamp、KDnuggets等专业机构的有名调查报告,力争全景展现国内外数据科学领域的重要理论与代表性实践。
(3) 在深入研究世界一流大学数据科学课程的教材建设、教学大纲和教学内容的基础上,广泛征求兄弟院校师生就本教材第1版的意见与建议,对本书内容进行了补充和调整,如全书例题采用Python和R双语言版本,并补充了一些经典小理论、案例及其数据科学的内在联系,如亚马逊预期货运(Amazons Anticipatory Shipping)、幸存者偏差(Survivorship Bias)、辛普森悖论(Simpsons Paradox)、大数据杀熟、Google图片搜索Idiot事件、Facebook -剑桥分析公司数据丑闻(FacebookCambridge Analytica Data Scandal)、P2DR模型和奥卡姆剃刀(Occams Razor),力争使本教材与世界很好大学接轨。
(4) 结合自己在中国人民大学开设的“数据科学”(本科)、“数据科学理论与实践”(硕士)、“信息分析前沿研究”(博士)课程以及建设国家精品开放在线课程“数据科学导论”的教学经验以及在企事业单位担任首席数据科学家和参与部分高校数据科学专业建设的经验,并结合自己在数据科学与大数据技术领域的学术研究,对第1版内容进行了调整与优化,突显了“数据产品开发”在数据科学教与学中的“抓手”地位,并按照本人首次提出的“开源课程倡议”,在GitHub上建立配套社区,与同行老师共同维护课程资源,使本教材的内容更加符合我国大数据人才培养的需求。
本书旨在系统讲解数据科学领域的经典理论与很好实践,满足不同层次读者的需求。因此,建议读者结合自己的教学或学习需要,对本书进行定制使用,参考方案如表1所示。
表1本教材的教学与学习建议
章名
导论类课程非导论类课程
非大数据类
专业大数据类
专业本科
低年级本科高年级
或硕士
第1章基础理论√√√√
第2章理论基础〖5〗√
第3章流程与方法〖3〗√√√
第4章技术与工具〖3〗√√
第5章数据产品及开发〖4〗√√
第6章典型案例及实践√√√√
注: 与数据科学相关的“导论类课程”有数据科学导论、大数据导论、数据科学与大数据技术导论等; “非导论类课程”有数据科学、数据科学理论与实践、数据科学原理与实践、数据科学方法与技术等; 常见的大数据类专业有数据科学与大数据技术、大数据管理与应用、大数据技术与应用和大数据分析等。
作者以本教材为基础,将提供MOOC公开课,帮助培养数据科学领域的人才。
朝乐门
2019年6月
— 没有更多了 —
以下为对购买帮助不大的评价