• 【现货~】数据科学理论与实践(第2版) 朝乐门清华大学出版社
21年品牌 40万+商家 超1.5亿件商品

【现货~】数据科学理论与实践(第2版) 朝乐门清华大学出版社

现货二手 若套装 先联系客服确认,二手书无附赠品

1.31 0.2折 69.8 八五品

库存33件

湖南长沙
认证卖家担保交易快速发货售后保障

作者朝乐门

出版社清华大学出版社

ISBN9787302531913

出版时间2019-09

装帧平装

定价69.8元

货号9787302531913

上书时间2024-11-13

湖男书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:八五品
现货二手   二手书无附赠品
商品描述


基本信息


书名:数据科学理论与实践(第2版)


定价:69.80元


作者:朝乐门


出版社:清华大学出版社


出版日期:2019年09月 


ISBN:9787302531913


字数:


页码:


版次:


装帧:


开本:


商品标识:9787302531913


[chatu]


编辑推荐




内容提要



重点介绍数据科学中的新理论和代表性实践,填补数据科学与大数据技术专业的核心教材的空白。主要内容包括:基础理论(术语定义、研究目的、发展简史、理论体系、基本原则、数据科学家)、理论基础(数据科学的学科地位、统计学、机器学习、数据可视化)、流程与方法(基本历程、数据加工、数据审计、数据分析、数据可视化、数据故事化、项目管理)、技术与工具(技术体系、MapReduce、Hadoop、Spark、NoSQL与NewSQL、R与Python)、数据产品及开发(主要特征、关键活动、数据柔术、数据能力、数据战略、数据治理)、典型案例及实践等


目录



目录
第1章基础理论
图目录
图11DIKW金字塔模型3
表目录
表11结构化数据、非结构化数据与半结构化数据的区别与联系5
表12某数据科学家的画像(Profile)37
表21参数估计与假设检验的主要区别53
表22统计学与机器学习的术语对照表57
表23机器学习的相关学科61
表24已知6部电影的类型及其中出现的接吻次数和打斗次数64
表25已知电影与未知电影的距离64
表26分析学习和归纳学习的比较70
表27Anscombe的四组数据(Anscombes Quartet)76

目录



第1章基础理论


 如何开始学习


1.1术语定义


1.2研究目的


1.3研究视角


1.4发展简史


1.5理论体系


1.6基本原则


1.7相关理论


1.8人才类型


如何继续学习


习题


参考文献


第2章理论基础


 如何开始学习


2.1数据科学的学科地位


2.2统计学


2.3机器学习


2.4数据可视化


如何继续学习


习题


参考文献


第3章流程与方法


 如何开始学习


3.1基本流程


3.2数据加工


3.3数据审计


3.4数据分析


3.5数据可视化


3.6数据故事化


3.7数据科学项目管理


3.8数据科学中的常见错误


如何继续学习


习题


参考文献


第4章技术与工具


 如何开始学习


4.1数据科学的技术体系


4.2MapReduce


4.3Hadoop 


4.4Spark


4.5NoSQL与NewSQL


4.6R与Python


4.7发展趋势


如何继续学习


习题


参考文献


第5章数据产品及开发


 如何开始学习


5.1定义


5.2主要特征


5.3关键活动


5.4数据柔术


5.5数据能力


5.6数据战略


5.7数据治理


5.8数据安全、隐私、道德与伦理


如何继续学习


习题


参考文献


第6章典型案例及实践


 如何开始学习


6.1统计分析


6.2机器学习


6.3数据可视化


6.4Spark编程


6.年美国总统大选


如何继续学习


习题


参考文献


附录A本书例题的R语言版代码


附录B数据科学的重要资源


附录C术语索引


后记


 


 


 


 



图目录
图11DIKW金字塔模型3


图12数据与数值的区别4


图13数字信号与模拟信号4


图1—2015年全球数据规模及类型的估计6


图15大数据的特征7


图16大数据的本质8


图17人工智能、机器学习和深度学习的区别与联系10


图18DIKUW模型及应用11


图19数据洞见12


图110业务数据化与数据业务化12


图111常用驱动方式13


图112数据的层次


图113大数据生态系统示意图14


图114数据科学的新研究视角15


图115Gartner技术成熟度曲线16


图116数据科学的萌芽期(1974—2009年)17


图117数据科学的快速发展期(2010—2013年)18


图118数据科学的逐渐成熟期(2014年至今)19


图119数据科学的理论体系20


图120数据科学的主要内容20


图121数据科学的“三世界原则“22


图122数据科学的“三个要素“及“3C精神“23


图123计算密集型应用与数据密集型应用的区别24


图124数据范式与知识范式的区别25


图125数据管理范式的变化25


图126数据的“资产“属性26


图127常用驱动方式28


图128CAPTCHA方法的应用28


图129ReCAPTCHA项目29


图130数据与算法之间的关系30


图131BellKors Pragmatic Chaos团队获得Netflix奖30


图132Netflix奖公测结果31


图133数据科学与商务智能的区别与联系32


图134数据科学与数据工程在企业应用中的区别与联系33


图135数据科学人才类型及其收入33


图136RStudio中编辑Markdown的窗口35


图137数据科学家团队38


图138大数据人才应具备的不同知识结构40


图139学习数据科学的四则原则43


图21数据科学的理论基础50


图22统计方法的分类(行为目的与思路方式视角)52


图23统计学中的数据推断53


图24数据统计方法的类型(方法论视角)53


图25数据统计基本方法54


图26元分析与基本分析54


图27GFT预测与美国疾病控制中心数据的对比55


图28GFT估计与实际数据的误差(2013年2月)56


图29大数据时代的思维模式的转变58


图210西洋双陆棋58


图211机器人驾驶58


图212机器学习的基本思路59


图213机器学习的三要素61


图214机器学习的类型62


图215KNN算法的基本步骤63


图216决策树示例——识别鸟类65


图217感知器示例67


图218前向神经网络67


图219归纳学习与分析学习70


图220增强学习70


图221机器学习的类型71


图222IBM Watson72


图223Pepper机器人73


图224机器学习中的数据73


图225Anscombe四组数据的可视化77


图226John Snow的鬼地图(Ghost Map)78


图227在Tableau中加利福尼亚州政府收入来源数据的可视化79


图31数据科学的基本流程83


图32量化自我84


图33规整数据与干净数据的区别85


图34规整数据示意图86


图35残差89


图36数据分析的类型90


图37Analytics 1.0~3.091


图38数据加工方法92


图39数据审计与数据清洗93


图310缺失数据处理的步骤94


图311冗余数据处理的方法94


图312数据分箱处理的步骤与类型96


图313均值平滑与边界值平滑96


图314内容集成98


图315结构集成99


图316数据脱敏处理100


图317数据连续性的定义及重要性104


图318可视化审计示例106


图319Gartner分析学价值扶梯模型106


图320冰激凌的销售量与谋杀案的发生数量108


图321数据分析的类型110


图322拿破仑进军俄国惨败而归的历史事件的可视化111


图323可视分析学的相关学科111


图324可视分析学模型112


图325数据可视化的方法体系113


图326视觉图形元素与视觉通道113


图327雷达图示例114


图328齐美尔连带114


图329视觉隐喻的示例——美国政府机构的设置114


图330地铁路线图的创始人Henry Beck115


图331Henry Beck的伦敦地铁线路图116


图332视觉突出的示例116


图333完图法则的示例117


图334视觉通道的选择与展示119


图335视觉通道的精确度对比119


图336视觉通道的可辨认性——某公司产品销售示意图120


图337视觉通道的可分离性差120


图338上下文导致视觉假象1121


图339上下文导致视觉假象2121


图340对亮度和颜色的相对判断容易造成视觉假象的示例121


图341数据可视化表达与数据故事化描述126


图342数据的故事化描述及故事的展现127


图343项目管理的主要内容130


图344数据科学项目的基本流程131


图4大数据产业全景图140


图42大数据参考架构142


图43MapReduce执行过程144


图44MapReduce对中间数据的处理148


图45以MapReduce为核心和以YARN为核心的软件栈对比150


图46下一代MapReduce框架151


图47Apache的Hadoop项目151


图48Hadoop生态系统152


图49Hadoop MapReduce数据处理过程153


图410Apache Hive官方网站155


图411Apache Pig官方网站156


图412Apache Mahout官方网站157


图413Apache HBase官方网站157


图414HBase与Hadoop项目158


图415HBase的逻辑模型159


图416Apache ZooKeeper官方网站160


图417Apache Flume官方网站161


图418Apache Sqoop官方网站162


图419Spark 技术架构163


图420Spark的基本流程164


图421Spark的执行步骤169


图422Lambda 架构的主要组成部分171


图423传统关系数据库的优点与缺点172


图424关系数据库技术与NoSQL技术之间的关系174


图425NoSQL数据分布的两个基本途径175


图426分片处理176


图427主从复制177


图428对等复制178


图429数据不一致性179


图430CAP理论180


图431Memcached官方网站183


图432一致性散列的分配方式184


图433服务器增加时的变化184


图434云计算的演变过程188


图435数据管理的新变化190


图4—2018年数据科学相关项目中软件产品的使用率(%)192


图4年Gartner数据科学和机器学习平台魔力194


图51数据产品开发中的数据与数据柔术201


图52知识范式与数据范式203


图53数据产品的多样性204


图54数据产品的层次性205


图55Google全球商机洞察(Google Global Market Finder)206


图56数据产品链207


图57传统产品开发与数据产品开发的区别208


图58D.J.Patil209


图59UI(User Interface)设计方案与设计思维210


图510Google搜索的用户体验211


图511人与计算机图像内容识别能力的不同211


图512Amazon Mechanical Turk平台213


图5

—  没有更多了  —

以下为对购买帮助不大的评价

现货二手   二手书无附赠品
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP