• 数据天才:数据科学家修炼之道 【美】Vincent Granville 电子工业出版社
21年品牌 40万+商家 超1.5亿件商品

数据天才:数据科学家修炼之道 【美】Vincent Granville 电子工业出版社

正版二手书,发货前杀菌消毒,保证符合品相,不缺页,圆通发货(圆通不到走邮政),下单后24小时内发货。

18.06 2.1折 85 九品

库存3件

天津宝坻
认证卖家担保交易快速发货售后保障

作者【美】Vincent Granville

出版社电子工业出版社

ISBN9787121308833

出版时间2017-05

装帧平装

开本16开

定价85元

货号972073154808233992

上书时间2024-12-05

启灵正版书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
商品描述
前言
  译者序 

  本书最适合有志于在大数据与数据科学领域从业的人学习。格拉德威尔在《异类》一书中强调,“若要成为行业专家,离不开十万小时的刻意学习(deliberatelearning)”,这跟中国俗语里“板凳要坐十年冷”有些类似。但要实现刻意学习,就不能一味依赖通识科普书籍。在大数据与数据科学领域,市面上已不缺通识性的科普书籍,唯缺这类烧脑、有专业性、适合进行刻意学习的数据科学书籍。 

  本书不失专业性,但也不是令人生畏的大学教材。它处处体现理论与实践的结合,还兼顾技术与商业的平衡。这要归功于原作者Vincent是学术、技术、商业三栖高手。比如书中对于星空双星的估算、陨石撞地球的建模推算,让作者在数学奥赛方面的天分展现得淋漓尽致;在垃圾邮件、水印加密、点击欺诈等案例中,作者又分享了诸多为大公司实施数据项目的经验;在方案选择、股市预测等场景中,作者更侧重商业视角,帮读者提升对数据科学方法投入/产出比及适用性的敏感度。 

  本书虽然专业度高,但也因为案例翔实、讲求实际,适合其他行业或领域的人士阅读。特别建议业务跟数据息息相关的企业负责人或高管,或者对数据相关项目感兴趣的投资者品读。毕竟数据科学家这一高层职位,跟企业负责人及高管的对接较多。虽说好的数据科学家,应具备与非技术人士沟通的能力,但作为数据科学家的领导,一旦多懂一些数据科学的思考模式及流程,便会对数据科学家有更多理解,也会对数据化的决策有更深的认识。 

  本书也传递出对行业热词的审慎态度。比如本书就对“大数据”的缘起、演变、更替、历史、迷思和幻象,着墨不少。就像书中所说,大数据领域许多看似新的方法,可以追溯到二三十年前,如今的不少创新,实乃新瓶旧酒。想必读者从Gartner的成熟度曲线里,可以看到大数据一词已渡过巅峰、渐趋理性,与之相随的,是跟数据科学息息相关的人工智能(AI)重新崛起。若理解本书的立场和价值取向,就知道人工智能60多年来几起几落,不少如今大放异彩的方法,也可找到前身。透过现象看本质,人工智能多少因为数据体量更大、数据分析更细、计算能力更强,才成为行业焦点。忽视基础理论盲目追随人工智能热点无异于舍本逐末,认真和刻意学习数据科学及人工智能的基础理论和实践,方是正途。 

  正因为这本书内容如此之好,能满足读者所需,于是我痛快答应电子工业出版社付睿编辑的邀约来翻译本书。但这个小想法变成最终成品,却耗费不少人的时间和精力,对他们的感谢和亏欠不能尽录。我最要鸣谢翻译合作者光启研究院的副院长季春霖博士,还有在哈工大深圳研究生院任教的张晓峰博士,两位的研究和管理任务都很繁重,面对译书这种流程漫长、成效滞后的工作,他们展现了学界出身的坚韧素养,而在翻译校对本书的过程中,又处处体现出手不凡的专业功力。同时,也要感谢配合翻译校对本书的助手和出版社工作人员,他们对我有莫大的包容和支持。本书准备期间,也正是我的一对小孩——泰学和雅学——从孕育到出生的过程,所以要感谢我的太太熊瑛,容许我为本书挤出不少本来可以陪伴家人的时间。 

  最后,我还要代表季春霖博士感谢广东省自然科学杰出青年基金项目(No-S20120011253)和深圳市数据科学与建模技术重点实验室的资助。也要感谢我所在的宜远智能团队,他们在将本书中许多数据科学方法实践到医疗健康领域时,提出了诸多宝贵的翻译修正补充建议。当然,对专业内容的翻译,难在对作者见识的理解和原意的把握,所以总有力有不逮、不甚精确之处,请各位读者和专家对此海涵,提出宝贵的建议。 

  本书译者吴博 

作者简介
  Vincent Granville博士,是一名富有远见的数据科学家,有 15 年大数据、预测建模、数字分析和业务分析的经验。Vincent 在评分技术、欺诈检测和网络流量优化及增长等领域,是举世公认的专家。在过去的 10 年中,他曾与 Visa 一起研究实时信用卡欺诈检测,与CNET一起研究广告组合优化,与Microsoft(微软公司)一起研究“改变点检测”,与Wells Fargo(富国银行)一起研究在线用户体验,与InfoSpace一起研究搜索智能,与eBay一起研究自动竞价,与各大搜索引擎、广告网络和大型广告客户一起研究点击欺诈检测。Vincent 也管理着LinkedIn上庞大的“大数据及分析数据科学家”小组,该小组拥有超过100 000名成员。 

  近期,Vincent推出了数据科学中心(Data Science Center)这个大数据、业务分析和数据科学界的领先社区。Vincent曾是剑桥大学和美国国家统计科学学院的博士后。他曾入围沃顿商业计划竞赛和比利时数学奥林匹克的决赛。Vincent 已经在统计期刊上发表了40篇论文,并且是许多国际会议的受邀演讲嘉宾。他还开发了一种新的数据挖掘技术,被称为隐性决策树,他还拥有多项专利,是发表数据科学书籍的第1人,并筹集了600万美元的创业启动资金。根据福布斯的排名,Vincent 是大数据领域前20位有影响力的人物之一,被VentureBeat、MarketWatch和美国有线新闻网(CNN)专门报道。 

  吴博,利兹大学博士后,具备多年机器学习研发、数据科学从业经验。曾任爱立信大数据高级研究员,多家公司数据科学家及数据变现业务负责人。现任深圳市宜远智能科技有限公司创始人。 

  张晓峰,哈尔滨工业大学深圳研究生院计算机科学与技术学院副教授、博士生导师,主要研究方向为数据挖掘、隐私保护和机器学习等。曾在北大方正研究院、香港大学电子技术研究所工作。主持包括国家自然科学基金面上项目,以及其他省/市纵向、横向课题十余项。已在国内外重要学术刊物与会议上发表SCI/EI索引论文40余篇。 

  季春霖,深圳光启高等理工研究院联合创始人,副院长;深圳市统计学会副会长;哈佛大学博士后,杜克大学统计学博士,剑桥大学硕士;广东省自然科学基金杰青项目获得者;发表包括Science在内的论文60余篇,授权专利400余项。热衷于贝叶斯统计学及其应用。 

目录
第1章 数据科学是什么 1 

-真伪数据科学对比 2 

- - 伪数据科学的两个例子 5 

- - 新大学的面貌 7 

-数据科学家 10 

- - 数据科学家与数据工程师 10 

- - 数据科学家与统计学家 12 

- - 数据科学家与业务分析师 13 

-13个真实世界情景中的数据科学应用 14 

- - 情景1:国家对烈性酒销售的垄断结束后,DUI(酒后驾驶)逮捕量减少 15 

- - 情景2:数据科学与直觉 17 

- - 情景3:数据故障将数据变成乱码 19 

- - 情景4:异常空间的回归 21 

- - 情景5:分析与诱导在提升销量上有何不同价值 22 

- - 情景6:关于隐藏数据 24 

- - 情景7:汽油中的铅会导致高犯罪率。真的吗 25 

- - 情景8:波音787(梦幻客机)问题 26 

- - 情景9:NLP的7个棘手句子 27 

- - 情景10:数据科学家决定着我们所吃的食品 28 

- - 情景11:用较好的相关性增加亚马逊的销售量 30 

- - 情景12:检测Facebook上的假档案或假“喜欢”数 32 

- - 情景13:餐厅的分析 33 

-数据科学的历史、开拓者和现代趋势 33 

- - 统计学将会复兴 34 

- - 历史与开拓者 36 

- - 现代的趋势 38 

- - 最近的问答讨论 40 

-总结 44 

第2章 大数据的独特性 45 

-两个大数据的问题 45 

- - 大数据“诅咒” 45 

- - 数据快速流动问题 50 

-大数据技术示例 56 

- - 大数据问题是数据科学所面临挑战的缩影 56 

- - 大规模数据集的聚类和分类 58 

- - 1亿行的Excel 63 

-MapReduce不能做什么 67 

- - 问题 67 

- - 3种解决方案 68 

- - 结论:何时使用MapReduce 69 

-沟通问题 70 

-数据科学:统计学的终结 72 

- - 8种最差的预测建模技术 72 

- - 把计算机科学、统计学和行业专业知识结合在一起 74 

-大数据生态系统 78 

-总结 79 

第3章 成为一名数据科学家 80 

-数据科学家的主要特征 80 

- - 数据科学家的职能 80 

- - 横向与纵向数据科学家 83 

-数据科学家的类型 86 

- - 伪数据科学家 86 

- - 自学成才的数据科学家 86 

- - 业余数据科学家 87 

- - 极限数据科学家 89 

-数据科学家人群特征 90 

-数据科学方面的培训 91 

- - 大学课程 91 

- - 公司和协会培训项目 95 

- - 免费培训项目 96 

-数据科学家职业道路 98 

- - 独立顾问 98 

- - 创业者 105 

-总结 118 

第4章 数据科学的技术(I) 119 

-新型指标 120 

- - 优化数字营销活动的指标 121 

- - 欺诈检测的指标 122 

-选择合适的分析工具 124 

- - 分析软件 124 

- - 可视化工具 125 

- - 实时产品 126 

- - 编程语言 128 

-可视化 128 

- - 用R生成数据视频 129 

- - 更复杂的视频 133 

-无模型的统计建模 134 

- - 无模型的统计建模是什么 135 

- - 该算法是如何工作的 135 

- - 源代码生成数据集 137 

-三类指标:中心性、波动性、颠簸性 137 

- - 中心性、波动性和颠簸性之间的关系 138 

- - 定义颠簸性 138 

- - 在Excel中计算颠簸性 139 

- - 使用颠簸系数 141 

-大数据的统计聚类 141 

-大数据的相关性和拟合度 143 

- - 一系列新的秩相关性 146 

- - 渐近分布与归一化 148 

- - -计算复杂度 152 

- - 计算q(n) 152 

- - 理论上的解决方案 155 

-结构系数 156 

-确定簇的数量 157 

- - 方法 157 

- - 例子 158 

-网络拓扑映射 159 

-安全通信:数据加密 163 

-总结 166 

第5章 数据科学的技术(II) 167 

-数据字典 168 

- - 什么是数据字典 168 

- - 建立数据字典 169 

-隐性决策树 169 

- - 实现方法 171 

- - 示例:互联网流量打分 173 

- - 结论 175 

-与模型无关的置信区间 175 

- - 方法 175 

- - 分析桥第一定理 176 

- - 应用 177 

- - 源代码 178 

-随机数 179 

-解决问题的4个办法 181 

- - 拥有超强直觉能力的业务分析师的直观法 182 

- - 软件工程师的蒙特卡洛模拟法 182 

- - 统计学家的统计建模方法 183 

- - 计算机科学家的大数据方法 183 

-因果关系和相关性 183 

-怎样检测因果关系 184 

-数据科学项目的生命周期 186 

-预测模型的错误 189 

-逻辑相关回归 191 

- - 变量之间的相互作用 191 

- - 一阶近似 191 

- - 二阶近似 193 

- - 用Excel进行回归分析 195 

-实验设计 196 

- - 有趣的指标 196 

- - 把患者分成不同的人群进行治疗 196 

- - 私人定制的治疗 197 

-分析即服务和应用程序接口 198 

- - 工作原理 199 

- - 实施案例 199 

- - 关键词相关的API的源代码 200 

-其他主题 204 

- - 当数据库改变时,保存好数值 204 

- - 优化网络爬虫 205 

- - 哈希连接 206 

- - 用于模拟簇的简单源代码 207 

-Hadoop和大数据的新型合成方差 208 

- - Hadoop和MapReduce的介绍 208 

- - 综合指标 209 

- - Hadoop、数值的和统计的稳定性 210 

- - 方差的抽象概念 211 

- - 一个新的大数据定理 213 

- - 平移不变性的度量标准 214 

- - 实现:通信和计算成本 214 

- - 最终意见 215 

-总结 215 

第6章 数据科学应用案例研究 217 

-股票市场 217 

- - 使回报率提高500%的模式 217 

- - 优化统计交易策略 220 

- - 股票交易的API:统计模型 222 

- - 股票交易的API:具体实现 225 

- - 股票市场模拟 226 

- - 些许数学知识 229 

- - 新趋势 231 

-加密 232 

- - 数据科学应用:隐写术 232 

- - 好的电子邮件加密 236 

- - 验证码破解 239 

-欺诈检测 240 

- - 点击欺诈 241 

- - 连续点击评分与二进制欺诈/非欺诈 242 

- - 数学模型与基准 244 

- - 虚假转化产生的偏差 245 

- - 一些误解 246 

- - 统计面临的挑战 246 

- - 点击评分优化关键词出价 247 

- - 组合优化自动快速的特征选择 249 

- - 特征的预测能力:交叉验证 250 

- - 勾连检测和僵尸网络的关联规则检测 254 

- - 模式检测的极值理论 255 

-数字分析 256 

- - 在线广告:到达率和频率的计算公式 256 

- - 电子邮件营销:提高300%的性能 257 

- - 在7天内优化关键词广告宣传活动 258 

- - 自动新闻提要优化 260 

- - 用bit-ly进行竞争情报分析 261 

- - 测量 Twitter 哈希标签(hashtag)的收益 263 

- - 用3个修补方法提升谷歌搜索 267 

- - 改进相关性的算法 270 

- - 广告循环问题 272 

-杂项 273 

- - 简单模型会获得更好的销售预测 273 

- - 更好的医疗欺诈检测 275 

- - 归因模型 276 

- - 预测陨石撞击 277 

- - 在路口停车场收集数据 281 

- - 数据科学的其他应用 282 

-总结 282 

第7章 踏上你的数据科学职业之路 283 

-面试问题 283 

- - 关于工作经验的问题 283 

- - 技术问题 285 

- - 一般性问题 286 

- - 关于数据科学项目的问题 288 

-测试你自己的视觉和分析思维 291 

- - 通过肉眼的检测模式 292 

- - 识别偏差 294 

- - 误导性的时间序列和随机游走 295 

-从统计学家到数据科学家 296 

- - 数据科学家也是统计从业人员 297 

- - 谁应该给数据科学家教统计学 298 

- - 雇佣问题 298 

- - 数据科学家与数据架构师密切合作 299 

- - 谁应该参与战略思考 299 

- - 两种类型的统计学家 300 

- - 大数据与取样 301 

-数据科学家的分类 302 

- - 数据科学最流行的技能集合 302 

- - LinkedIn上的顶级数据科学家 306 

-400个数据科学家职位头衔 309 

-薪酬调查 311 

- - 根据技能和位置的薪酬分类 312 

- - 创建自己的薪酬调查表 316 

-总结 317 

第8章 数据科学资源 318 

-专业资源 318 

- - 数据集 318 

- - 书籍 319 

- - 会议与组织 322 

- - 网站 324 

- - 概念定义 324 

-职业建设资源 327 

- - 招聘数据科学家的公司 328 

- - 数据科学招聘广告的样本 329 

- - 简历样本 329 

-总结 331 

内容摘要
  这是一本跟数据科学和数据科学家有关的“手册”,它还包含传统统计学、编程或计算机科学教科书中所没有的信息。 

  《数据天才:数据科学家修炼之道》有3个组成部分:一是多层次地讨论数据科学是什么,以及数据科学涉及哪些其他学科;二是数据科学的技术应用层面,包括教程和案例研究;三是给正在从业和有抱负的数据科学家介绍一些职业资源。《数据天才:数据科学家修炼之道》中有很多职业和培训相关资源(如数据集、网络爬虫源代码、数据视频和如何编写API),所以借助《数据天才:数据科学家修炼之道》,你现在就可以开始数据科学实践,并快速地提升你的职业水平。 

  《数据天才:数据科学家修炼之道》是写给数据科学家和相关专业人士的(如业务分析师、计算机科学家、软件工程师、数据工程师和统计学家),也适合有兴趣转投大数据科学事业的人阅读。 

主编推荐

本书会精准地告诉你什么是数据科学,它跟计算机科学有何差异,如何从数据中提炼价值,如何提升数据科学技能,获得工作机会。本书包括以下内容:

 

源代码、数据集,以及供复习的名词字典
供数据科学家参考的简历样本、薪酬调查,以及职位描述样本
什么样的公司在寻找数据科学家
大数据及分析产业的严谨分析
能展示竞争优势的实际面试问题
能帮助切实理解数据分析的案例
数据科学窍门、秘方和规则



   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP