消息首页搜索举报

数据天才：数据科学家修炼之道

99 九品

仅1件

北京朝阳

认证卖家担保交易快速发货售后保障

作者吴博、张晓峰、季春霖译

出版社电子工业出版社

出版时间2017-05

版次1

装帧平装

货号F54

上书时间2024-12-29

汏瑭書偓

十五年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 6小时
好评率暂无

店主推荐
最新上架

三毛全集全19册（共：10本，合售）【1，2，3，4，6，8，12，15，17，18，】（两印的有：1，2是两印）其他都是一印，共10本，合售，便宜处理。 ¥720.00

三毛全集全19册（共：12本，合售）【1，2，3，4，6，7，8，9，12，15，17，18，】（两印的有：2，4，7是两印）其他都是一印，共10本，合售，便宜处理。 ¥900.00

三毛全集全19册（共：14本，合售）【1，2，3，4，5，6，7，8，9，10，12，15，17，18，】（两印的有：1，2，4，7是两印）其他都是一印，共10本，合售，便宜处理。 ¥630.00

PUBLICATIONS OF THE PERMANENT COURT OF INTERNATIONAL JUSTICE)一共有5册：15，1，13，16，14）看图。5本合售 ¥450.00

足迹（1930-2010）北京市万安公墓建立八十周年纪念册 ¥18.00

赖世雄口语从头学系列：旅游口语从头学 ¥99.00

剑桥雅思阅读考点词真经（机考笔试综合版） ¥99.00

剑桥雅思听力考点词真经（机考笔试综合版） ¥99.00

岛上书店 ¥99.00

傅雷选给孩子的古诗读本三联精选 ¥99.00

红岩 ¥99.00

小学生如何写好作文 ¥99.00

将才-让主管成长走直线-II ¥99.00

格鲁夫给经理人的第一课（畅销版） ¥99.00

商品详情

品相描述：九品

图书标准信息

作者吴博、张晓峰、季春霖译
出版社电子工业出版社
出版时间 2017-05
版次 1
ISBN 9787121308833
定价 85.00元
装帧平装
开本 16开
纸张胶版纸
页数 356页

【内容简介】: 　　这是一本跟数据科学和数据科学家有关的“手册”，它还包含传统统计学、编程或计算机科学教科书中所没有的信息。

　　《数据天才：数据科学家修炼之道》有3个组成部分：一是多层次地讨论数据科学是什么，以及数据科学涉及哪些其他学科；二是数据科学的技术应用层面，包括教程和案例研究；三是给正在从业和有抱负的数据科学家介绍一些职业资源。《数据天才：数据科学家修炼之道》中有很多职业和培训相关资源（如数据集、网络爬虫源代码、数据视频和如何编写API），所以借助《数据天才：数据科学家修炼之道》，你现在就可以开始数据科学实践，并快速地提升你的职业水平。

　　《数据天才：数据科学家修炼之道》是写给数据科学家和相关专业人士的（如业务分析师、计算机科学家、软件工程师、数据工程师和统计学家），也适合有兴趣转投大数据科学事业的人阅读。
【作者简介】: 　　Vincent Granville博士，是一名富有远见的数据科学家，有 15 年大数据、预测建模、数字分析和业务分析的经验。Vincent 在评分技术、欺诈检测和网络流量优化及增长等领域，是举世公认的专家。在过去的 10 年中，他曾与 Visa 一起研究实时信用卡欺诈检测，与CNET一起研究广告组合优化，与Microsoft（微软公司）一起研究“改变点检测”，与Wells Fargo（富国银行）一起研究在线用户体验，与InfoSpace一起研究搜索智能，与eBay一起研究自动竞价，与各大搜索引擎、广告网络和大型广告客户一起研究点击欺诈检测。Vincent 也管理着LinkedIn上庞大的“大数据及分析数据科学家”小组，该小组拥有超过100 000名成员。

　　近期，Vincent推出了数据科学中心（Data Science Center）这个大数据、业务分析和数据科学界的领先社区。Vincent曾是剑桥大学和美国国家统计科学学院的博士后。他曾入围沃顿商业计划竞赛和比利时数学奥林匹克的决赛。Vincent 已经在统计期刊上发表了40篇论文，并且是许多国际会议的受邀演讲嘉宾。他还开发了一种新的数据挖掘技术，被称为隐性决策树，他还拥有多项专利，是发表数据科学书籍的第1人，并筹集了600万美元的创业启动资金。根据福布斯的排名，Vincent 是大数据领域前20位有影响力的人物之一，被VentureBeat、MarketWatch和美国有线新闻网（CNN）专门报道。

　　吴博，利兹大学博士后，具备多年机器学习研发、数据科学从业经验。曾任爱立信大数据高级研究员，多家公司数据科学家及数据变现业务负责人。现任深圳市宜远智能科技有限公司创始人。

　　张晓峰，哈尔滨工业大学深圳研究生院计算机科学与技术学院副教授、博士生导师，主要研究方向为数据挖掘、隐私保护和机器学习等。曾在北大方正研究院、香港大学电子技术研究所工作。主持包括国家自然科学基金面上项目，以及其他省/市纵向、横向课题十余项。已在国内外重要学术刊物与会议上发表SCI/EI索引论文40余篇。

　　季春霖，深圳光启高等理工研究院联合创始人，副院长；深圳市统计学会副会长；哈佛大学博士后，杜克大学统计学博士，剑桥大学硕士；广东省自然科学基金杰青项目获得者；发表包括Science在内的论文60余篇，授权专利400余项。热衷于贝叶斯统计学及其应用。
【目录】: 第1章  数据科学是什么  1

-真伪数据科学对比  2

- - 伪数据科学的两个例子  5

- - 新大学的面貌  7

-数据科学家  10

- - 数据科学家与数据工程师  10

- - 数据科学家与统计学家  12

- - 数据科学家与业务分析师  13

-13个真实世界情景中的数据科学应用  14

- - 情景1：国家对烈性酒销售的垄断结束后，DUI（酒后驾驶）逮捕量减少  15

- - 情景2：数据科学与直觉  17

- - 情景3：数据故障将数据变成乱码  19

- - 情景4：异常空间的回归  21

- - 情景5：分析与诱导在提升销量上有何不同价值  22

- - 情景6：关于隐藏数据  24

- - 情景7：汽油中的铅会导致高犯罪率。真的吗  25

- - 情景8：波音787（梦幻客机）问题  26

- - 情景9：NLP的7个棘手句子  27

- - 情景10：数据科学家决定着我们所吃的食品  28

- - 情景11：用较好的相关性增加亚马逊的销售量  30

- - 情景12：检测Facebook上的假档案或假“喜欢”数  32

- - 情景13：餐厅的分析  33

-数据科学的历史、开拓者和现代趋势  33

- - 统计学将会复兴  34

- - 历史与开拓者  36

- - 现代的趋势  38

- - 最近的问答讨论  40

-总结  44

第2章  大数据的独特性  45

-两个大数据的问题  45

- - 大数据“诅咒”  45

- - 数据快速流动问题  50

-大数据技术示例  56

- - 大数据问题是数据科学所面临挑战的缩影  56

- - 大规模数据集的聚类和分类  58

- - 1亿行的Excel  63

-MapReduce不能做什么  67

- - 问题  67

- - 3种解决方案  68

- - 结论：何时使用MapReduce  69

-沟通问题  70

-数据科学：统计学的终结  72

- - 8种最差的预测建模技术  72

- - 把计算机科学、统计学和行业专业知识结合在一起  74

-大数据生态系统  78

-总结  79

第3章  成为一名数据科学家  80

-数据科学家的主要特征  80

- - 数据科学家的职能  80

- - 横向与纵向数据科学家  83

-数据科学家的类型  86

- - 伪数据科学家  86

- - 自学成才的数据科学家  86

- - 业余数据科学家  87

- - 极限数据科学家  89

-数据科学家人群特征  90

-数据科学方面的培训  91

- - 大学课程  91

- - 公司和协会培训项目  95

- - 免费培训项目  96

-数据科学家职业道路  98

- - 独立顾问  98

- - 创业者  105

-总结  118

第4章  数据科学的技术（I）  119

-新型指标  120

- - 优化数字营销活动的指标  121

- - 欺诈检测的指标  122

-选择合适的分析工具  124

- - 分析软件  124

- - 可视化工具  125

- - 实时产品  126

- - 编程语言  128

-可视化  128

- - 用R生成数据视频  129

- - 更复杂的视频  133

-无模型的统计建模  134

- - 无模型的统计建模是什么  135

- - 该算法是如何工作的  135

- - 源代码生成数据集  137

-三类指标：中心性、波动性、颠簸性  137

- - 中心性、波动性和颠簸性之间的关系  138

- - 定义颠簸性  138

- - 在Excel中计算颠簸性  139

- - 使用颠簸系数  141

-大数据的统计聚类  141

-大数据的相关性和拟合度  143

- - 一系列新的秩相关性  146

- - 渐近分布与归一化  148

- - -计算复杂度  152

- - 计算q(n)  152

- - 理论上的解决方案  155

-结构系数  156

-确定簇的数量  157

- - 方法  157

- - 例子  158

-网络拓扑映射  159

-安全通信：数据加密  163

-总结  166

第5章  数据科学的技术（II）  167

-数据字典  168

- - 什么是数据字典  168

- - 建立数据字典  169

-隐性决策树  169

- - 实现方法  171

- - 示例：互联网流量打分  173

- - 结论  175

-与模型无关的置信区间  175

- - 方法  175

- - 分析桥第一定理  176

- - 应用  177

- - 源代码  178

-随机数  179

-解决问题的4个办法  181

- - 拥有超强直觉能力的业务分析师的直观法  182

- - 软件工程师的蒙特卡洛模拟法  182

- - 统计学家的统计建模方法  183

- - 计算机科学家的大数据方法  183

-因果关系和相关性  183

-怎样检测因果关系  184

-数据科学项目的生命周期  186

-预测模型的错误  189

-逻辑相关回归  191

- - 变量之间的相互作用  191

- - 一阶近似  191

- - 二阶近似  193

- - 用Excel进行回归分析  195

-实验设计  196

- - 有趣的指标  196

- - 把患者分成不同的人群进行治疗  196

- - 私人定制的治疗  197

-分析即服务和应用程序接口  198

- - 工作原理  199

- - 实施案例  199

- - 关键词相关的API的源代码  200

-其他主题  204

- - 当数据库改变时，保存好数值  204

- - 优化网络爬虫  205

- - 哈希连接  206

- - 用于模拟簇的简单源代码  207

-Hadoop和大数据的新型合成方差  208

- - Hadoop和MapReduce的介绍  208

- - 综合指标  209

- - Hadoop、数值的和统计的稳定性  210

- - 方差的抽象概念  211

- - 一个新的大数据定理  213

- - 平移不变性的度量标准  214

- - 实现：通信和计算成本  214

- - 最终意见  215

-总结  215

第6章  数据科学应用案例研究  217

-股票市场  217

- - 使回报率提高500%的模式  217

- - 优化统计交易策略  220

- - 股票交易的API：统计模型  222

- - 股票交易的API：具体实现  225

- - 股票市场模拟  226

- - 些许数学知识  229

- - 新趋势  231

-加密  232

- - 数据科学应用：隐写术  232

- - 好的电子邮件加密  236

- - 验证码破解  239

-欺诈检测  240

- - 点击欺诈  241

- - 连续点击评分与二进制欺诈/非欺诈  242

- - 数学模型与基准  244

- - 虚假转化产生的偏差  245

- - 一些误解  246

- - 统计面临的挑战  246

- - 点击评分优化关键词出价  247

- - 组合优化自动快速的特征选择  249

- - 特征的预测能力：交叉验证  250

- - 勾连检测和僵尸网络的关联规则检测  254

- - 模式检测的极值理论  255

-数字分析  256

- - 在线广告：到达率和频率的计算公式  256

- - 电子邮件营销：提高300%的性能  257

- - 在7天内优化关键词广告宣传活动  258

- - 自动新闻提要优化  260

- - 用bit-ly进行竞争情报分析  261

- - 测量 Twitter 哈希标签（hashtag）的收益  263

- - 用3个修补方法提升谷歌搜索  267

- - 改进相关性的算法  270

- - 广告循环问题  272

-杂项  273

- - 简单模型会获得更好的销售预测  273

- - 更好的医疗欺诈检测  275

- - 归因模型  276

- - 预测陨石撞击  277

- - 在路口停车场收集数据  281

- - 数据科学的其他应用  282

-总结  282

第7章  踏上你的数据科学职业之路  283

-面试问题  283

- - 关于工作经验的问题  283

- - 技术问题  285

- - 一般性问题  286

- - 关于数据科学项目的问题  288

-测试你自己的视觉和分析思维  291

- - 通过肉眼的检测模式  292

- - 识别偏差  294

- - 误导性的时间序列和随机游走  295

-从统计学家到数据科学家  296

- - 数据科学家也是统计从业人员  297

- - 谁应该给数据科学家教统计学  298

- - 雇佣问题  298

- - 数据科学家与数据架构师密切合作  299

- - 谁应该参与战略思考  299

- - 两种类型的统计学家  300

- - 大数据与取样  301

-数据科学家的分类  302

- - 数据科学最流行的技能集合  302

- - LinkedIn上的顶级数据科学家  306

-400个数据科学家职位头衔  309

-薪酬调查  311

- - 根据技能和位置的薪酬分类  312

- - 创建自己的薪酬调查表  316

-总结  317

第8章  数据科学资源  318

-专业资源  318

- - 数据集  318

- - 书籍  319

- - 会议与组织  322

- - 网站  324

- - 概念定义  324

-职业建设资源  327

- - 招聘数据科学家的公司  328

- - 数据科学招聘广告的样本  329

- - 简历样本  329

-总结  331

点击展开点击收起

— 没有更多了 —