[正版]数据科学实战9787115383495
正版旧书 85成新左右 里面部分划线标记 内容完好 可正常使用 旧书不附带光盘
¥
21.6
2.7折
¥
79
九品
库存2件
作者 舒特
出版社 人民邮电出版社
ISBN 9787115383495
出版时间 2015-03
装帧 其他
开本 16开
定价 79元
货号 9787115383495
上书时间 2024-11-25
商品详情
品相描述:九品
商品描述
导语摘要 大数据时代,人们越来越意识到数据在工作和生活中的重要性,数据科学家应运而生。面对媒体天花乱坠的炒作,怎么才能拨云见日,真正掌握这门跨学科利用数据的学问呢?由舒特、奥尼尔编著的《数据科学实战》这本脱胎于常春藤名校哥伦比亚大学“数据科学导论”课程的实战手册能够给你一个满意的回答。 本书作者舒特曾在谷歌研究院工作多年,现为美国新闻集团数据科学高级副总裁。她在哥伦比亚大学任教期间,广泛邀请了谷歌、微软、eBay及一些创业公司的数据科学家为学生授课,打破了所谓大学里教不出数据科学家的神话。这些讲座涵盖了上述公司及业界使用的最新算法、方法和模型。本书就是在这些一手资料基础上汇编而成的,它不仅可供不具备相关领域知识的初学者真正了解数据科学,而且也是熟悉线性代数、概率论、统计学、机器学习等主题的人士开阔视野、提升实战技能的优秀指南。 作者简介 Rachel Schutt 美国新闻集团旗下数据科学部门不错副总裁、哥伦比亚大学统计系兼职教授、约翰逊实验室不错研究科学家、同时也是哥伦比亚大学数据科学及工程研究所教育委员会的发起人之一。她曾在谷歌研究院工作数年,负责设计算法原型并通过建模理解用户行为。 Cathy O Neil 约翰逊实验室不错数据科学家、哈弗大学数学博士、巴纳德学院教授,曾发表过大量算术代数几何方面的论文。他曾在有名的优选投资管理公司D.E.Shaw担任对冲基金金融师,后加入专门评估银行和对冲基金风险的软件公司RiskMetricd,个人博客:mathbabe.org 目录 作者介绍 关于封面图 前言 第1章 简介:什么是数据科学 1.1 大数据和数据科学的喧嚣 1.2 冲出迷雾 1.3 为什么是现在 1.4 数据科学的现状和历史 1.5 数据科学的知识结构 1.6 思维实验:元定义 1.7 什么是数据科学家 1.7.1 学术界对数据科学家的定义 1.7.2 工业界对数据科学家的定义 第2章 统计推断、探索性数据分析和数据科学工作流程 2.1 大数据时代的统计学思考 2.1.1 统计推断 2.1.2 总体和样本 2.1.3 大数据的总体和样本 2.1.4 大数据意味着大胆的假设 2.1.5 建模 2.2 探索性数据分析 2.2.1 探索性数据分析的哲学 2.2.2 练习:探索性数据分析 2.3 数据科学的工作流程 2.4 思维实验:如何模拟混沌 2.5 案例学习:RealDirect 2.5.1 RealDirect是如何赚钱的 2.5.2 练一练:RealDirect公司的数据策略 第3章 算法 3.1 机器学习算法 3.2 三大基本算法 3.2.1 线性回归模型 3.2.2 k近邻模型(k-NN) 3.2.3 k均值算法 3.3 练习:机器学习算法基础 3.4 总结 3.5 思维实验:关于统计学家的自动化 第4章 垃圾邮件过滤器、朴素贝叶斯与数据清理 4.1 思维实验:从实例中学习 4.1.1 线性回归为何不适用 4.1.2 k近邻效果如何 4.2 朴素贝叶斯模型 4.2.1 贝叶斯法则 4.2.2 个别单词的过滤器 4.2.3 直通朴素贝叶斯 4.3 拉普拉斯平滑法 4.4 对比朴素贝叶斯和k近邻 4.5 Bash代码示例” 4.6 网页抓取:APl和其他工具 4.7 Jake的练习题:文章分类问题中的朴素贝叶斯模型 第5章 逻辑回归 5.1 思维实验 5.2 分类器 5.2.1 运行时间 5.2.2 你自己 5.2.3 模型的可解释性 5.2.4 可扩展性 …… 第6章 时间戳数据与金融建模 第7章 从数据到结论 第8章 构建面向大量用户的推荐引擎 第9章 数据可视化与欺诈侦测 第10章 社交网络与数据新闻学 第11章 因果关系研究 第12章 流行病学 第13章 从竞赛中学到的:数据泄漏和模型评价 第14章 数据工程:Mapreduce pregel、Hadoop 第15章 听听学生学们怎么说 第16章 下一代数据科学家、自大狂和职业道德 内容摘要 由舒特、奥尼尔编著的《数据科学实战》脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。 本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。 本书适合所有希望通过数据分析解决问题的人阅读参考,包括数据科学家、金融工程师、统 计学家、物理学家、学生及其他对数据科学感兴趣的人。
— 没有更多了 —
以下为对购买帮助不大的评价