导语摘要
王汉生编著的《数据思维(从数据分析到商业价值)》是一本关于数据科学的极具特色、雅俗共赏的砖物。当其他数据科学书籍都在谈论算法模型的时候,这本书选择了研究数据、价值,以及从数据到价值的可实现路径,即“朴素的数据价值观”。在这一方法论的指引下,作者分享了一系列非常有趣的案例,横跨很多重要的新兴行业,例如车联网、消费金融等。每个案例都包含对数据业务的深刻理解、可落地的数据分忻方法,以及最后产品化的形态。这足一条完整的从数据到价值的路径,是绝大多数现有数据科学图书所不具备的独特能力。
作者简介
王汉生,北京大学光华管理学院商务统计与经济计量系系主任,教授,博士生导师。现兼任北京大学商务智能研究中心主任,曾任嘉茂荣聘教授(2014-2015),蓝天环保讲席教授(2015-2016)。他还是微信公众号“狗熊会”创始人、美国统计学会Fellow(2014)、国家杰出青年基金获得者(2016)。他主要研究同移动互联网以及量化投资相关的数据分析,包括但不局限于中文文本、网络结构、位置轨迹等;在业界实践方面,他是靠前较早从统计数据分析角度关注并研究搜索引擎营销,社交网络数据,以及位置轨迹数据分析的学者。曾担任博雅立方科技有限公司首席科学家(2009-2015),百分点首席统计学家(2015-现在)。此外,与量帮科技、考拉征信、彩虹无线、蓬景数字等众多企业有深度学术合作,合作领域涉及量化投资、互联网征信、车联网、移动设备RTB广告竞价、搜索引擎营销、电子商务等多个重要行业。此外,王汉生教授同腾讯、百度、阿里、奇虎、奥迪、京东、联通等众多企业有短期项目或者培训会议合作。
目录
绪论 大数据时代之“皇帝的新装”
什么是数据?
数据的商业价值
数据到价值的转化:回归分析的“道”与“术”
搞清客户需求
中国数据科学的风口
第二章 数据可视化
实力派:准确 有效
偶像派:简洁 美观
柱状图
堆积柱状图
柱状图之妙用
饼图
直方图
折线图
散点图
箱线图
茎叶图
第三章回归分析
什么是回归分析?
线性回归——北京市二手房房价
线性回归——中国电影票房
线性回归——线上女装销量预测
线性回归——股票投资中的均线策略
01回归——某移动通信公司客户流失预警分析
01回归——车险数据分析与商业价值
01回归——点击率预测在RTB广告投放中的应用
定序回归——信用卡逾期数据分析
计数回归——英超进球谁br />生存回归——新产品在架时长研究
第四章 机器学习
朴素贝叶斯——12345,有事找政府
决策树——非诚勿扰
决策树——二手车保值比率那些事儿
回归树与提升算法——世界这么大,想去哪儿看看?
深度学习——图像自动识别
深度学习——打麻将
K均值聚类——狗熊皮鞋的百度广告投放
第五章 非结构化数据
中文文本——小说的三要素:以《琅琊榜》为例
中文文本——从用户评论看产品改善
中文文本——空气净化器的好评率影响因素分析
中文文本——数据分析岗位招聘情况的影响因素分析
中文文本——张无忌
网络结构数据——《甄嬛传》中的爱恨情仇
图像数据——通过图片识别PM2.5
刷卡数据——互联网征信
内容摘要
。。。
主编推荐
一本妙趣横生的书,一本商业分析和数据科学领域入门级趣味读物。
本书由北京大学光华管理学院王汉生教授和微信公号“狗熊会”团队合力打造。
上海纽约大学杰出商学讲席教授 陈宇新
复旦大学大数据学院创始院长 范剑青
考拉征信服务有限公司CTO 葛伟平
狗熊会CEO 李广雨
百分点集团董事长兼CEO 苏萌
伦敦政治经济学院统计学讲座教授 姚琦伟
北京大学数学学院教授 张志华
联袂
精彩内容
本书由微信公众号:狗熊会创始人王汉生教授(熊大),及其核心团队联合创作完成。本书可以被看作商业分析(business analytics)领域入门级通俗且有趣的读物,深入浅出,雅俗共赏。适合数据分析师、工程师、产品经理、销售、BD、以及数据企业中高管阅读。
本书主要由五章组成。*章介绍了熊大朴素的数据价值观,解读数据与价值的逻辑关系;第二章介绍了*基本的数据可视化方法(统计图表)的规范与有趣应用;第三章介绍了回归分析,通过精彩案例展示了如何将一个业务问题定义成为一个数据可分析问题;第四章介绍了机器学习,可以看作是第三章技术上的一个重要补充;第五章展示了各种常见的非结构化数据分析(文本、图像)的有趣案例。本
书所有案例内容的原始版本、相关数据资源,都可以从微信公众号狗熊会(ID: CluBear)获得。
媒体评论
这是一本有特点的数据科学入门读物。它的主要特点就是简单有趣。我很惊讶于作者能够用如此通俗易懂的语言,表达出数据科学中深刻的道理。作者将其称为“朴素的数据价值观”。整本书几乎没有任何数学公式,没有任何程序代码,但是数据科学的深刻道理娓娓道来。通过本书,读者可以在风趣的语言文字中,感悟深刻的数据价值道理,见证中国数据产业的快速发展!
范剑青(国家千人计划学者,普林斯顿金融学讲座教授,复旦大学大数据学院创始院长)
这是一本极具特色,关于数据科学,雅俗共赏的读物。当其他数据科学书籍都在谈论算法模型的时候,这本书选择了研究数据、价值,以及从数据到价值的可实现路径,即“朴素的数据价值观”。在这个方法论的指引下,作者分享了一系列有趣的案例,横跨很多重要的新兴行业,例如车联网、消费金融等。每个案例都包含对数据业务的深刻理解、可落地的数据分析方法,以及*后产品化的形态。这是一个完整的从数据到价值的路径,是绝大多数现有数据科学丛书所不具备的独特能力。
姚琦伟(国家千人计划学者,伦敦政治经济学院统计学讲座教授)
今天讲数据战略的不少,学数据技术的更多,而真正缺少的是一本通透的关于数据业务的指引。终于,“熊大”汉生教授以*的学术造诣、丰富的商务数据实战应用经验和生动酣畅的文笔,给我们带来了《数据思维》这一惊喜。数据思维是从数据到价值的产品思维,是打通数据技术与战略的业务思维,也是大数据创业,从业人士和产业管理者的成功思维。
陈宇新(国家千人计划学者,上海纽约大学杰出商学讲席教授)
与王汉生教授的交往已有几年了,由于所从事行业的缘故,经常在一起探讨和研究数据和模型有关的内容,王教授及其团队表现出的对产业的洞察、对数据本质的理解、模型的落地能力,都让我深深佩服。王教授编著的《数据思维》这本书有理论、有实践,通俗易懂的数据展示和行业模型实例,将复杂高深的内容简单化,是数据科学领域不可多得的一本好书,强烈有志之士阅读!
葛伟平(考拉征信服务有限公司执行总裁)
以下为对购买帮助不大的评价