数据挖掘:你必须知道的32个经典案例
正版保障 假一赔十 可开发票
¥
37.1
6.3折
¥
59
全新
库存3件
作者任昱衡[等]著
出版社电子工业出版社
ISBN9787121351129
出版时间2016-10
装帧平装
开本其他
定价59元
货号9301652
上书时间2025-01-05
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
任昱衡,博士,副研究员,不错电子商务师,不错硬件工程师,中国电子商务协会电子商务研究院副院长,中国电子商务协会信用体系建设管理中心主任助理,中国电子商务师资质(职称)认证管理中心主任助理。参与国家多项电子商务法律、法规、标准制定工作,目前主要负责国家电子商务师职业水平(职称)认证体系的构建和国家电子商务行业企业信用监督工作。
目录
目 录 br / br /br /br /第1章 经典的探索性数据分析案例1br /1.1 探索性数据分析综述2br /1.1.1 什么是探索性数据分析2br /1.1.2 如何收集数据4br /1.1.3 数据预处理技术5br /1.2 数据巧收集——红牛的大数据营销案例8br /1.2.1 状况百出的红牛企业8br /1.2.2 红牛企业巧妙收集消费者数据9br /1.2.3 数据收集小结12br /1.3 数据可视化——数据新闻促使英军撤军13br /1.3.1 维基解密带来的海量数据13br /1.3.2 百花齐放的数据新闻15br /1.3.3 数据可视化小结18br /1.4 异常值分析——Facebook消灭钓鱼链接19br /1.4.1 Facebook和广告商之间的拉锯战20br /1.4.2 异常值分析指导排名算法工作22br /1.4.3 异常值分析小结26br /1.5 对比分析——TrueCar指导购物者寻找算的车价27br /1.5.1 火中取栗的TrueCar网站28br /1.5.2 数据对比赢得消费者信赖29br /1.5.3 对比分析小结32br /第2章 经典的相关分析与回归分析案例35br /2.1 相关回归综述36br /2.1.1 相关回归简介36br /2.1.2 相关性分析的发展介绍38br /2.1.3 回归分析的发展介绍39br /2.2 皮尔逊相关值——纽约市政府利用相关分析监控违法建筑40br /2.2.1 简约而不简单的消防检测系统40br /2.2.2 使用相关分析洞察60个变量的关系42br /2.2.3 相关分析小结45br /2.3 时间序列分析——人寿保险的可提费用预测47br /2.3.1 人寿保险公司和可提费用47br /2.3.2 使用4种时间序列回归预测模型解决问题49br /2.3.3 时间序列分析小结52br /2.4 线性回归分析——梅西百货公司的12项大数据策略54br /2.4.1 从“一亿豪赌”说起的商困境54br /2.4.2 SAS公司帮助梅西百货构建模型56br /2.4.3 线性回归分析小结59br /2.5 Logistic回归分析——大面积流感爆发的预测分析62br /2.5.1 究竟谁才是流感预测算法62br /2.5.2 向Logistic算法中引入更多变量64br /2.5.3 Logistic回归分析小结67br /第3章 经典的降维数据分析案例69br /3.1 降维分析算法综述70br /3.1.1 为什么要使用降维算法70br /3.1.2 线性降维算法72br /3.1.3 非线性降维算法73br /3.2 粗糙集算法——协助希腊工业发展银行制定信贷政策74br /3.2.1 银行信贷政策的制定原则75br /3.2.2 粗糙集算法的原理和应用76br /3.2.3 粗糙集算法小结80br /3.3 因子分析——基于李克特量表的应聘评价法82br /3.3.1 源于智力测试的因子分析82br /3.3.2 使用因子分析解构问卷84br /3.3.3 因子分析小结87br /3.4 尺度分析——直观评估消费者倾向的分析方法89br /3.4.1 市场调查问题催生的尺度分析89br /3.4.2 6种经典的尺度分析解读方法91br /3.4.3 尺度分析小结95br /3.5 PCA降维算法——智能人脸识别的应用与拓展97br /3.5.1 刷脸的时代来了97br /3.5.2 使用PCA算法完成降维工作99br /3.5.3 PCA算法小结102br /第4章 经典的模式识别案例105br /4.1 模式识别综述106br /4.1.1 模式识别简介106br /4.1.2 模式识别的发展脉络107br /4.1.3 模式识别应用简介110br /4.2 图像分析——谷歌的超前自动驾驶技术111br /4.2.1 以安全的名义呼吁自动驾驶技术111br /4.2.2 快速成熟的无人驾驶技术113br /4.2.3 图像分析小结116br /4.3 遗传算法——经典的人力资源优化问题118br /4.3.1 使用有限资源实现利益化118br /4.3.2 遗传算法的计算过程120br /4.3.3 遗传算法小结123br /4.4 决策树分析——“沸腾时刻”准确判断用户健康水平124br /4.4.1 打造我国的健身平台124br /4.4.2 信息增益和决策树126br /4.4.3 决策树小结129br /4.5 K均值聚类分析——HSE24通过为客户分类降低退货率131br /4.5.1 在电子商务市场快速扩张的HSE24131br /4.5.2 使用K均值聚类为客户分类133br /4.5.3 K均值聚类小结136br /第5章 经典的机器学习案例139br /5.1 机器学习综述140br /5.1.1 机器学习简介140br /5.1.2 机器学习的主流发展和应用142br /5.2 语义搜索——沃尔玛搜索引擎提升15%销售额143br /5.2.1 注重用户体验的沃尔玛公司144br /5.2.2 语义搜索引擎的底层技术和原理145br /5.2.3 语义搜索技术小结148br /5.3 顺序分析——搜狗输入法的智能纠错系统150br /5.3.1 搜狗输入法的词库和智能算法151br /5.3.2 频繁树模式和顺序分析算法153br /5.3.3 顺序分析小结156br /5.4 文本分析——经典的垃圾邮件过滤系统158br /5.4.1 大数据时代需要文本分析工作158br /5.4.2 垃圾邮件过滤中的分词技术和词集模型160br /5.4.3 文本分析小结163br /5.5 协同过滤——构建个性化系统的经典算法164br /5.5.1 协同过滤算法为什么这么流行165br /5.5.2 基于用户和基于产品的协同过滤166br /5.5.3 协同过滤算法小结169br /第6章 经典的深度学习案例171br /6.1 深度学习综述172br /6.1.1 深度学习简介172br /6.1.2 深度学习在图像处理方面的应用174br /6.1.3 深度学习在自然语言处理方面的应用176br /6.2 支持向量机——乔布斯利用大数据对抗178br /6.2.1 乔布斯和胰腺癌的抗争178br /6.2.2 医学统计学和支持向量机180br /6.2.3 支持向量机小结184br /6.3 感知器神经网络——的房产价格预测算法185br /6.3.1 如何预测房价186br /6.3.2 多层感知器和误差曲面188br /6.3.3 感知器神经网络小结191br /6.4 自组织神经网络——如何又快又好地解决旅行商问题193br /6.4.1 路径问题的典型模式和解决方法193br /6.4.2 自组织神经网络的拓扑结构和权值调整194br /6.4.3 自组织神经网络小结198br /6.5 RBM算法——为新闻报道智能分类199br /6.5.1 新闻报道智能分类的难与易199br /6.5.2 RBM算法的学习目标和学习方法201br /6.5.3 RBM算法小结204br / br /第7章 经典的数据挖掘案例207br /7.1 数据挖掘综述208br /7.1.1 什么是数据挖掘208br /7.1.2 数据挖掘的主要应用领域209br /7.1.3 数据挖掘模型的评价指标211br /7.2 判别分析——美国运通构建客户流失预测模型213br /7.2.1 美国运通公司的旧日辉煌213br /7.2.2 判别分析的假设条件和判别函数214br /7.2.3 判别分析小结218br /7.3 购物篮分析——找出业的商品组合220br /7.3.1 名动天下的“啤酒和尿布”案例220br /7.3.2 购物篮分析的频繁模式222br /7.3.3 购物篮分析小结225br /7.4 马尔可夫链——准确预测客运市场占有率227br /7.4.1 复杂的客运市场系统227br /7.4.2 概率转移矩阵的求解方法229br /7.4.3 马尔可夫链小结232br /7.5 AdaBoost元算法——有效侦测欺诈交易的复合算法233br /7.5.1 弱分类器和强分类器之争233br /7.5.2 AdaBoost元算法的分类器构建方法235br /7.5.3 AdaBoost元算法小结238br /第8章 经典的商业智能分析案例241br /8.1 商业智能分析综述242br /8.1.1 什么是商业智能242br /8.1.2 商业智能的主流发展与应用244br / br /8.2 KXEN分析软件——构建欧洲博彩业下注预测平台246br /8.2.1 现代博彩业背后的黑手247br /8.2.2 集体智慧和庄家赔率的联系248br /8.2.3 KXEN软件小结252br /8.3 数据废气再利用——物流公司数据成功用于评估客户信用253br /8.3.1 数据废气和黑暗数据的异同254br /8.3.2 论如何充分利用物流公司数据255br /8.3.3 数据废气再利用小结258br /8.4 必应预测——使用往期信息预测自然灾害259br /8.4.1 预测自然灾害的必要性260br /8.4.2 微软大数据预测的优与劣261br /8.4.3 必应预测小结263br /8.5 点球成金——助力NBA大数据分析的多种神秘软件265br /8.5.1 NBA的有效球员数据265br /8.5.2 有关点球成金的靠谱方法268br /8.5.3 点球成金小结270
主编推荐
精彩内容
span id="content-all"/span本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
媒体评论
— 没有更多了 —
以下为对购买帮助不大的评价