【包邮】 大数据 【正版九新】
九品消毒塑封
¥
18.5
3.2折
¥
58
九五品
库存11件
作者刘鹏
出版社电子工业出版社
ISBN9787121304309
出版时间2017-01
装帧其他
开本16开
定价58元
货号9787121304309
上书时间2024-12-22
商品详情
- 品相描述:九五品
- 商品描述
-
作者简介
刘鹏,教授,清华大学博士毕业,现任南京大数据研究院院长、中国信息协会大数据分会副会长、中国大数据专家委员会委员。
曾率队夺得2002PennySort靠前计算机排序比赛**(这是我国获得的**个大数据比赛世界**),两次夺得全国高校科技比赛*高奖,并三次夺得清华大学科技比赛*高奖。
主持完成科研项目25项,发表论文80余篇,出版专业书籍20本。2002年开创性提出“计算池”模式,被2007年开始流行的“云计算”所证实。2003年开创性提出“反垃圾邮件网格”,被2008年开始流行的“云安全”所证实。获部级科技进步二等奖4项,三等奖4项。
获“全军十大学习成才标兵”(排名**)、南京“十大杰出青年”、江苏省中青年科学技术带头人、清华大学“学术新秀”等称号。
目录
第1章 大数据概念与应用
1.1 大数据之“大”
1.2 大数据的来源
1.3 大数据的技术支撑
1.4 大数据应用场景
1.5 如何开展大数据研发
习题
参考文献
第2章 数据采集与预处理
2.1 大数据采集架构
2.1.1 概述
2.1.2 常用大数据采集工具
2.1.3 ADache Kafka数据采集
2.2 数据预处理原理
2.2.1 数据清洗
2.2.2 数据集成
2.2.3 数据变换
2.3 数据仓库与ETL工具
2.3.1 概述
2.3.2 常用ETL工具
2.3.3 案例:Kettle数据迁移
习题
参考文献
第3章 数据挖掘算法
3.1 数据挖掘概述
3.1.1 数据挖掘概念
3.1.2 数据挖掘常用算法
3.1.3 数据挖掘应用场景
3.1.4 数据挖掘工具
3.2 分类
3.2.1 贝叶斯决策与分类器
3.2.2 SVM算法
3.2.3 案例:在线广告推荐中的分类
3.3 聚类
3.3.1 非监督机器学习方法与聚类
3.3.2 常用聚类算法
3.3.3 案例:海量视频检索中的聚类
3.4 关联规则
3.4.1 关联规则的概念
3.4.2 频繁项集的产生及其经典算法
3.4.3 分类技术
3.4.4 关联规则挖掘在车辆保险中的应用——客户风险分析.
3.5 预测模型
3.5.1 预测与预测模型
3.5.2 时间序列预测
3.5.3 案例:地震预警中的预测方法
3.6 数据挖掘算法综合应用
习题
参考文献
第4章 大数据挖掘工具
4.1 Mahout
4.1.1 安装Mahout
4.1.2 聚类算法
4.1.3 分类算法
4.1.4 协同过滤算法
4.1.5 案例:基于Mahout Spark Shell的中文新闻分类
4.2 Spark MLlib
4.2.1 聚类算法
4.2.2 回归算法
4.2.3 分类算法
4.2.4 协同过滤算法
4.2.5 案例:基于ALS算法的影片推荐
4.3 其他数据挖掘工具
习题
参考文献
第5章 R语言
5.1 R语言简介
5.1.1 R语言的产生与发展历程
5.1.2 R语言基本功能介绍
5.1.3 R语言常见的应用领域
5.2 R与数据挖掘
5.2.1 R软件包与常见的数据挖掘算法介绍
5.2.2 R在数据挖掘中的应用举例
5.3 SparkR
5.3.1 SparkR简介
5.3.2 SparkR环境搭建
5.3.3 SparkR使用
5.3.4 SparkR与HQL
5.3.5 SparkR实现的主要机器学习算法概述
5.3.6 SparkR在数据分析中的应用举例
习题
参考文献
第6章 深度学习
6.1 概述
6.1.1 人工智能简史
6.1.2 神经网络
6.1.3 大数据与深度学习
6.1.4 人工智能的未来
6.2 深度神经网络
6.2.1 整体架构
6.2.2 自动编码器
6.2.3 受限玻尔兹曼机
6.2.4 深度置信网络
6.2.5 卷积神经网络
6.2.6 循环(递归)神经网络
6.3 软硬件实现
6.3.1 TensorFlow
6.3.2 Caffe
6.3.3 其他深度学习软件
6.3.4 深度学习一体机
6.4 深度学习应用
6.4.1 语音识别
6.4.2 图像分析
6.4.3 自然语言处理
习题
参考文献
第7章 大数据可视化
7.1 数据可视化基础
7.1.1 可视化的基本特征
7.1.2 可视化的目标和作用
7.1.3 数据可视化流程
7.2 大数据可视化方法
7.2.1 文本可视化
7.2.2 网络(图)可视化
7.2.3 时空数据可视化
7.2.4 多维数据可视化
7.3 大数据可视化软件与工具
7.3.1 Excel
7.3.2 Processing
7.3.3 NodeXL
7.3.4 ECharts
习题
参考文献
第8章 互联网大数据处理
8.1 互联网信息抓取
8.1.1 概述
8.1.2 Nutch爬虫
8.1.3 案例:招聘网站信息抓取
8.1.4 案例:舆情信息汇聚
8.2 文本分词
8.2.1 概述
8.2.2 MMSEG分词工具
8.2.3 斯坦福NLTK分词工具
8.3 倒排索引
8.3.1 倒排索引原理
8.3.2 倒排索引实现
8.4 网页排序算法
8.4.1 概述
8.4.2 TD-IDF算法
8.4.3 BM25算法
8.4.4 Pagerank算法
8.5 历史信息检索
8.5.1 系统架构
8.5.2 数据抓取与整合
8.5.3 查询引擎
8.5.4 运行效果
习题
参考文献
第9章 大数据商业应用
9.1 用户画像与精准营销
9.1.1 概述
9.1.2 用户画像
9.1.3 案例:航空旅客画像
9.1.4 案例:购物人员画像
9.1.5 案例:移动用户画像
9.1.6 精准营销
9.2 广告推荐
9.2.1 推荐系统
9.2.2 广告点击率及其预估
9.2.3 基于位置的服务与广告推荐
9.3 互联网金融
9.3.1 概述
9.3.2 应用场景
9.3.3 案例:互联网信贷
9.3.4 案例:互联网融资
9.3.5 大数据技术在互联网金融中的应用
习题
参考文献
第10章 行业大数据
10.1 地震大数据
10.1.1 大数据时代和地震
10.1.2 密集地震观测网将地震带进大数据时代
10.1.3 地震大数据一定是巨量数据
10.1.4 地震大数据找关联
10.1.5 数据处理从复杂到简单
10.1.6 大数据推进地震新模式和新业态
10.2 交通大数据
10.2.1 智慧交通与大数据
10.2.2 大数据应用交通的意义
10.2.3 交通大数据中的数据挖掘技术
10.2.4 大数据挖掘技术在智能交通中的应用
10.2.5 河北交通卡口数据分析系统
10.3 环境大数据
10.3.1 环境大数据概念
10.3.2 环境数据的采集与获取
10.3.3 环境数据的存储与处理
10.3.4 环境数据的应用
10.4 警务大数据
10.4.1 大数据时代警务新模式
10.4.2 警务大数据应用价值
10.4.3 如何开展警务大数据研发
10.4.4 警务大数据应用场景
10.4.5 警务大数据发展方向
习题
参考文献
附录 大数据实验一体机
内容摘要
刘鹏主编的《大数据》是国内绝大多数高校采用的知名教材《云计算》(1~3版)的姊妹篇,是中国大数据专家委员会刘鹏教授联合国内多位专家历时两年的心血之作。大数据领域一直缺乏一本权威教材,希望本书能够填补空白。本书系统地介绍了大数据的理论知识和实战应用,包括大数据采集与预处理、数据挖掘算法与工具、深度学习以及大数据可视化等,并深度剖析了大数据在互联网、商业和典型行业的应用。刘鹏教授创办的网站中国大数据(thebigdata.cn)、中国云计算(chinacloud.cn)和微信公众号刘鹏看未来(lpoutlook)将免费提供本书配套PPT和其他资料。本书配套的大数据实验体系已经在郑州大学等高校成功应用。
“让学习变得轻松”是本书的初衷。本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据研发人员的自学书籍。
— 没有更多了 —
以下为对购买帮助不大的评价