书籍均为精品二手图书,出库会经过高温消毒,书籍上架都会检测可保证正版,在线咨询商品可自动为您显示当前库存!
¥ 13.1 2.7折 ¥ 49 九品
库存2件
作者黄宏程 编著
出版社电子工业出版社
出版时间2016-07
版次1
装帧平装
货号997385260792545281
上书时间2024-12-16
本书从大数据的基本概念出发,深入解析了大数据应用的关键技术与应用。以大数据的数据挖掘技术、大数据的存储与处理、大数据应用的总体架构三方面为线索,详细阐述了大数据挖掘的诸多常用算法,介绍了Hadoop、HDFS及MapReduce等大数据存储与处理的关键技术与应用、大数据应用的框架与构架。本书以通信运营商及互联网电子商务等应用为背景,从典型实例的角度系统地介绍了大数据挖掘应用从目标构建、算法建模到程序实现,再到大数据分析及结果描述应用的整个过程,以期为读者提供从理论到实务的有效借鉴。
黄宏程:重庆邮电大学副教授,主要从事复杂网络与信息处理、大数据技术等方向的研究与应用,近年来,作为项目负责人或主研人员,参加多项国家自然科学基金和省部级重点科研项目10余项,2012、2013年度中国人民解放军科学技术进步奖获得者。发表论文20余篇,其中SCI/EI检索10余篇次,申请国家发明专利8项,授权5项。
第1章 大数据概述 1
1.1大数据的概念 1
1.1.1什么是大数据 1
1.1.2大数据的产生和来源 2
1.1.3大数据的技术 3
1.1.4大数据的特征 8
1.1.5数据、信息与知识 10
1.2大数据的价值与挑战 10
1.2.1大数据的潜在价值 11
1.2.2大数据对业务的挑战 12
1.2.3大数据对技术架构的挑战 13
1.2.4大数据对管理策略的挑战 14
1.3大数据与相关领域的关系 16
1.3.1大数据与统计分析 16
1.3.2大数据与数据挖掘 16
1.3.3大数据与云计算 17
1.4大数据发展状况 20
参考文献 23
第2章 大数据挖掘技术 24
2.1数据挖掘与过程 24
2.1.1数据挖掘的七大功能 24
2.1.2数据挖掘的实质 25
2.2数据挖掘过程 26
2.2.1定义挖掘目标 27
2.2.2数据取样 28
2.2.3数据探索 30
2.2.4数据预处理 32
2.2.5数据模式发现 37
2.2.6模型评价 40
2.3常用算法 47
2.3.1决策树 48
2.3.2回归 50
2.3.3关联规则 54
2.3.4聚类 59
2.3.5贝叶斯分类方法 66
2.3.6神经网络 69
2.3.7支持向量机(SVM) 73
2.3.8假设检验 77
2.3.9遗传算法 81
参考文献 84
第3章 大规模存储与处理技术 86
3.1Hadoop概述 86
3.1.1什么是Hadoop 86
3.1.2Hadoop发展简史 88
3.1.3Hadoop的优势 90
3.1.4Hadoop的子项目 90
3.2HDFS 92
3.2.1HDFS的设计目标 93
3.2.2HDFS文件系统的原型GFS 93
3.2.3HDFS文件的基本结构 95
3.2.4HDFS的文件读/写操作 97
3.2.5HDFS的存储过程 101
3.3MapReduce编程框架 105
3.3.1MapReduce的发展历史 105
3.3.2MapReduce的基本工作过程 107
3.3.3MapReduce的特点 110
3.4建立Hadoop开发环境 111
3.4.1相关准备工作 111
3.4.2JDK的安装配置 113
3.4.3SSH无钥登录 113
3.4.4安装、配置Hadoop环境变量 115
3.5大数据处理系统分类 118
3.5.1批量数据处理系统 118
3.5.2流式数据处理系统 119
3.5.3交互式数据处理 122
3.5.4图数据处理系统 124
3.6大数据查询和分析技术:SQLonHadoop 126
3.6.1数据库简介 126
3.6.2图数据库 128
3.6.3Hive:基本的Hadoop分析 130
3.6.4实时互动的SQL:Impala和Drill 134
3.7以通信业务分析为例的大数据的技术环境部署 136
3.7.1应用架构规划与设计 136
3.7.2技术环境部署与配置 137
第4章 大数据应用的总体架构和关键技术 148
4.1大数据的业务分析 148
4.2大数据的总架体构模型 152
4.3大数据高级分析 161
4.3.1数据仓库与联机分析处理技术 162
4.3.2大数据分析与传统分析 167
4.3.3非结构化复杂数据分析 168
4.3.4实时预测分析 177
4.4可视化分析 181
4.4.1可视化技术 181
4.4.2可视化工具 192
参考文献 195
第5章 运营商数据分析 196
5.1案例背景 196
5.1.1大数据运营已为大势所趋 196
5.1.2采取大数据运营的原因 196
5.1.3大数据分析如何提升电信行业绩效 197
5.1.4大数据的社会价值 199
5.2挖掘目标的提出 200
5.3案例分析 201
5.3.1体系架构 201
5.3.2Hadoop集群抽取模块 202
5.3.3数据处理模块 208
5.3.4数据分发 211
5.4MapReduce操作 218
5.5结果分析 221
第6章 互联网电影推荐系统 223
6.1背景描述 223
6.2业务目标 224
6.3业务需求 225
6.4协同过滤推荐系统建模 225
6.4.1推荐系统概述 225
6.4.2基于对立用户的协同过滤模型 227
6.5项目处理过程 229
6.5.1项目数据 229
6.5.2数据预处理 230
6.5.3Hadoop并行算法 242
6.6总结 250
— 没有更多了 —
以下为对购买帮助不大的评价