消息首页搜索举报

云时代的大数据

7.7 1.3折 58 九品

仅1件

河北衡水

认证卖家担保交易快速发货售后保障

作者周品著

出版社电子工业出版社

出版时间2013-10

版次1

装帧平装

货号3B5-042

上书时间2023-08-16

湖畔雅社

十七年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 9小时
好评率暂无

最新上架

不负少年强：中国男孩留学美国 ¥20.00

静物画精选 ¥5.00

人体图谱第二版 ¥15.00

第七届浪琴表北京国际马术大师赛赛事手册 ¥40.00

小提琴左手技巧练习《第四册》 ¥5.00

吕剧二胡演奏基础教程 ¥30.00

经典风光林容生山水篇 ¥60.00

竞争的战略 ¥6.00

甜如蜜·个中苦 ¥8.00

商品详情

品相描述：九品

图书标准信息

作者周品著
出版社电子工业出版社
出版时间 2013-10
版次 1
ISBN 9787121216442
定价 58.00元
装帧平装
开本 16开
纸张胶版纸
页数 348页
字数 557千字
正文语种简体中文

【内容简介】: 　　《云时代的大数据》以云计算为基石，从概念、研究、应用角度出发，系统地介绍了数据爆炸时代下的大数据。首先介绍了云计算及大数据的基础知识，让读者对云计算及大数据有概要认识；然后根据需要介绍了Hadoop软件下的MapReduce、HDFS及HBase这几个组件；接着全面、系统地介绍了云时代下的大数据，主要包括大数据的链接、聚类、项集、系统、相似项挖掘及数据量化等内容，让读者挖掘云时代大数据体系下的效益、价值及研究方向。
【作者简介】: 　　周品，西北工业大学研究生毕业后，一直从事计算机方面科研与教学工作。广东省计算机协会会员。校优秀教师，自然科学优秀学术著作（佛山）。著作方向：计算机应用技术，MATLAB。
【目录】: 第1章云时代概述
1.1“云”概述
1.1.1什么是云计算
1.1.2给云计算一个说法
1.1.3云计算的使用范围
1.1.4云计算与一般托管环境的差别
1.2云产生的背景
1.2.1经济方面
1.2.2社会层面
1.2.3政治层面
1.2.4技术方面
1.3云计算特点
1.4云时代的七大益处
1.5云计算与其他超级计算的区别
1.5.1云计算与网格计算的区别
1.5.2云计算系统与传统超级计算机的区别
1.6云计算的关键性技术
1.6.1虚拟化
1.6.2分布式文件系统
1.6.3分布式数据库
1.6.4资源管理技术
1.6.5能耗管理技术
1.7云计算基础
1.7.1云计算的定义
1.7.2云计算的特征
1.7.3交付模式
1.7.4部署模式
1.7.5新的应用机遇
1.8从传统IT到云
1.9云计算的研究进展
1.10云计算的生成系统
1.11云计算时代对就业的影响
1.12大数据中的云

第2章大数据概述
2.1大数据概念
2.1.1大数据的应用
2.1.2大数据的战略意义
2.1.3大数据的作用
2.1.4大数据与传统数据库
2.1.5大数据与Web
2.2大数据的理解与实践
2.2.1理解大数据
2.2.2实践大数据
2.3大数据的发展趋势
2.3.1大数据对社会的影响
2.3.2云平台数据更加完善
2.4大数据的挑战、现状与展望
2.4.1概述
2.4.2期望特性
2.4.3并行数据库
2.4.4MapReduce
2.4.5并行数据库和MapReduce的混合架构
2.4.6研究现状
2.4.7MapReduce与关系数据库技术的融合
2.4.8展望研究
2.5大数据行业应用及未来热点
2.5.1分析大数据市场
2.5.2分析大数据应用需求
2.6大数据2012年回顾
2.6.12012年大数据新特征
2.6.2进军大数据
2.6.3新兴企业不断涌现
2.7大数据引导IT支出
2.8数据将变得更加重要
2.9盘点全球13个大数据公司

第3章数据挖掘
3.1数据挖掘的定义
3.1.1技术上的定义及含义
3.1.2商业角度的定义
3.2数据挖掘概述
3.2.1数据挖掘的起源
3.2.2数据挖掘方法论
3.2.3数据挖掘常用方法
3.2.4数据挖掘的实现步骤
3.2.5数据挖掘的功能
3.2.6数据挖掘常用技术
3.2.7数据挖掘与传统分析方法的异同
3.2.8数据挖掘和数据仓库
3.2.9数据挖掘的应用
3.3数据挖掘相关知识
3.3.1词语的重要性
3.3.2哈希函数
3.3.3索引
3.3.4二维存储器
3.3.5自然对数的底e
3.3.6幂定律

第4章数据量化
4.1量化分析简介
4.2规划优质量化分析
4.2.1量化分析开发规划的构成
4.2.2文档
4.3答案纲要
4.4三角交叉法
4.5高级量化分析
4.5.1其他象限
4.5.2量化分析未成熟组织的益处
4.5.3重复业务流程
4.5.4其他象限的量化分析
4.6创建服务目录
4.7构建标准和基准
4.8量化数据谈投资

第5章大规模文件系统MapReduce
5.1分布式文件系统
5.1.1NFS和AFS的区别
5.1.2计算节点的物理结构
5.2MapReduce模型
5.2.1Map任务
5.2.2分组与聚合
5.2.3Reduce任务
5.3MapReduce使用算法
5.3.1向量乘法实现
5.3.2内存处理
5.3.3关系运算
5.3.4分布文件系统实例
5.4MapReduce复合键值对的使用
5.4.1合并键值
5.4.2用复合键排序
5.5链接MapReduce作业
5.5.1顺序链接MapReduce作业
5.5.2复杂的MapReduce链接
5.5.3前后处理的链接
5.5.4链接不同的数据
5.6MapReduce递归扩展
5.7集群计算算法的效率问题
5.7.1集群计算的通信开销模型
5.7.2多路连接

第6章相似项挖掘
6.1近邻搜索的应用
6.1.1Jaccard相似度
6.1.2文档相似度
6.2文档的shingling算法
6.2.1k-shingle
6.2.2大小选择
6.2.3对shingle进行哈希
6.3最小哈希
6.3.1矩阵表示集合
6.3.2最小哈希概述
6.3.3Jaccard相似度
6.3.4最小哈希签名
6.3.5签名计算
6.4语音文档局部敏感哈希算法
6.4.1局部敏感哈希概述
6.4.2行条化策略的分析
6.5距离测试
6.5.1距离测度的定义
6.5.2欧氏距离
6.5.3Jaccard距离
6.5.4余弦距离
6.5.5编辑距离
6.5.6海明距离
6.6其他距离测度的LSH函数族
6.6.1海明距离的LSH函数族
6.6.2随机超平面与余弦距离
6.6.3欧氏距离的LSH函数族
6.7LSH函数的应用
6.7.1实体关联
6.7.2指纹匹配
6.7.3论文相似性检测服务
6.8高相似度方法
6.8.1相等项发现
6.8.2集合字串表示法
6.8.3长度过滤
6.8.4前缀索引
6.8.5位置信息使用
6.8.6使用位置和长度信息的索引

第7章HDFS存储海量数据
7.1HDFS简介
7.1.1HDFS的特点
7.1.2HDFS的设计需求
7.1.3HDFS体系结构
7.1.4HDFS的可靠性措施
7.1.5数据均衡
7.2HDFS存取机制
7.3图像存储
7.3.1图像存储基本思想
7.3.2图像存储设计目标
7.3.3图像存储体系结构
7.3.4系统功能结构
7.4HDFS管理操作
7.4.1权限管理
7.4.2配额管理
7.4.3文件归档
7.5FSShell使用指南
7.6API使用
7.7HDFS的缺点
7.8HDFS存储海量数据

第8章HBase存储百科数据
8.1HBase的系统框架
8.2HBase基本特征
8.2.1RDBMS与HBase
8.2.2NoSQL数据库
8.2.3HBase的特点
8.3HBase的基本接口
8.3.1HBase访问接口
8.3.2HBase的存储格式
8.3.3HBase的读写流程
8.4模块总体设计
8.4.1数据库模块总体设计
8.4.2模块详细设计
8.4.3数据库模块交互设计
8.5HBase数据模型
8.6HBase的安装与配置
8.7HBase实例分析
8.7.1HBase的HFileOutputFormat
8.7.2HBase的TableOutputFormat

第9章大数据链接分析
9.1链接分析中的数据采集研究
9.1.1链接分析概述
9.1.2相关研究
9.1.3系统功能设计
9.1.4实验
9.1.5结论
9.2PageRank工具
9.2.1PageRank概述
9.2.2PageRank定义
9.2.3相关算法
9.2.4避免终止点
9.2.5采集器陷阱及“抽税”法
9.2.6影响PageRank的因素
9.3PageRank算法
9.4搜索引擎研究
9.4.1搜索引擎未来的发展方向
9.4.2通用型搜索引擎
9.4.3主题型搜索引擎
9.4.4性能指标
9.5链接作弊
9.5.1垃圾农场的架构
9.5.2垃圾农场的分析
9.5.3TrustRank
9.5.4垃圾质量
9.6导航页和权威页

第10章聚类
10.1聚类概述
10.1.1聚类的典型应用
10.1.2聚类的典型要求
10.1.3聚类的计算方法
10.1.4聚类分析的特征
10.2聚类技术
10.2.1点、空间和距离
10.2.2维数灾难
10.3层次聚类
10.3.1欧氏空间下的层次聚类
10.3.2控制层次聚类的其他规则
10.3.3非欧空间下的层次聚类
10.4K-均值算法
10.4.1K-均值算法的簇初始化
10.4.2K值的选择
10.4.3BFR算法
10.4.4BFR算法中的数据处理
10.5CURE算法
10.5.1CURE算法流程
10.5.2CURE算法设计
10.5.3数据取样算法
10.6流聚类及并行化
10.6.1流计算模型
10.6.2二次聚类算法
10.7非欧空间下的聚类
10.7.1GRGPF算法的簇表示
10.7.2簇树的初始化
10.7.3算法中加入点
10.7.4分裂与合并

第11章项集与系统
11.1项集与系统概述
11.2项集
11.2.1规则
11.2.2内存使用
11.2.3单调性
11.2.4二元组计数
11.2.5A-Priori算法
11.2.6频繁项集上的A-Priori算法
11.3更大数据集处理
11.3.1PCY算法
11.3.2多阶段算法
11.3.3多哈希算法
11.4有限扫描算法
11.4.1随机算法
11.4.2SON算法
11.4.3MapReduce算法
11.4.4Toivonen算法
11.5流中的频繁项
11.5.1抽样法
11.5.2衰减窗口的频繁项集
11.5.3混合方法
11.6推荐模型系统
11.6.1效用矩阵
11.6.2长尾现象
11.6.3效用矩阵的填充
11.7内容的推荐
11.7.1项模型
11.7.2项模型的表示
11.7.3分类算法
11.8协同过滤
11.8.1协同过滤的优缺点
11.8.2协同过滤案例
11.9降维处理
11.9.1基于中心流形理论的降维方法
11.9.2Lyapunov-SchmidtL-S方法
11.9.3Galerkin方法
11.9.4正交分解技术的降维方法
11.9.5其他降维方法
11.10Netflix大奖赛与推荐系统
参考文献

点击展开点击收起

— 没有更多了 —