云计算与大数据技术理论及应用
全新正版 急速发货
¥
67.5
7.6折
¥
89
全新
库存9件
作者林伟伟、彭绍亮
出版社清华大学出版社
ISBN9787302524458
出版时间2019-06
装帧平装
开本16开
定价89元
货号27903738
上书时间2024-12-20
商品详情
- 品相描述:全新
- 商品描述
-
前言
前言
背景与内容规划
随着云计算与大数据应用的快速增长,云计算与大数据技术已逐步成为当前及未来信息处理的基础性技术。因此,在该领域急需大量的相关人才与研发人员,本书正是为了适应这一新的发展趋势和需求而编写的。与现有的教材和图书主要以阐述技术原理不同,为了更好地帮助读者深入理解技术原理和应用研发方法,本教材以应用需求为背景剖析这些技术的原理和应用方法,使用了我们在云计算与大数据相关研究和项目开发实践中总结的大量编程实例和实际应用开发案例,从理论上剖析技术原理本质和从实践上解析技术应用方法。本书主要内容涉及传统分布式计算的基本原理、基本开发技术与方法,云计算的技术原理与编程技术,云存储技术,大数据技术原理与平台架构、应用开发技术与应用案例。本书可为计算机相关专业的本科生、研究生和专业技术人员提供丰富、全面的分布式计算、云计算、大数据技术的知识体系和研发实践技术,也能使相关专业科研人员进一步从事相关研究打下良好基础,并对云计算、大数据等新技术的研究与应用起到较好的推动作用。
本书主要内容包括: 分布式计算范型技术原理与编程技术,Google云、亚马逊云及阿里云技术原理,云存储技术,Hadoop和Spark技术原理与平台。本书从技术应用开发实践方面给出大量编程实例和应用开发案例,具体包括客户/服务器程序开发、P2P应用程序开发、云计算任务调度算法、云计算能耗优化资源调度算法、3个大数据分析计算应用案例和3个生物医药大数据计算案例。全书共分12章,各章之间的层次关系如下:
教学资源与使用方法
本书配套了PPT课件和课后习题参考答案,使用本书进行教学的教师可以到清华大学出版社网站www.tup.tsinghua.edu.cn申请,或发送邮件至linww@scut.edu.cn或lin_w_w@qq.com向作者索取本书相关教学资源。
本书可以作为计算机相关专业的本科高年级学生和研究生的教材,学生好在学习过操作系统、计算机网络、面向对象编程语言之后学习本课程。全书内容可根据不同的教学目的和对象进行选择。但根据本书的定位,建议每章讲授学时分配如下:
章名建议重点讲授章节建 议 学 时
第1章所有小节
2
第2章
所有小节
8
第3章
所有小节
6
第4章
4.1,4.3,4.4,4.6节
8
第5章
5.1,5.2节
4
第6章
6.2.1,6.2.2,6.3,6.4,6.5节
10
第7章
所有小节
3
第8章
所有小节
4
第9章
所有小节
2
第10章
所有小节
2
第11章
所有小节
2
第12章
所有小节
2
此外,本书的教学应该有相应的实验教学内容,建议实验课程的学时数不少于理论课程学时数的三分之一。
致谢
本书受到国家超级计算长沙中心和深圳鹏城实验室的支持,感谢国家重点研发计划2018YFC0910405,2017YFB0202602,2017YFC1311003,2016YFC1302500,2016YFB0200400,2017YFB0202104; 国家自然科学基金61872084,61772205,61772543,U1435222,61625202,61272056; 化学生物传感与计量学国家重点实验室基金等项目,和湖南智超医疗科技有限公司、北京以利天诚科技有限公司(www.ylitech.com)、亚马逊公司等单位和专家的支持。
本书由林伟伟博士负责总体设计、组织全书编写,彭绍亮教授负责整体润色、全书校审和内容把关; 本书各章内容的编写由项目组多位研究生参与完成,在本书的编写过程中,他们投入大量精力进行程序设计与资料收集整理工作,他们是吴梓明、温昂展、徐思尧、吴文泰、陈颖璇、刘阳、张子龙、李雷、伍秋平、郭超等,在此特别表示感谢。
衷心感谢中国科学院陈国良院士,陈院士出版的《并行计算系列丛书》体系完整,框架清晰,内容丰富,与时俱进,时时提醒我要以这样的标准写书。特别感谢我的博士导师华南理工大学齐德昱教授和华南师范大学刘波教授等对本书编写的指导和鼓励。感谢清华大学出版社对本书出版的大力支持。
本书的撰写和相关技术的研究中,尽管笔者投入了大量的精力,付出了艰辛的努力,然而受知识水平所限,不足之处在所难免,恳请大家批评指正。如果有任何问题和建议,欢迎发送邮件至linww@scut.edu.cn或lin_w_w@qq.com。
华南理工大学林伟伟
2019年6月于广州
导语摘要
内容新颖先进;内容涉及*的云计算与雾计算技术,大数据的新技术平台、新应用案例和生物信息计算示例等;知识系统全面:从传统的经典分布式计算原理开始,系统地、深入剖析新兴的云计算、雾计算和大数据的技术原理;技术深入易学:通过大量的编程案例和应用开发实践让读者更容易学习和深刻理解相关技术原理、技术开发与应用方法;
目录
目录
第1章绪论
1.1分布式计算概念
1.1.1定义
1.1.2优缺点
1.1.3经典的分布式计算项目
1.2分布式计算模式
1.2.1单机计算
1.2.2并行计算
1.2.3网络计算
1.2.4对等计算
1.2.5集群计算
1.2.6网格计算
1.2.7云计算
1.2.8雾计算
1.2.9边缘计算
1.2.10大数据计算
1.3CAP定理
1.3.1CAP定理历史
1.3.2CAP定理应用
1.3.3CAP问题的实例
习题
第2章分布式计算编程基础
2.1进程间通信
2.1.1进程间通信概念
2.1.2IPC原型与示例
2.2Socket编程
2.2.1Socket概述
2.2.2流式Socket编程
2.3RMI编程
2.3.1RMI概述
2.3.2RMI基本分布式应用
2.4P2P编程
习题
第3章云计算原理与技术
3.1云计算概述
3.1.1云计算起源
3.1.2云计算的概念与定义
3.1.3云计算与分布式计算
3.1.4云计算分类
3.2云计算关键技术
3.2.1体系结构
3.2.2数据存储
3.2.3计算模型
3.2.4资源调度
3.2.5虚拟化
3.3Google云计算原理
3.3.1GFS
3.3.2MapReduce
3.3.3BigTable
3.3.4Dremel
3.4亚马逊云服务
3.4.1亚马逊云平台存储架构
3.4.2EC2、S3、SimpleDB等组件
3.5基于亚马逊云的大数据分析案例
3.5.1亚马逊云平台存储架构
3.5.2亚马逊云的Web服务器日志大数据分析案例
3.6阿里云
3.6.1飞天开放平台架构
3.6.2开放云计算服务ECS
3.6.3开放存储服务OSS和CDN
3.6.4开放结构化数据服务OTS
3.6.5关系型数据库(RDS)
3.6.6开放数据处理服务(ODPS)
习题
第4章云计算编程实践
4.1CloudSim体系结构和API介绍
4.1.1CloudSim体系结构
4.1.2CloudSim 3.0 API介绍
4.2CloudSim环境搭建和使用方法
4.2.1环境配置
4.2.2运行样例程序
4.3CloudSim扩展编程
4.3.1调度策略的扩展
4.3.2仿真核心代码
4.3.3平台重编译
4.4CloudSim的编程实践
4.4.1CloudSim任务调度编程
4.4.2CloudSim网络编程
4.4.3CloudSim能耗编程
4.5MultiRECloudSim
4.5.1MultiRECloudSim体系结构和原理
4.5.2MultiRECloudSim的API
4.5.3MultiRECloudSim的使用方法
4.6云环境任务调度编程实践
4.6.1云计算的资源管理
4.6.2云任务调度模拟实验
习题
第5章云存储技术
5.1存储基础知识
5.1.1存储组网形态
5.1.2RAID
5.1.3磁盘热备
5.1.4快照
5.1.5数据分级存储概念
5.2云存储概念与技术原理
5.2.1分布式存储
5.2.2存储虚拟化
5.3对象存储技术
5.3.1对象存储架构
5.3.2传统块存储与对象存储
5.3.3对象
5.3.4对象存储系统组成
5.4存储技术趋势
5.4.1存储虚拟化
5.4.2固态硬盘
5.4.3重复数据删除
5.4.4语义化检索
5.4.5存储智能化
5.4.6混合存储系统
习题
第6章大数据技术原理与平台
6.1大数据概述
6.1.1大数据产生的背景
6.1.2大数据的定义
6.1.3大数据的4V特征
6.2大数据存储平台
6.2.1HDFS
6.2.2HBase
6.2.3Cassandra
6.2.4Redis
6.2.5MongoDB
6.3大数据计算模式
6.3.1MapReduce
6.3.2Spark
6.3.3流式计算
6.4典型大数据分析管理平台
6.4.1Cloudera Impala
6.4.2Hortonworks Data Platform
6.4.3HadoopDB
6.5大数据并行计算编程实践
6.5.1基于MAPREDUCE程序实例(HDFS)
6.5.2基于MAPREDUCE程序实例(HBase)
6.5.3基于Spark的程序实例
6.5.4基于Impala的查询实践
6.6大数据研究与发展方向
6.6.1数据的不确定性与数据质量
6.6.2跨领域的数据处理方法的可移植性
6.6.3数据处理的时效性保证——内存计算
6.6.4对于流式数据的实时处理
6.6.5大数据应用
6.6.6大数据发展趋势
习题
第7章实时医疗大数据分析案例
7.1案例背景与需求概述
7.1.1背景介绍
7.1.2基本需求
7.2设计方案
7.2.1ETL
7.2.2非格式化存储
7.2.3流处理
7.2.4训练模型与结果预测
7.3环境准备
7.3.1节点规划
7.3.2软件选型
7.4实现方法
7.4.1使用Kettle/Sqoop等ETL工具,将数据导入HDFS
7.4.2基于Spark Streaming开发Kafka连接器组件
7.4.3基于Spark MLlib开发数据挖掘组件
7.5不足与扩展
习题
第8章保险大数据分析案例
8.1案例背景与需求概述
8.1.1背景介绍
8.1.2基本需求
8.2设计方案
8.2.1基于GraphX的并行家谱挖掘算法
8.2.2基于分片技术的随机森林算法
8.2.3基于内存计算的FPGrowth关联规则挖掘算法
8.3环境准备
8.4实现方法
8.4.1基于GraphX的并行家谱挖掘
8.4.2基于分片技术的随机森林模型用户推荐
8.4.3基于FPGrowth关联规则挖掘算法的回归检验
8.4.4结果可视化
8.5不足与扩展
习题
第9章基于Spark聚类算法的网络流量异常检测
9.1基本需求与数据说明
9.1.1基本需求
9.1.2数据说明
9.2设计方案
9.2.1聚类问题描述
9.2.2系统整体架构和算法设计
9.2.3数据预处理
9.2.4聚类算法
9.2.5聚类质量评估算法
9.2.6检测算法
9.3实现方法和程序设计
9.3.1搭建Spark集群实验平台
9.3.2程序运行说明
9.3.3数据预处理
9.3.4基于R的数据分析和可视化
9.3.5聚类算法
9.3.6聚类质量评估
9.3.7异常检测
9.4结果展示
9.4.1Spark平台说明与作业提交演示
9.4.2聚类算法及其质量评估
9.4.3有效性分析
9.4.4示例说明
9.5展望
习题
第10章基于Hadoop的宏基因组序列比对计算
10.1相关背景介绍与基本需求
10.1.1相关背景
10.1.2基本需求
10.2设计方案
10.2.1串行程序分析
10.2.2并行程序设计
10.3实现方法
10.3.1自定义Hadoop Streaming Inputformat
10.3.2修改SOAPaligner程序的输入文件函数
10.4环境建立和实验数据说明
10.4.1案例环境
10.4.2实验数据
10.5结果展示
10.5.1测试方法
10.5.2测试结果和分析
习题
第11章基于细胞反应大数据的生物效应评估计算
11.1相关背景介绍与基本需求
11.1.1相关背景
11.1.2基本需求
11.2设计方案
11.2.1基本思路
11.2.2设计框架
11.3环境建立和实验数据说明
11.3.1案例环境
11.3.2实验数据
11.4实现方法
11.4.1算法分析
11.4.2基因谱两两比对——富集积分矩阵并行化计算
11.4.3基因谱聚类分析——KMedoids算法并行化
11.5结果展示
11.5.1基因谱两两比对——计算富集积分矩阵实验分析
11.5.2基因谱聚类实验分析
习题
第12章基于Spark的海量宏基因组聚类问题分析计算
12.1相关背景介绍与基本需求
12.1.1相关背景
12.1.2基本需求
12.2问题分析与设计方案
12.2.1问题分析
12.2.2设计方案
12.3实现方法
12.3.1基于Spark的相似基因对问题的实现
12.3.2利用LSH加速相似基因对算法
12.3.3基因图的生成
12.3.4图的基本性质分析
12.3.5基因图聚类
12.4环境建立和实验数据说明
12.4.1案例环境
12.4.2实验数据
12.5结果展示
12.5.1LSH方法精确度分析
12.5.2可扩展性分析和加速效果分析
12.5.3基因图顶点的度分布和连通性分析
12.5.4基因图聚类结果分析
12.5.5总结
习题
参考文献
内容摘要
内容新颖先进;内容涉及*的云计算与雾计算技术,大数据的新技术平台、新应用案例和生物信息计算示例等;
知识系统全面:从传统的经典分布式计算原理开始,系统地、深入剖析新兴的云计算、雾计算和大数据的技术原理;
技术深入易学:通过大量的编程案例和应用开发实践让读者更容易学习和深刻理解相关技术原理、技术开发与应用方法;
主编推荐
本书从本质原理上剖析了云计算、雾计算与大数据技术
精彩内容
第3章云计算原理与技术
3.1云计算概述
本章首先介绍云计算起源、定义和分类等基本概念,接着重点阐述了云计算的关键技术,然后分别讨论了谷歌云、亚马逊云和阿里云的技术原理,并给出了一个基于亚马逊云的大数据分析案例,让读者更深刻地理解如何利用公有云来实现大数据分析应用。
3.1.1云计算起源
随着信息和网络通信技术的快速发展,计算模式从初的把任务交给大型处理机集中计算,逐渐发展为更有效率的基于网络的分布式任务处理模式,自20世纪80年代起,互联网得到快速发展,基于互联网的相关服务的增加,以及使用和交付模式的变化,云计算模式应运而生。如图31所示,云计算是从网络即计算机、网格计算池发展而来的概念。
图31云计算的起源
早期的单处理机模式计算能力有限,网络请求通常不能被及时响应,效率低下。随着网络技术不断发展,用户通过配置具有高负载通信能力的服务器集群提供急速增长的互联网服务,但在遇到负载低峰的时候,通常会有资源浪费和闲置,导致用户的运行维护成本提高。而云计算把网络上的服务资源虚拟化并提供给其他用户使用,整个服务资源的调度、管理、维护等工作都由云端负责,用户不必关心“云”内部的实现就可以直接使用其提供的各种服务,因此,如图32所示,云计算实质上是给用户提供像传统的电力、水、煤气一样的按需计算服务,它是一种新的有效的计算使用范式。
图32云计算的目标
云计算是分布式计算、效用计算、虚拟化技术、Web服务、网格计算等技术的融合和发展,其目标是用户通过网络能够在任何时间、任何地点限度地使用虚拟资源池,处理大规模计算问题。目前,在学术界和工业界共同推动之下,云计算及其应用呈现迅速增长的趋势,各大云计算厂商如Amazon、IBM、Microsoft、Sun等公司都推出了自己研发的云计算服务平台。而学术界也源于云计算的现实背景纷纷对模型、应用、成本、仿真、性能优化、测试等诸多问题进行了深入研究,提出了各自的
— 没有更多了 —
以下为对购买帮助不大的评价