• 大数据原理与技术
21年品牌 40万+商家 超1.5亿件商品

大数据原理与技术

23 3.8折 59.8 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者刘甫迎

出版社电子工业出版社

ISBN9787121431906

出版时间2022-04

版次1

装帧平装

开本16开

纸张胶版纸

页数304页

定价59.8元

上书时间2024-04-15

灵感飞驰

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:大数据原理与技术
定价:59.80元
作者:刘甫迎
出版社:电子工业出版社
出版日期:2022-04-01
ISBN:9787121431906
字数:
页码:304
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐

内容提要
本书分为5篇,包括11章和3个附录。大数据基础篇包括章(绪论);大数据存储篇包括第2~3章(HDFS分布式文件系统、NoSQL及其HBase分布式数据库系统);大数据计算篇包括第4~7章(MapReduce分布式计算、大数据的Spark内存计算、大数据的流计算、大数据的图计算);大数据管理、查询分析及可视篇包括第8~10章(Hadoop的数据整合、集群管理与维护,大数据的查询分析技术,R语言与可视化技术);大数据发展及应用篇包括1章(大数据应用――人工智能深度学习)。本书体现了校际联盟、校企合作的建设成果,将理论与实践相结合,突出实践应用。本书配套的教学资源丰富,包括PPT、教学大纲、实验指导书、习题、模拟考试试卷等,读者在可以登录华信教育资源网(www.hxedu.com.cn)注册后免费下载。本书可以作为应用型本科院校、高等职业院校计算机专业、大数据专业、人工智能专业的教材,也可以作为相关培训机构的教材,还可以作为软件开发和应用从业人员的参考书。
目录
篇  大数据基础篇章  绪    论t21.1  大数据概述t21.1.1  三次信息化浪潮、大数据的兴起与影响t21.1.2  大数据的概念及特征t51.1.3  大数据的计算模式t91.1.4  大数据的关键技术t111.2  大数据的Hadoop解决方案t131.2.1  Hadoop的由来与发展t131.2.2  Hadoop的特性、运行原理和生态环境t141.2.3  Hadoop的企业级开发架构、技术与落地应用t181.3  大数据各时期的热点与数据使用发展趋势t211.3.1  数据架构各时期的演变t221.3.2  Hadoop的YARN计算框架t241.3.3  大数据的实时交互式分析t251.3.4  数据使用发展趋势t25习题t29第二篇  大数据存储篇第2章  HDFS分布式文件系统t322.1  HDFS及其设计思路和架构t322.1.1  HDFS及其设计思路t322.1.2  HDFS的架构与基本存储单元t332.1.3  HDFS的存/取流程t342.2  HDFS Shell的基本操作t382.3  HDFS的命令行操作t412.3.1  HDFS文件访问权限t412.3.2  通过Web浏览HDFS文件t422.3.3  HDFS的接口(API)使用t44习题t46第3章  NoSQL及其HBase分布式数据库系统t483.1  大数据环境中的NoSQLt483.1.1  NoSQL应运而生t483.1.2  NoSQL的类型t493.1.3  NoSQL的三大基石t513.2  HBase的设计思路与架构t543.2.1  HBase的系统架构与组件t543.2.2  HBase的数据模型、物理存储与查找t563.2.3  HBase的数据读/写流程t603.3  HBase的操作与数据管理t613.3.1  HBase的Shell操作t613.3.2  Java API 与非Java访问t643.3.3  HBase的编程实例t653.4  从RDBMS到HBaset673.5  为应用程序选择合适的Hadoop数据存储机制t69习题t70第三篇  大数据计算篇第4章  MapReduce分布式计算t744.1  MapReduce的架构与源码分析t744.1.1  MapReduce的架构与执行过程t744.1.2  MapReduce的输入与输出t754.1.3  MapReduce的Job类t784.2  MapReduce任务的异常处理与失败处理t794.2.1  MapReduce任务的异常处理方式t794.2.2  MapReduce任务的失败处理方式t804.3  在HBase上运行MapReducet804.4  MapReduce程序开发实例t824.5  基于MapReduce的数据挖掘应用t884.5.1  数据挖掘与高级分析库Mahoutt884.5.2  矩阵乘法t904.5.3  相似度计算t93习题t96第5章  大数据的Spark内存计算t995.1  Spark概述t995.1.1  Spark及其架构t995.1.2  Spark的特点及性能t1005.1.3  Spark的基本原理及计算方法t1015.1.4  Spark与MapReduce、Hive对比t1025.1.5  Spark在国内的现状以及未来的展望t1035.2  Spark的RDDt1035.2.1  Spark的核心概念――RDDt1035.2.2  RDD基本操作t1045.2.3  Spark提供的Transformation实现与Action实现t1045.3  Spark的运行模式t1055.3.1  Spark的程序框架t1055.3.2  独立(Standalone)模式t1075.3.3  Spark YARN的模式t1085.4  Spark应用程序t1095.4.1  Scala语言简介t1095.4.2  Spark程序设计t1115.5  Spark SQLt1165.5.1  Spark SQL简介t1165.5.2  DataFramet1175.5.3  Datasetst1225.5.4  使用数据源t124习题t127第6章  大数据的流计算t1296.1  流计算概述t1296.1.1  无界数据及流数据t1296.1.2  流计算概念t1316.1.3  流计算框架t1326.1.4  流计算的价值与应用t1376.2  流计算处理流程t1386.2.1  概述t1386.2.2  数据实时采集t1386.2.3  数据实时计算t1396.2.4  实时查询服务t1406.3  开源流计算框架Flinkt1416.3.1  Flink简介t1416.3.2  Flink的基本架构t1426.3.3  Flink编程t144习题t148第7章  大数据的图计算t1497.1  大数据的图计算概述t1497.2  Spark GraphXt1507.2.1  Spark GraphX简介t1507.2.2  Spark GraphX的实现分析t1517.2.3  Spark GraphX实例t1527.3  Pregelt1557.3.1  Pregel简介t1557.3.2  Pregel图计算模型t1567.3.3  Pregel的体系结构t1597.3.4  PageRank算法及其实现t161习题t165第四篇  大数据管理、查询分析及可视篇第8章  Hadoop的数据整合、集群管理与维护t1688.1  Hadoop数据整合t1688.1.1  Hadoop计算环境中的数据整合问题t1688.1.2  数据库整合工具Sqoop(导入、导出数据)t1688.1.3  Hadoop平台内部数据整合工具――HCatalogt1728.2  Hadoop集群管理与维护t1758.2.1  云计算平台的管理体系t1758.2.2  集群中的配置管理与协调者――ZooKeepert1778.2.3  Hadoop集群部署与监控集成工具――Ambarit1798.2.4  基于Kerberos的Hadoop安全管理t1818.2.5  Hadoop集群管理工具分析t183习题t184第9章  大数据的查询分析技术t1859.1  大数据对传统分析处理的挑战t1859.2  查询(SQL oHadoop)t1859.3  使用Hive和Pig处理数据t1889.3.1  Hive与HiveQL命令t1889.3.2  Pig与Pig Latint1929.3.3  实例t1939.3.4  Hive与Pig对比t1959.4  实时互动的SQL:Impala和Drillt1959.4.1  Cloudera Impalat1959.4.2  Apache Drillt196习题t2050章  R语言与可视化技术t20610.1  开源可视化统计绘图工具――R语言t20610.1.1  R语言概述t20610.1.2  R软件资源t20710.1.3  函数、运算符、数据表和数据框t20810.1.4  数据存/取及脚本语言t20910.1.5  绘图及实例t21010.2  可视化技术t21310.2.1  可视化技术及分类t21310.2.2  入门级工具t21410.2.3  互动图形用户界面控制t21510.2.4  地图工具t21610.2.5  可视化设计工具t21610.2.6  专家级可视化分析工具t217习题t218第五篇  大数据发展及应用篇1章  大数据应用――人工智能深度学习t22011.1  理解大数据深度学习t22011.1.1  机器学习、感知器与大数据深度学习t22011.1.2  人工神经网络与深度学习t22111.2  深度学习的编程基础t22211.2.1  环境配置t22211.2.2  Python入门t22711.2.3  NumPyt22911.2.4  机器学习实践t23211.3  大数据深度学习实践t24011.3.1  卷积神经网络t24011.3.2  深度学习在图像中的应用t240习题t245附录A 《大数据原理与技术》教学大纲t246附录B  实验指导书t247B.1  实验一:Hadoop平台安装环境配置(Ambari)t247B.2  实验二:Hadoop集群配置及HDFS的使用t252B.3  实验三:HBase的安装与实例运行t257B.4  实验四:MapReduce计算t263B.5  实验五:基于MapReduce的大数据挖掘实例t264B.6  实验六:认识Sparkt265B.7  实验七:Spark编程t268B.8  实验八:初步体验大数据流计算框架Flinkt270B.9  实验九:数据库整合工具Sqoop与查询分析(Hive、Pig)t273B.10  实验十:R语言与可视化技术t278B.11  实验十一:认识深度学习(PyCharm、Python、NumPy、 Keras)t280B.12  实验十二:深度学习实例t284附录C  模拟考试t288C.1  模拟考试试卷(一)t288C.2  模拟考试试卷(二)t290参考文献t293
作者介绍

序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP