• 大数据基础与应用 大中专高职机械 赵国生,王健,宋一兵 编
  • 大数据基础与应用 大中专高职机械 赵国生,王健,宋一兵 编
  • 大数据基础与应用 大中专高职机械 赵国生,王健,宋一兵 编
  • 大数据基础与应用 大中专高职机械 赵国生,王健,宋一兵 编
  • 大数据基础与应用 大中专高职机械 赵国生,王健,宋一兵 编
21年品牌 40万+商家 超1.5亿件商品

大数据基础与应用 大中专高职机械 赵国生,王健,宋一兵 编

配以大量的图片说明和实例讲解,典型应用案例部分涵盖了数据采集、数据分析、数据转换等

26.85 4.6折 59 全新

仅1件

北京丰台
认证卖家担保交易快速发货售后保障

作者赵国生,王健,宋一兵 编

出版社机械工业出版社

ISBN9787111637974

出版时间2019-10

版次1

装帧平装

开本16

页数288页

字数459千字

定价59元

货号311_9787111637974

上书时间2024-11-14

智胜图书专营店

七年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
目录:

前言

章初识大数据

1.1大数据产生的背景

1.2大数据的结构与特征

1.2.1大数据的结构

1.2.2大数据的特征

1.3大数据相关概念

1.3.1大数据关键技术

1.3.2数据类型与数据管理

1.3.3数据仓库

1.3.4数据挖掘

1.4大数据可视化

1.4.1什么是数据可视化

1.4.2数据可视化的工具与方法

1.4.3数据可视化的建模

1.4.4数据可视化分类

1.5大数据相关工具

1.5.1hadoop

1.5.2r语言

1.5.3python语言

1.5.4rapidminer

1.5.5tableau

1.6大数据时代的新机遇

1.6.1数据价值

1.6.2应用价值

1.6.3发展前景

1.7本章小结

1.8题

第2章大数据处理架构hadoop

2.1hadoop简介

2.2hadoop发展史及特点

2.3hadoop体系结构

2.3.1hdfs体系结构

2.3.2mapreduce体系结构

2.4醌置linux环境

2.4.1安装vmware12虚拟机

2.4.2部署centos64位作系统

2.4.3配置网络

2.4.4linux终端

2.5hadoop环境搭建

2.5.1k安装和测试

2.5.2hadoop安装和配置

2.5.3ssh密码配置

2.6hadoop关键组件

2.6.1hdfs

2.6.2hbase

2.6.3mapreduce

2.6.4hive

2.6.5pig

2.6.6mahout

2.6.7zookeeper

2.6.8flume

2.6.9sqoop

2.6.10ambari

2.7本章小结

2.8题

第3章分布式文件系统hdfs

3.1hdfs概念

3.1.1hdfs简介

3.1.2hdfs相关概念

3.2hdfs体系结构

3.3hdfs文件存储机制

3.4hdfs的数据读写过程

3.4.1读数据的过程

3.4.2写数据的过程

3.5hdfs应用实践

3.5.1hdfs常用命令

3.5.2hdfs的web界面

3.5.3hdfs常用javaapi及应用实例

3.6本章小结

3.7题

第4章计算系统mapreduce

4.1mapreduce概述

4.1.1mapreduce简介

4.1.2mapreduce数据类型与格式

4.1.3数据类型writable接

4.1.4hadoop序列化与反序列化机制

4.2mapreduce架构

4.2.1数据分片

4.2.2mapreduce的集群行为

4.2.3mapreduce作业执行过程

4.3mapreduce接类

4.3.1mapreduce输入的处理类

4.3.2mapreduce输出的处理类

4.4mapreduce应用案例——单词程序

4.4.1wordcount代码分析

4.4.2wordcount处理过程

4.5本章小结

4.6题

……

第5章分布式数据库hbase

第6章nosql数据库

第7章集群计算spark

第8章流计算storm

第9章分布式协调系统zookeeper

0章销售数据分析系统

1章交互式数据处理

2章协同过滤系统

附录课后题

参文献

内容简介:

大数据基础与应用共分为12章,章介绍了大数据产生的背景、大数据的结构与特征、大数据相关概念、大数据可视化、大数据相关工具与发展前景。第29章为基础知识部分,介绍了大数据的生态系统全貌,重点对计算台hadoop、分布式文件系统hdf、计算框架mapreduce、开源数据库hbae、典型工具noql、集群计算park、流计算torm和分布式协调系统zookeeper等相关技术进行了详细介绍,通过实例使读者具备解决实际问题的能力。012章为典型应用案例部分,介绍了大数据分析应用系统的开发过程,涵盖了数据采集、数据分析、数据转换和结果显示的整个交互式大数据处理和分析流程。
大数据基础与应用内容丰富、条理清晰、示例指导强,读者可以通过章后的题对所学内容作进一步巩固,熟练掌握大数据基本、工程应用场景及实验分析。
大数据基础与应用适合作为大中专院校数据科学与大数据专业、计算机类专业的教材,也可以作为读者自学或者科研技术人员的参书。
大数据基础与应用配套授课电子课件,需要的教师可登录.cmpedu.费注册,审核通过后下载,或联系编辑索取。

精彩内容:

来,大数据浪潮汹涌来袭,与互联网一样,这不仅是信息技术领域的,更是在全球范围加速企业创新、社会变革的利器。现代管理学之父德鲁克说过,预测未来好的方法,是去创造未来。而“大数据战略”正是当下领航全球的先机。大数据指一般的软件工具难以捕捉、管理和分析的大容量数据。大数据之“大”,并不仅在于“容量之大”,更在于其通过对海量数据的交换、整合和分析,发现新的知识、创造新的价值,带来“大知识”“大科技”“大利润”和“大发展”。数据科学与大数据技术专业,简称数科或大数据专业,旨在培养具有大数据思维、运用大数据思维研究及分析的高层次大数据人才,掌握计算机理论和大数据处理技术,从数据管理、系统开发、海量数据分析与挖掘三个层面系统地培养掌握大数据应用中的各种典型问题的解决办法,提升解决实际问题的能力。基本内容本书共分为12章,各章主要内容如下。章主要对大数据产生的背景、大数据的结构与特征、大数据相关概念、大数据可视化、大数据处理相关工具与发展前景进行了介绍。通过章的学,读者能够初步掌握大数据的基本知识,熟悉大数据处理与分析的作环境及可视化方法,为后面的进一步学打下坚实的基础。第2章主要介绍了分布式计算台hadoop及其基础知识、hadoop发展史、hadoop体系结构等,让读者对hadoop有一个简单的认识,了解如何在hadoop上开发和运行处理海量数据的应用。第3章首先介绍分布式文件系统的基本概念、结构和设计需求,然后介绍hdf,详细阐述它的重要概念、体系结构、存储和读写过程,后介绍了一些hdf编程实践方面的知识。第4章着重介绍了mapreduce“分而治之,迭代汇”的处理海量数据的并行编程模型和计算框架,让读者了解mapreduce的数据类型与格式、序列化、数据分片、mapreduce的架构与接类,通过单词程序将上述知识点串联并阐述mapreduce的思想。第5章详细地介绍了hbae开源数据库,hbae的安装与配置、常用api、hbae架构及实现等,使读者快速对hbae有一个全方面的了解。第6章着重介绍了noql的基础,一致策略、数据分区与放置策略、数据复制与容错、数据缓存等,结合noql典型应用工具,结合实例简明扼要地叙述了noql的基本应用。第7章阐述了park生态系统全貌,包含parkql、park treaming、graphx、mllib等,了解park的功能、特点以及场景应用。通过对park的安装部署,基本作和运行模式,并通过编程实例来加深了解运用park的相关知识。第8章首先介绍了torm流计算的基本概念和需求,阐述了流计算的处理流程、应用场景、torm的设计思想和架构设计,后介绍了park treaming及其应用实例。第9章介绍了分布式协调系统zookeeper概念及其主要特征和数据模型、zookeeper的安装和配置、zookeeper api的简单使用、zookeeper hell的作,后介绍了一个选举案例让读者更深入地了解zookeeper的作用及应用。0章通过销售数据分析系统的应用案例,介绍了大数据分析应用系统的完整开发过程,涵盖了数据采集、数据分析、数据转换和结果显示的整个流程。1章介绍了在hadoop台上进行交互式数据处理的方法,然后介绍了利用hive 基本工具进行实时交互式大数据的处理和分析。2章介绍了协同算法的基本概念和几种典型分类。利用park mllib实现了协同过滤算法及协同交互过程。本书特点本书编者长期给本科生和讲授数据库、数据挖掘、物联网和云计算等与大数据相关的课程,有着丰富的实践和科研经验。本书内容条理清晰,并按照读者学的一般规律由浅入深、循序渐进,并配以大量的图片说明和实例讲解,能够使读者快速地了解和掌握大数据及应用案例。读者对象 大数据基础知识的初学者。 具有大数据基础并希望更深入了解、掌握大数据与应用的中级读者。本书适合作为大中专院校数据科学与大数据专业、计算机类专业的教材,也可作为从事大数据挖掘等工作的科研或者工程技术人员的参书。本书由赵国生、王健和宋一兵主编。哈尔滨师范大学赵国生主要负责~8章,哈尔滨理工大学王健负责第9、10章,宋一兵负责1、12章。参加本书编写工作的还有管殿柱、王献红、李文秋,曲晓峰、张慧、蒋欣洋、陈炫慧、贺敬、张志敏等为本书做了大量辅助工作,在此一并感谢。本书得到了以下项目的支持:自然科学项目“可生存系统的自主认知模式研究”(61202458)、自然科学项目“基于认知循环的任务关键系统可生存自主增长模型与方法”(61403109)、高等学校博士点项目(20112303120007)、哈尔滨市科技创新人才研究专项(2016raqxj036)和黑龙江省自然科学(f2017021)。虽然编者在编写本书的过程中力求叙述准确、完善,但由于水有限,书中欠妥之处在所难,希望读者将对本书的意见和建议告诉我们。

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP