• 大数据背景下数据挖掘技术与应用探究 机械工程 周琼
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

大数据背景下数据挖掘技术与应用探究 机械工程 周琼

25.89 4.6折 56 全新

仅1件

山东泰安
认证卖家担保交易快速发货售后保障

作者周琼

出版社中国原子能出版社

出版时间2018-12

版次1

装帧其他

货号603 11-28

上书时间2024-11-29

邹鲁文化书店

十一年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 周琼
  • 出版社 中国原子能出版社
  • 出版时间 2018-12
  • 版次 1
  • ISBN 9787502296032
  • 定价 56.00元
  • 装帧 其他
  • 开本 16开
【内容简介】


本书立足大数据背景下,对数据挖掘技术与应用进行探究。首先介绍了大数据与大数据时代、大数据时代的思维变革,然后分析了数据科学与数据科学家、大数据时代的数据挖掘以及数据挖掘在云计算中的应用,之后梳理了时间序列、序列模式、社交媒体以及空间数据,后对大数据预测分析进行结和探讨。

精彩内容:

章大数据与大数据时代节什么是大数据信息社会所带来的好处是显而易见的:每个人袋里都揣有一部手机,每个办公桌上都放着一台计算机,每间办公室内都连接到局域网甚至互联网。随着计算机技术全面和深度地融入社会生活,信息爆炸已经积累到了一个开始引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息量的变化还导致了信息形态的变化——量变引起了质变。先经历信息爆炸的学科,如天文学和基因学,创造出了“大数据”(bigdata)这个概念。如今,这个概念几乎应用到了所有人类致力于发展的领域中。一、天文学——信息爆炸的起源综合观察社会各个方面的变化趋势,我们能真正意识到信息爆炸或者说大数据的时代已经到来。以天文学为例,2000年斯隆数字巡天项目启动的时候,位于新墨西哥州的在短短几周内收集到的数据,比世界天文学历共收集的数据还要多。到了2010年,信息档案已经高达(1.4×22)b。不过,预计2016年在智利投入使用的大型视场全景巡天能在5天之内获得同样多的信息。天文学领域发生的变化在社会各个领域都在发生。2003年,人类次破译人体基因密码的时候,辛苦工作了十年才完成了30亿对碱基对的排序。大约十年之后,世界范围内的基因仪每15分钟可以完成同样的工作。在金融领域,美国股市每天的成交量高达70亿股,而其中三分之二的交易都是由建立在数学模型和算法之上的计算机程序自动完成的,这些程序运用海量数据来预测利益和降低风险。互联网公司更是要被数据淹没了。谷歌公司每天要处理超过24pb(25°b,拍字节)的数据,这意味着其每天的数据处理量是美国图书馆所有纸质出版物所含数据量的上千倍。facebook(脸书)这个创立不过十来年的公司,每天更新的照片量超过1000万张,每天人们在上单击“喜欢”like)按钮或者写大约有30亿次,这为facebook公司挖掘用户喜好提供了大量的数据线索。与此同时,谷歌子公司youtube每月接待多达8亿的访客,均每一秒钟会有一段长度在一小时以上的上传。推特(twiter)上的信息量几乎每年翻一番,每天都会发布超过4亿条。从科学研究到医疗保险,从银行业到互联网,各个不同的领域都在讲述着一个类似的故事,那是爆发式增长的数据量。这种增长超过了人们创造机器的速度,甚至超过了人们的想象。我们周围到底有多少数据?增长的速度有多快?许多人试图测量出一个确切的数字。尽管测量的对象和方法有所不同,但他们都获得了不同程度的成功。南加利福尼亚大学安伯格通信学院的马丁希尔伯特进行了一个比较全面的研究,他试图得出人类所创造、存储和传播的信息的确切数目。他的研究范围不仅包括书籍、图画、电子邮件、照片、音乐、(模拟和数字),还包括电子游戏、电话、汽车导航和信件。马丁希尔伯特还以收视率和收听率为基础,对电视、电台这些广播媒体进行了研究。据他估算,仅在2007年,人类存储的数据超过了300eb(2“b,艾字节)。下面这个比喻应该可以帮助人们更容易地理解这意味着什么:一部完整的数字电影可以压缩成一个gb的文件,而一个艾字节相当于10亿gb,一个泽字节(zb,27°b)则相当于1024eb。之,这是一个非常庞大的数量。有趣的是,在2007年的数据中,只有7%是存储在报纸、书籍、图片等媒介上的模拟数据,其余是数字数据。模拟数据也称为模拟量,相对于数字量而言,指的是取值范围是连续的变量或者数值,例如声音、图像、温度、压力等。模拟数据一般采用模拟信号,例如用一系列连续变化的电磁波或电压信号来表示。数字数据也称为数字量,相对于模拟量而言,指的是取值范围是离散的变量或者数值。数字数据则采用数字信号,例如用一系列断续变化的电压脉冲(如用恒定的正电压表示二进制数1,用恒定的负电压表示二进制数0)或光脉冲来表示。但在不久之前,情况却不是这样的。虽然1960年有了“信息时代”和“数字村镇”的概念,在2000年的时候,数字存储信息仍只占全球数据量的四分之一,当时,另外四分之三的信息都存储在报纸、胶片、黑胶唱片和盒式磁带这类媒介上。早期数字信息的数量并不多。对于长期在网上冲浪和购书的人来说,那只是一个的部分。事实上,在1986年的时候,世界上约40%的计算能力都在袖珍计算器上运行,那时候,所有个人计算机的处理能力之和还没有所有袖珍计算器处理能力之和高。但是因为数字数据的快速增长,整个局势很快颠倒过来了。按照希尔伯特的说法,数字数据的数量每三年多会翻一倍。相反,模拟数据的数量则基本上没有增加。到2013年,世界上存储的数据达到约1.2zb,其中非数字数据只占不到2%。这样大的数据量意味着什么?如果把这些数据记在书中,这些书可以覆盖整个美国52次。如果将其存储在只读光盘上,这些光盘可以堆成5堆,每一堆都可以伸到月球。公元前3世纪,埃及的托勒密二世竭力收集了当时所有的书写作品,所以的亚历
【目录】


章大数据与大数据时代

节什么是大数据

第二节 大数据变革思维

第三节大数据的结构类型

第四节大数据的发展

第二章 大数据时代的思维变革

节大数据时代的大挑战

第二节转变之一:样本=体

第三节转变之二:接收数据的混杂

第四节转变之三:数据的相关关系

第三章数据科学与数据科学家

节什么是数据科学

第二节数据分析生命周期模型

第三节数据科学家

第四节数据科学的重要技能

第四章大数据时代的数据挖掘

节数据挖掘的概念

第二节数据挖掘技术的产生与发展

第三节数据挖掘研究的发展趋势

第四节数据挖掘技术的分类问题

第五节数据挖掘常用的知识表示模式与方法

第六节不同数据存储形式下的数据挖掘问题

第七节数据挖掘的应用分析

第五章数据挖掘在云计算中的应用

节云计算背景介绍

第二节数据挖掘在云计算中的应用

第三节 案例介绍及困难分析:容量规划与虚拟机储备

第四节案例具体分析及解决

第五节 案例分析结果

第六章时间序列和序列模式挖掘

节时间序列及其应用

第二节时间序列预测的常用方法

第三节序列挖掘第七章 社交媒体挖掘

节社交媒体数据挖掘简介

第二节社交网络数据

第三节数据挖掘在社交媒体热点问题上的应用

第八章空间数据挖掘

节空间数据概要

第二节空间数据挖掘基础

第三节 空间统计学

第四节 泛化与特化

第五节空间规则

第六节空间分类算法

第七节 空间聚类算法

第八节空间挖掘的问题及发展

第九章 大数据预测分析

节 什么是预测分析

第二节数据情感和情感数据

第三节 数据具有内在预测第四节情感的因果关系

参文献



点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP