• 大数据挖掘及应用
21年品牌 40万+商家 超1.5亿件商品

大数据挖掘及应用

15.6 2.6折 59.5 九五品

仅1件

天津武清
认证卖家担保交易快速发货售后保障

作者王国胤,刘群,于洪,曾宪华

出版社清华大学出版社

ISBN9787302469278

出版时间2017-07

版次1

装帧平装

开本16开

纸张胶版纸

页数400页

字数99999千字

定价59.5元

上书时间2024-04-30

鲁是特

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:大数据挖掘及应用
定价:59.50元
作者:王国胤,刘群,于洪,曾宪华
出版社:清华大学出版社
出版日期:2017-07-01
ISBN:9787302469278
字数:624000
页码:400
版次:1
装帧:平装
开本:32开
商品重量:
编辑推荐
“大数据系列丛书”由多本既独立又有丰富内在联系的大数据时代思维、技术与应用的教材组成。《大数据挖掘及应用》是其中的又一力作。本书内容宽泛,图文并茂,文字流畅,技术先进,是全新设计的数据挖掘及应用课程的教材,适合不同层次读者的学习需要。全书分导论、方法论和进阶应用三大部分,共11章,涵盖大数据挖掘及应用领域的基础理论知识和方法、数据可视化技术、深度学习技术、R语言基础、大数据分析算法的并行化基础理论,大数据分布式存储与并行计算平台及编程框架等重要概念。全书提供大量案例,不仅包括简单程序的代码,也包括较大应用程序代码,结合一系列案例和学生竞赛作品,把数据分析技术的概念、理论融入实践中。每章配有习题,以加深对知识的认识、理解和掌握,激发读者浓厚的学习兴趣,巩固所学知识,提高编程能力。本书可作为高等院校计算机、软件工程、大数据等专业的教材,也可作为教辅资料,还可作为学习应用技术的参考书。以本书内容为主题的在线微视频开放课程已经在http://cqupt.gaoxiaobang.com上线。与本书配套的电子课件,每章案例涉及的软件程序、课后习题解答及部分案例的演示视频均可登录清华大学出版社网站下载使用。
内容提要
本书围绕大数据背景下的数据挖掘及应用问题,从大数据挖掘的基本概念入手,由浅入深、循序渐进地介绍了大数据挖掘分析过程中的数据准备和预处理方法、数据可视化技术、数据挖掘理论和经典算法、常用大数据分析计算平台的编程模型、并行化程序设计技术、统计分析R语言基础等内容。其中数据挖掘理论和经典算法不仅覆盖了传统的关联分析、分类和聚类,还包括深度学习理论等数据挖掘研究和发展的潮流主题。每一章内容都尽量从不同角度进行深入浅出的剖析,还配以丰富的习题和参考文献,对于读者掌握大数据挖掘及应用领域的基本知识和进一步研究都具有参考价值。本书可以作为高校本科相关专业数据分析类课程教材和面向各专业的数据科学通识教材,也可供广大IT从业人员参考。
目录
目录章大数据挖掘及应用概论11.1大数据智能分析处理的普及和应用11.1.1云计算11.1.2大数据31.1.3云计算与大数据的智能应用41.2大数据的发展及挑战101.2.1大数据的发展催生三元空间世界101.2.2大数据智能分析处理面临的挑战121.3数据挖掘概述141.3.1数据挖掘的概念141.3.2数据挖掘的功能151.3.3数据挖掘运用的技术161.3.4大数据挖掘与传统数据挖掘161.4大数据挖掘的计算框架171.4.1大数据挖掘计算框架171.4.2大数据挖掘处理基本流程211.5大数据时代“互联网 ”的未来: 智能互联231.6本书架构261.7小结271.8习题271.9参考文献28第2章数据认知与预处理292.1数据分析的定义和流程302.1.1如何理解和描述数据分析的问题302.1.2数据获取与准备312.1.3数据质量评估322.2数据类型332.2.1属性的定义332.2.2标称属性332.2.3二元属性342.2.4序值属性342.2.5数值属性342.3数据的统计描述方法352.3.1数据的中心趋势度量352.3.2数据的离散趋势度量372.4数据对象关系的计算方法392.4.1数据相似性计算方法402.4.2数据相关性计算方法462.5数据准备482.5.1数据清洗与集成482.5.2数据归约522.5.3数据转换582.6数据统计分析常用工具介绍612.6.1Excel统计分析工具612.6.2SPSS统计分析工具632.6.3SAS统计分析工具642.6.4R语言统计分析工具662.7SPSS案例分析682.7.1日志文件数据准备682.7.2数据录入与编辑682.7.3数据清洗与转换702.7.4数据方差分析722.7.5数据相关性分析742.7.6数据间距离分析742.8小结772.9习题782.10参考文献79第3章数据可视化803.1可视化简介803.2高维数据可视化813.2.1降维方法823.2.2非降维方法843.3网络数据可视化903.3.1节点链接法903.3.2邻接矩阵布局963.3.3混合布局983.4可视化案例分析993.4.1案例一: China VIS 2015竞赛题993.4.2案例二: VAST Challenge 2016竞赛题1073.5小结1203.6习题1213.7参考文献122第4章数据关联分析1234.1数据关联分析简介1234.2基本概念1254.2.1频繁项集和关联规则1264.2.2闭项集和极大频繁项集1284.2.3稀有模式和负模式1294.3Apriori算法1304.3.1Apriori算法的核心思想1314.3.2Apriori算法描述1324.3.3改进的Apriori算法1334.4FPGrowth算法1374.4.1FPGrowth算法的核心思想1384.4.2FPGrowth算法描述1394.5面向大数据的有效数据结构1424.6关联规则有效性的评估方法1434.6.1关联规则兴趣度评估1444.6.2关联规则相关度评估1444.6.3其他相关评估度量方法1464.7多维关联规则挖掘1484.8多层关联规则挖掘1514.9基于Python平台的案例分析1564.10小结1584.11习题1594.12参考文献161第5章数据分类分析1635.1基本概念和术语1635.1.1数据分类1635.1.2解决分类问题的一般方法1655.2决策树算法1665.2.1决策树归纳1665.2.2决策树构建1675.2.3属性测试条件的表示方法1695.2.4选择划分的度量1715.2.5决策树归纳算法1755.2.6树剪枝1765.2.7决策树归纳的特点1785.3贝叶斯分类算法1805.3.1贝叶斯定理1815.3.2朴素贝叶斯分类1825.3.3贝叶斯信念网络1845.4支持向量机算法1855.4.1数据线性可分的情况1855.4.2数据非线性可分的情况1895.5粗糙集分类算法1905.6分类器评估方法1915.6.1评估分类器性能的度量1925.6.2保持方法和随机二次抽样1955.6.3交叉验证1955.6.4自助法1955.6.5使用统计显著性检验选择模型1965.7组合分类器技术1975.7.1组合分类方法简介1985.7.2装袋1985.7.3提升和AdaBoost1995.7.4随机森林2005.7.5提高类不平衡数据的分类准确率2005.8惰性学习法(k近邻分类)2015.9基于Python平台的案例分析2035.9.1数据集准备2035.9.2算法描述2045.9.3算法测试2065.10小结2095.11习题2095.12参考文献211第6章数据聚类分析2146.1基本概念和术语2146.1.1聚类分析简介2156.1.2对聚类的基本要求2156.1.3聚类分析方法2166.2基于划分的方法2186.2.1kmeans算法2186.2.2k中心点算法2216.3基于层次的方法2246.3.1凝聚的与分裂的层次聚类2246.3.2簇间距离度量2256.4基于密度的方法2296.4.1传统的密度: 基于中心的方法2306.4.2DBSCAN算法2316.5基于概率模型的聚类方法2336.5.1模糊聚类2336.5.2基于概率模型的聚类2356.5.3期望化算法2376.6聚类评估2396.6.1聚类趋势的估计2396.6.2聚类簇数的确定2416.6.3聚类质量的测定2426.7基于Python平台的案例分析2456.7.1数据准备2456.7.2聚类分析结果探讨2466.8小结2486.9习题2496.10参考文献253第7章深度学习2557.1引言2557.1.1发展背景2557.1.2基本概念2567.2深信网2577.2.1玻尔兹曼机2587.2.2受限玻尔兹曼机2587.2.3深信网2607.3深玻尔兹曼机2647.4栈式自动编码器2667.4.1自动编码器2667.4.2栈式自动编码器2677.5卷积神经网络2697.5.1卷积2697.5.2池化2707.5.3CNN训练过程2727.5.4CNN网络构造的案例分析2767.6深度学习开源框架2787.6.1开源框架简介2787.6.2开源案例分析2787.7深度学习应用技巧2847.8小结2857.9习题2867.10参考文献286第8章R语言2888.1下载和安装R语言2888.1.1下载R语言2888.1.2安装R语言2888.2使用R语言2928.2.1运行R语言2928.2.2R语言常用操作2948.2.3包的使用2988.3R语言的数据结构3008.3.1向量3008.3.2矩阵3018.3.3数组3028.3.4因子3038.3.5列表3048.3.6数据框3058.4R语言的编程结构3068.4.1条件语句3068.4.2循环语句3088.5R语言的数据挖掘和图形绘制包3108.6实际案例3128.7小结3148.8习题3148.9参考文献315第9章Hadoop大数据分布式处理生态系统3169.1Hadoop集群基础3169.1.1Hadoop安装3179.1.2Hadoop配置3199.2HDFS基础操作3249.3MapReduce并行计算框架3319.3.1MapReduce程序实例: WordCount3329.3.2Hadoop Streaming3339.4基于Storm的分布式实时计算3349.4.1Storm简介3349.4.2Storm基本概念3349.4.3Storm编程3389.5基于Spark Streaming的分布式实时计算3469.5.1Spark内存计算框架3469.5.2Spark Streaming简介3479.5.3Spark Streaming编程3499.6小结3529.7参考文献3530章大数据分析算法的并行化35510.1并行算法设计基础35510.1.1并行算法概念35510.1.2并行计算模型35610.1.3并行算法设计的策略和技术36010.2典型数据挖掘算法并行化案例36210.2.1MR kmeans算法分析36210.2.2Mahout聚类算法案例36410.2.3Spark MLlib聚类算法案例36910.3大数据分析应用案例37110.3.1搜索引擎日志数据分析37110.3.2出租车轨迹数据分析37410.3.3新闻组数据分析37710.4小结38310.5习题38310.6参考文献3841章大数据挖掘及应用展望38511.1大数据时代的发展回顾与展望38511.1.1大数据发展回顾38511.1.2从“小”到“大”的数据分析处理38711.1.3大数据的智能分析与挖掘38911.2大数据中的新数据类型39111.3大数据挖掘的新方法39411.3.1深度学习39411.3.2知识计算39511.3.3社会计算39611.3.4特异群组挖掘39711.4未来发展趋势39811.5小结39911.6参考文献399
作者介绍

序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP