全新正版书籍,24小时发货,可开发票。
¥ 38.4 7.9折 ¥ 48.8 全新
库存3件
作者吴思远、邹洋、黄梅根、贾玲
出版社清华大学出版社
ISBN9787302452041
出版时间2017-01
装帧平装
开本16开
定价48.8元
货号24161559
上书时间2024-12-28
前 言
数据挖掘涉及数据库技术、人工智能、统计学、机器学习、知识发现等多个学科的领域。随着信息技术的高速发展、数据量的飞速增长,数据挖掘已经在各行各业有了较为广泛的应用。
Microsoft SQL Server 2012是集成了数据挖掘技术的第5版的SQL Server。SQL Server数据挖掘是业界部署广泛的数据挖掘服务器,由于其可伸缩性大,容易获得,使用也较为简便,政府机构、企事业单位、学术人员和科学家也开始采用或转而使用SQL Server进行数据挖掘。IBM SPSS Statistics是全世界早的统计分析软件,其主要功能包括统计学分析运算、数据挖掘、预测分析等,由于其具有数据分析深入、使用方便、功能齐全等诸多优点,被广泛应用于自然科学、技术科学、社会科学的各个领域。
Microsoft SQL Server Analysis Services(SSAS)是本书的核心内容,Excel的数据分析与挖掘,也是基于SSAS的服务引擎在进行。使用本书时,可以先学习数据挖掘基本理论;接下来学习Excel 2010数据分析与挖掘、SQL Server 2012数据挖掘、SPSS Statistics数据分析与挖掘;然后再通过完成教程设计的实验内容,真正地理解数据挖掘理论,掌握数据挖掘的实践技能。
本书结合作者多年从事数据挖掘教学、开发数据挖掘项目的经验,从实际出发,以实用的例子,系统地介绍了数据挖掘。全书分为三个部分,共10章。
第1部分由第1~3章组成,包括商业智能的概念和发展、数据挖掘和数据仓库的基本概念以及它们之间的关系;数据仓库的基本概念和设计步骤,并介绍了联机分析技术的分类和特点,以及回归分析、关联规则、聚类分析、决策树分析等数据挖掘常用分析方法的概念和算法。
第2部分由第4~9章组成,包括Excel 2010数据分析和预测的功能、Excel 2010的数据挖掘功能;SQL Server 2012的Analysis Services功能、设置数据源、设置数据源视图、设置挖掘结构、处理挖掘模型、查看挖掘结果等;Microsoft SQL Server Analysis Services中提供的常用的6个数据挖掘算法原理与参数;SPSSStatistics的界面和基础操作;SPSS Statistics在数据挖掘中常用的基础统计分析方法和高级统计分析方法。
第3部分由第10章组成,包括SQL Server 2012的数据挖掘实验、SPSS Statistics的数据挖掘实验。
在内容的选择、深度的把握上,本书充分考虑到初学者的特点,在内容安排上力求循序渐进,不仅可以作为大专院校教学用书,也可以作为数据挖掘的培训教材和数据挖掘爱好者的自学用书。
本书由吴思远任主编,邹洋、黄梅根、贾玲任副主编。具体编写分工如下:邹洋编写第1~3章,吴思远编写第4~6章,黄梅根编写第7章,贾玲编写第8~9章,吴思远和贾玲共同编写第10章。吴思远负责全书架构的组织设计,负责统稿。本书的编写得到重庆邮电大学教务处、重庆邮电大学计算机科学与技术学院以及重庆市教育评估院和中冶赛迪重庆信息技术有限公司的大力支持,在此感谢以上单位对本书所做出的贡献。
本书为教师提供了配套的教学资源,可从清华大学出版社网站http://www.tup.com.cn下载。
由于作者水平有限,书中难免有疏漏和不足之处,希望广大读者给予谅解和指正。
编 者
本书注重数据挖掘理论,将理论与实践相结合、知识理论与具体实现方法相结合,由浅入深地介绍了数据分析与挖掘的相关知识。全书分为3部分。第1部分介绍了数据挖掘理论(第1~3章),第2部分介绍了Excel 2010数据分析与挖掘、SQL Server 2012数据挖掘、SPSS数据分析与挖掘的实践过程(第4~9章),第3部分介绍了SQL Server和SPSS数据挖掘的实验内容(第10章)。
本书为教师提供了配套的教学资源,可以作为计算机、智能科学类专业本科生的数据挖掘课程教材,也可以作为专业技术人员的自学参考书及数据挖掘爱好者的自学用书。
目 录
第1章 绪论 1
1.1 商业智能 1
1.2 数据挖掘 6
1.3 数据仓库 12
第2章 数据仓库与联机分析 15
2.1 数据仓库 15
2.2 数据仓库的设计步骤 23
2.3 联机分析技术 34
第3章 数据挖掘运用的理论和技术 41
3.1 回归分析 41
3.2 关联规则 47
3.3 聚类分析 55
3.4 决策树分析 63
3.5 其他分析方法 68
第4章 用Excel 2010进行数据分析 71
4.1 安装前的准备 71
4.2 安装表分析工具 72
4.3 配置表分析工具 75
4.4 使用表分析工具的要求 79
4.5 分析关键影响因素 82
4.6 检测类别 86
4.7 从示例填充 90
4.8 预测 93
4.9 突出显示异常值 94
4.10
应用场景分析 98
4.11
预测计算器及可打印计算器 104
4.12
购物篮分析 108
第5章 用Excel 2010进行数据挖掘 111
5.1 数据挖掘简介 111
5.2 获取外部数据 113
5.3 数据准备 114
5.4 数据建模 127
5.5 准确性和验证 153
5.6 模型用法 164
5.7 管理和连接 171
第6章 SQL Server 2012数据挖掘 174
6.1
SSDT(SQL Server Data Tools)简介 174
6.2 安装SSDT-BI 175
6.3 安装示例数据库 180
6.4
SSDT-BI用户界面 182
6.5 创建挖掘项目 183
6.6 设置数据源 185
6.7 设置数据源视图 188
6.8 设置挖掘结构 193
6.9 处理挖掘模型 198
6.10
查看挖掘模型 199
6.11
挖掘准确性图表 201
6.12
挖掘模型预测 205
第7章 Microsoft数据挖掘算法 208
7.1 背景知识 208
7.2
Microsoft决策树算法 210
7.3
Microsoft聚类算法 214
7.4
Microsoft关联规则算法 218
7.5
Microsoft时序算法 221
7.6
Microsoft朴素贝叶斯算法 226
7.7
Microsoft神经网络算法 229
第8章 SPSS数据挖掘基础 234
8.1
SPSS发展简史 234
8.2
SPSS操作入门 235
8.3
SPSS的界面 236
8.4 建立SPSS文件 237
8.5
SPSS数据的变量属性定义 239
8.6
SPSS数据管理 242
8.7
SPSS数据转换 249
第9章 SPSS数据挖掘常用的统计
分析方法 254
9.1 基本描述统计 254
9.2
T检验 268
9.3 方差分析 272
9.4 多元回归分析 286
9.5 聚类分析 297
9.6 相关分析 309
9.7 因子分析 313
第10章 数据挖掘实验 319
10.1
SQL Server 2012数据挖掘实验 319
10.2
SPSS数据挖掘实验 341
参考文献 361
本书注重数据挖掘理论,将理论与实践相结合、知识理论与具体实现方法相结合,由浅入深地介绍了数据分析与挖掘的相关知识。全书分为3部分。第1部分介绍了数据挖掘理论(第1~3章),第2部分介绍了Excel 2010数据分析与挖掘、SQL Server 2012数据挖掘、SPSS数据分析与挖掘的实践过程(第4~9章),第3部分介绍了SQL Server和SPSS数据挖掘的实验内容(第10章)。
本书为教师提供了配套的教学资源,可以作为计算机、智能科学类专业本科生的数据挖掘课程教材,也可以作为专业技术人员的自学参考书及数据挖掘爱好者的自学用书。
本书结合作者多年从事数据挖掘教学、开发数据挖掘项目的经验,从实际出发,以实用的例子,系统地介绍了数据挖掘。全书分为三个部分,共10章。
第1部分由第1~3章组成,包括商业智能的概念和发展、数据挖掘和数据仓库的基本概念以及它们之间的关系;数据仓库的基本概念和设计步骤,并介绍了联机分析技术的分类和特点,以及回归分析、关联规则、聚类分析、决策树分析等数据挖掘常用分析方法的概念和算法。
第2部分由第4~9章组成,包括Excel 2010数据分析和预测的功能、Excel 2010的数据挖掘功能;SQL Server 2012的Analysis Services功能、设置数据源、设置数据源视图、设置挖掘结构、处理挖掘模型、查看挖掘结果等;Microsoft SQL Server Analysis Services中提供的*常用的6个数据挖掘算法原理与参数;SPSS
Statistics的界面和基础操作;SPSS Statistics在数据挖掘中常用的基础统计分析方法和高级统计分析方法。
第3部分由第10章组成,包括SQL Server 2012的数据挖掘实验、SPSS Statistics的数据挖掘实验。
在内容的选择、深度的把握上,本书充分考虑到初学者的特点,在内容安排上力求循序渐进,不仅可以作为大专院校教学用书,也可以作为数据挖掘的培训教材和数据挖掘爱好者的自学用书。
第2章 数据仓库与联机分析 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH,是为企业所有级别的决策制定过程提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建,为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。而联机分析处理(OLAP)系统是数据仓库系统主要的应用。 本章针对数据仓库与联机分析的初学者,主要介绍数据仓库的基本概念和设计步骤,并介绍了联机分析技术的分类和特点,帮助建立对数据仓库和联机分析的基本认识。 2.1 数 据 仓 库 2.1.1 数据仓库的基本概念 1. 数据仓库的由来和定义 数据仓库,这一概念是由数据仓库之父比尔·恩门(Bill Inmon)于1990年提出的。数据仓库的主要功能是将资讯系统的联机事务处理(OLTP)经过长时间累积的大量资料,通过数据仓库理论所特有的资料存储架构起来,做出系统的分析整理。利用的分析方法包括联机分析处理(OLAP)、数据挖掘(Data Mining)等,进而将分析结果用于决策支持系统(DSS)、主管资讯系统(EIS)等的创建,帮助决策者快速有效地从大量信息源中分析出对某种决策有参考价值的信息,使得决策拟定者能快速地对外在环境的变动做出应对,帮助建构商业智能(BI)。 数据仓库之父比尔·恩门在1991年出版的Building the Data Warehouse(《建立数据仓库》,见图2.1)一书中所提出的定义被广泛接受:数据仓库(Data Warehouse,DW)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。 从信息技术上的概念来说,数据仓库是以关系数据库、并行处理技术与分布式处理技术以及联机分析处理等技术为基础,为了解决拥有大量数据却缺乏有用信息的现状而提出的数据处理技术,是一种对不同系统数据实现集成和共享的综合性的解决方案。 对于传统数据库与数据仓库的关系,可以从两个方面来理解:首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源的有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。由普通数据库与数据仓库的对比关系来看,通常把普通数据库技术称为传统意义上的数据库技术,其数据处理模式可被划分为操作型处理和分析型处理(或信息型处理)。普通数据库技术能够完成企业的日常事务处理工作,但很难满足实现决策者制定规划的要求,也无法满足数据多样化处理的要求。随着用户需求的日益扩大,分析型处理和操作型处理的分离逐渐成为必然。 图2.1 《建立数据仓库》 数据仓库的出现给企业机构等带来了巨大的变化。数据仓库的建立给企业带来了一些新的工作流程,随之其他相关流程也会因此而改变。随着计算机技术、网络技术的进步和信息化的不断发展,信息已成为人类社会不可缺少的重要资源。社会的信息化大大加速了信息数据量的增长。面对数据量的不断增长和应用要求的不断扩张,数据库技术的应用和发展也有了更高的价值和作用,促使研究者们尝试开发能完成 相关推荐— 没有更多了 — 此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP
|
以下为对购买帮助不大的评价