- 【内容简介】
-
由郝文宁、靳大尉和程恺共同编*的这本教材《 数据分析与数据挖掘实验指导书》是数据分析与数据 挖掘课程的实验指导书,结合大量实例全面阐述了使 用IBM SPSS系列软件进行数据分析与挖掘的原理、方 法和步骤。紧密配合理论教学,使学生在有限的实验 课时中,加深对所学知识的理解和掌握。
全书分为两个部分,**部分为数据分析实验, 主要介绍如何利用IBM SPSSStatistics软件进行统 计分析,具体包括描述性统计、参数检验、非参数检 验、相关分析、回归分析和因子分析等七项实验科目 ,第二部分为数据挖掘实验,主要介绍如何利用IBM SPSS Modeler软件进行数据挖掘,具体包括关联规则 挖掘、决策树分类、人工神经网络分类、贝叶斯方法 分类和聚类等七项实验科目。
本书可作为数据工程相关专业本科生教材,也可 为从事各领域数据分析和数据挖掘的专业人员提供指 导和帮助。
- 【作者简介】
-
郝文宁,1971年5月生于山西省芮城县。现为解放军理工大学指挥信息系统学院教授,硕士生导师。长期从事作战仿真、军用数据工程等领域的教学和科研工作。先后主持和参与多项全军重大科技攻关项目,获军队科技进步一等奖2项,二等奖3项。出版专*、教材3部,发表学术论文60余篇。享受军队**专业技术二类岗位津贴,荣立二等功2次。
靳大尉,1979年6月生于河北保定。现为解放军理工大学指挥信息系统学院副教授。长期从事军事数据工程领域的教学和科研工作。先后发表论文40余篇,获军队科技进步二等奖4项,三等奖9项。荣立三等功1次。
程恺,1983年9月生于河南省郑州市。现为解放军理工大学指挥信息系统学院讲师。长期从事数据挖掘、作战效能评估的教学和科研工作。先后主持江苏省自然科学基金1项,参与国家自然科学基金项目2项,获军队科技进步二等奖1项,三等奖2项。发表学术论文20余篇,被三大检索收录10余篇。
- 【目录】
-
实验1 IBM SPSS Statistics软件使用基础
1.1 实验目的与要求
1.2 实验原理
1.3 实验内容与步骤
1.3.1 安装、启动与退出
1.3.2 定义变量
1.3.3 数据的输入与保存
1.3.4 数据文件的编辑与转换
1.4 思考题
实验2描述性统计
2.1 实验目的与要求
2.2 实验原理
2.3 实验内容与步骤
2.3.1 中心、离散趋势描述实验
2.3.2 频数分布分析实验
2.4 思考题
实验3 参数检验
3.1 实验目的与要求
3.2 实验原理
3.3 实验内容与步骤
3.3.1 单样本t检验
3.3.2 两独立样本t检验
3.3.3 两配对样本t检验
3.3.4 单因素完全随机设计的方差分析SPSS过程
3.3.5 单因素重复测量设计的方差分析SPSS过程
3.3.6 多因素完全随机设计方差分析的SPSS过程
3.4 思考题
实验4 非参数检验
4.1 实验目的与要求
4.2 实验原理
4.3 实验内容与步骤
4.3.1 单样本二项分布检验的SPSS过程
4.3.2 相关样本二项分布检验的SPSS过程
4.3.3 独立样本二项分布检验的SPSS过程
4.3.4 适合性卡方检验的SPSS过程
4.3.5 独立性卡方检验的SPSS过程
4.3.6 符号与符号秩次检验的SPSS过程
4.3.7 秩和检验(曼-惠特尼U检验)的SPSS过程
4.3.8 中位数检验的SPSS过程
4.4 思考题
实验5 相关分析
5.1 实验目的与要求
5.2 实验原理
5.3 实验内容与步骤
5.3.1 二元变量相关分析的SPSS过程
5.3.2 肯德尔和谐系数计算的SPSS过程
5.3.3 偏相关分析的SPSS过程
5.4 思考题
实验6 回归分析
6.1 实验目的与要求
6.2 实验原理
6.3 实验内容与步骤
6.3.1 一元线性回归分析的SPSS过程
6.3.2 多元线性回归分析的SPSS过程
6.4 思考题
实验7 因子分析
7.1 实验目的与要求
7.2 实验原理
7.3 实验内容与步骤
7.3.1 因子分析的SPSS过程
7.3.2 因素分析结果的读取与解释
7.4 思考题
实验8 IBM SPSS Modder软件使用基础
8.1 实验目的与要求
8.2 实验原理
8.2.1 IBM SPSS Modeler简介
8.2.2 数据挖掘的CRISP-DM模型
8.2.3 Modeler软件使用的技巧
8.3 实验内容与步骤
8.3.1 Modeler的启动和界面布局
8.3.2 完整建模流程的介绍
8.4 思考题
实验9 关联规则挖掘实验
9.1 实验目的与要求
9.2 实验原理
9.2.1 关联规则处理数据的两种形式
9.2.2 关联规则相关概念
9.3 实验内容与步骤
9.3.1 Apriori算法应用
9.3.2 序列关联应用
9.4 思考题
实验10 决策树分类实验
10.1 实验目的与要求
10.2 实验原理
10.2.1 决策树分类原理
10.2.2 决策树分类常用算法
10.3 实验内容与步骤
10.3.1 导入数据
10.3.2 数据认识与处理
10.3.3 建立模型与评估
10.4 思考题
实验11 支持向量机SVM分类实验
11.1 实验目的与要求
11.2 实验原理
11.3 实验内容与步骤
11.3.1 导入数据
11.3.2 建立模型
11.4 思考题
实验12 人工神经网络分类实验
12.1 实验目的与要求
12.2 实验原理
12.3 实验内容与步骤
12.3.1 导入数据
12.3.2 模型建立
12.4 思考题
实验13贝叶斯方法分类实验
13.1 实验目的与要求
13.2 实验原理
12.2.1 贝叶斯定理和朴素贝叶斯
13.2.2 Modeler中的贝叶斯分类器
13.3 实验内容与步骤
13.3.1 数据导入
13.3.2 贝叶斯网络建模
13.4 思考题
实验14 K均值与二分法聚类实验
14.1 实验目的与要求
14.2 实验原理
14.2.1 聚类分析
14.2.2 K-Means聚类
14.2.3 两步聚类
14.3 实验内容与步骤
14.3.1 K均值聚类
14.3.2 两步法类
14.4 思考题
参考文献
以下为对购买帮助不大的评价