• 数据挖掘算法与Clementine实践
21年品牌 40万+商家 超1.5亿件商品

数据挖掘算法与Clementine实践

6.53 2.6折 25 九五品

仅1件

天津武清
认证卖家担保交易快速发货售后保障

作者熊平 著

出版社清华大学出版社

ISBN9787302235019

出版时间2011-04

版次1

装帧平装

开本16开

纸张胶版纸

页数237页

字数99999千字

定价25元

上书时间2024-04-23

鲁是特

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:数据挖掘算法与Clementine实践
定价:25.00元
作者:熊平 著
出版社:清华大学出版社
出版日期:2011-04-01
ISBN:9787302235019
字数:362000
页码:237
版次:1
装帧:平装
开本:16开
商品重量:
编辑推荐

内容提要
《数据挖掘算法与Clementine实践》主要介绍了几种成熟的数据挖掘方法,并针对每种方法,介绍了应用广泛的几种实现算法。书中以Clementine12.0为平台,用实例介绍了每种算法的具体应用。全书各章分别介绍了数据挖掘和Clementine软件、决策树分类方法(包括ID3、C4.5、C5.0、CART等算法)、聚类分析方法(包括K-Means算法和TwoStep算法)、关联规则挖掘方法(包括Apriori算法、CARMA算法和序列模式挖掘算法)、数据筛选算法(包括特征选择算法和异常检测算法)、回归分析方法(包括线性回归算法和二项Logistic回归)、神经网络构建方法(包括多层感知器网络、RBF网络以及Kohonen网络的构建算法)、时间序列分析方法(包括指数平滑法和ARIMA模型构建方法)。
目录
章 数据挖掘概述 1.1 数据挖掘简介 1.2 数据挖掘过程 1.3 数据挖掘方法 1.4 数据挖掘工具及软件第2章 clementine概述 2.1 clementine简介 2.2 clementine基本操作第3章 决策树 3.1 分类与决策树概述 3.2 id3、c4.5与c5.0 3.3 cart第4章 聚类分析 4.1 聚类分析概述 4.2 k-means算法 4.3 twostep算法第5章 关联规则 5.1 关联规则概述 5.2 apriori算法 5.3 carma算法 5.4 序列模式第6章 数据筛选 6.1 特征选择 6.2 异常检测第7章 统计模型 7.1 线性回归 7.2 项logistic回归第8章 神经网络 8.1 神经网络原理 8.2 多层感知器与rbf网络 8.3 kohonen网络第9章 时间序列分析与预测 9.1 时间序列概述 9.2 指数平滑法 9.3 arima模型参考文献
作者介绍
统计方法COBWEB-是一个常用的且简单的增量式概念聚类方法。它的输入对象是采用符号量(属性一值)对来加以描述的。采用分类树的形式来创建一个层次聚类。     CLASSIT是COBWEB的另一个版本。它可以对连续取值属性进行增量式聚类。它为每个节点中的每个属性保存相应的连续正态分布(均值与方差);并利用一个改进的分类能力描述方法,即不像COBWEB那样计算离散属性(取值)和而是对连续属性求积分。但是CLASSIT方法也存在与COBWEB类似的问题。因此它们都不适合对大数据库进行聚类处理。    传统的聚类算法已经比较成功地解决了低维数据的聚类问题。但是由于实际应用中数据的复杂性,在处理许多问题时,现有的算法经常失效,特别是对于高维数据和大型数据的情况。因为传统聚类方法在高维数据集中进行聚类时,主要遇到两个问题。首先,高维数据集中存在大量无关的属性使得在所有维中存在簇的可能性几乎为零。另外,高维空间中数据较低维空间中数据分布要稀疏,其中数据间距离几乎相等是普遍现象,而传统聚类方法是基于距离进行聚类的,因此在高维空间中无法基于距离来构建簇。    高维聚类分析已成为聚类分析的一个重要研究方向。同时高维数据聚类也是聚类技术的难点。随着技术的进步使得数据收集变得越来越容易,导致数据库规模越来越大、复杂性越来越高,如各种类型的贸易交易数据、Web文档、基因表达数据等,它们的维度(属性)通常可以达到成百上千维,甚至更高。但是,受“维度效应”的影响,许多在低维数据空间表现良好的聚类方法运用在高维空间上往往无法获得好的聚类效果。高维数据聚类分析是聚类分析中一个非常活跃的领域,同时它也是一个具有挑战性的工作。 ……
序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP