数据挖掘导论:(英文版)
¥
21.1
3.6折
¥
59
全新
仅1件
作者[美]谭、斯坦巴克、库马尔 著
出版社机械工业出版社
出版时间2010-09
版次1
装帧平装
货号9787111316701
上书时间2024-12-31
商品详情
- 品相描述:全新
图书标准信息
-
作者
[美]谭、斯坦巴克、库马尔 著
-
出版社
机械工业出版社
-
出版时间
2010-09
-
版次
1
-
ISBN
9787111316701
-
定价
59.00元
-
装帧
平装
-
开本
16开
-
纸张
胶版纸
-
页数
769页
-
丛书
经典原版书库
- 【内容简介】
-
《数据挖掘导论(英文版)》全面介绍了数据挖掘的理论和方法,着重介绍如何用数据挖掘知识解决各种实际问题,涉及学科领域众多,适用面广。书中涵盖5个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都包含两章:前面一章讲述基本概念、代表性算法和评估技术,后面一章较深入地讨论高级概念和算法。目的是使读者在透彻地理解数据挖掘基础的同时,还能了解更多重要的高级主题。包含大量的图表、综合示例和丰富的习题。·不需要数据库背景。只需要很少的统计学或数学背景知识。·网上配套教辅资源丰富,包括PPT、习题解答、数据集等。
- 【作者简介】
-
Pang-Ning Tan现为密歇根州立大学计算机与工程系助理教授,主要教授数据挖掘、数据库系统等课程。他的研究主要关注于为广泛的应用(包括医学信息学、地球科学、社会网络、Web挖掘和计算机安全)开发适用的数据挖掘算法。
Michael Steinbach拥有明尼苏达大学数学学士学位、统计学硕士学位和计算机科学博士学位,现为明尼苏达大学双城分校计算机科学与工程系助理研究员。
Vipin Kumar现为明尼苏达大学计算机科学与工程系主任和William Norris教授。1988年至2005年,他曾担任美国陆军高性能计算研究中心主任。
- 【目录】
-
Preface
1Introduction
1.1WhatIsDataMining?
1.2MotivatingChallenges
1.3TheOriginsofDataMining
1.4DataMiningTasks
1.5ScopeandOrganizationoftheBook
1.6BibliographicNotes
1.7Exercises
2Data
2.1TypesofData
2.1.1AttributesandMeasurement
2.1.2TypesofDataSets
2.2DataQuality
2.2.1MeasurementandDataCollectionIssues
2.2.2IssuesRelatedtoApplications
2.3DataPreprocessing
2.3.1Aggregation
2.3.2Sampling
2.3.3DimensionalityReduction
2.3.4FeatureSubsetSelection
2.3.5FeatureCreation
2.3.6DiscretizationandBinarization
2.3.7VariableTransformation
2.4MeasuresofSimilarityandDissimilarity
2.4.1Basics
2.4.2SimilarityandDissimilaritybetweenSimpleAttributes.
2.4.3DissimilaritiesbetweenDataObjects
2.4.4SimilaritiesbetweenDataObjects
2.4.5ExamplesofProximityMeasures
2.4.6IssuesinProximityCalculation
2.4.7SelectingtheRightProximityMeasure
2.5BibliographicNotes
2.6Exercises
3ExploringData
3.1TheIrisDataSet
3.2SummaryStatistics
3.2.1FrequenciesandtheMode
3.2.2Percentiles
3.2.3MeasuresofLocation:MeanandMedian
3.2.4MeasuresofSpread:RangeandVariance
3.2.5MultivariateSummaryStatistics
3.2.6OtherWaystoSummarizetheData
3.3Visualization
3.3.1MotivationsforVisualization
3.3.2GeneralConcepts
3.3.3Techniques
3.3.4VisualizingHigher-DimensionalData
3.3.5Do'sandDon'ts
3.4OLAPandMultidimensionalDataAnalysis
3.4.1RepresentingIrisDataasaMultidimensionalArray
3.4.2MultidimensionalData:TheGeneralCase
3.4.3AnalyzingMultidimensionalData
3.4.4FinalCommentsonMultidimensionalDataAnalysis
3.5BibliographicNotes
3.6Exercises
Classification:
4BasicConcepts,DecisionTrees,andModelEvaluation
4.1Preliminaries
4.2GeneralApproachtoSolvingaClassificationProblem
4.3DecisionTreeInduction
4.3.1HowaDecisionTreeWorks
4.3.2HowtoBuildaDecisionTree
4.3.3MethodsforExpressingAttributeTestConditions.
4.3.4MeasuresforSelectingtheBestSplit
4.3.5AlgorithmforDecisionTreeInduction
4.3.6AnExample:WebRobotDetection
4.3.7CharacteristicsofDecisionTreeInduction
4.4ModelOverfitting
4.4.1OverfittingDuetoPresenceofNoise
4.4.2OverfittingDuetoLackofRepresentativeSamples.
4.4.3OverfittingandtheMultipleComparisonProcedure
4.4.4EstimationofGeneralizationErrors
4.4.5HandlingOverfittinginDecisionTreeInduction..
4.5EvaluatingthePerformanceofaClassifier
4.5.1HoldoutMethod
4.5.2RandomSubsampling
4.5.3Cross-Validation
4.5.4Bootstrap
4.6MethodsforComparingClassifiers
4.6.1EstimatingaConfidenceIntervalforAccuracy
4.6.2ComparingthePerformanceofTwoModels
4.6.3ComparingthePerformanceofTwoClassifiers
4.7BibliographicNotes
4.8Exercises
5Classification:AlternativeTechniques
6AssociationAnalysis:BasicConceptsandAlgorithms
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价