• 数据分析与数据挖掘
21年品牌 40万+商家 超1.5亿件商品

数据分析与数据挖掘

59 6.6折 89 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者姜维

出版社电子工业出版社

ISBN9787121447433

出版时间2023-02

版次1

装帧平装

开本16开

纸张胶版纸

页数435页

字数99999千字

定价89元

上书时间2024-04-15

灵感飞驰

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:数据分析与数据挖掘
定价:89.00元
作者:姜维
出版社:电子工业出版社
出版日期:2023-02-01
ISBN:9787121447433
字数:763000
页码:435
版次:
装帧:平装
开本:
商品重量:
编辑推荐

内容提要
本书重点讲述统计数据分析方法和数据挖掘技术,在大数据时代和人工智能时代,数据驱动的知识抽取技术成为一项重要学习和研究内容。本书采用理论和举例相结合的方式进行数据分析和数据挖掘知识讲解,并配套《数据分析与数据挖掘建模工具》一书,便于理论和实践相结合。书中内容包括统计检验、方差分析、回归分析、关联分析、分类模型、聚类模型、离群点分析等典型的数据分析和数据挖掘方法。
目录
目    录第1章  数据分析与数据挖掘基础t11.1  数据分析与数据挖掘需求t11.1.1  数据分析与数据挖掘t11.1.2  大数据处理需求t21.1.3  数据分析误区与隐私问题t31.2  数据分析与数据挖掘的工作过程t31.2.1  数据分析的主要工作过程t31.2.2  数据收集t51.2.3  数据展示t61.3  数据的组织和数据的类型t71.3.1  数据的一般组织形式t71.3.2  数据类型t81.3.3  分类数据的编码t91.4  数据的常用描述性统计量t111.4.1  数据的中心趋势t111.4.2  数据的离散程度t121.4.3  数据的形态统计量t151.5  数据的基本描述性统计分析t181.5.1  数据的描述性统计t181.5.2  五数概括与盒图t191.5.3  数据的描述性统计图t201.6  本章小结t22本章概念与关键词t22练习与思考t23第2章  数据抽样与推断检验t242.1  随机变量概率分布t242.1.1  概率分布t242.1.2  正态分布t262.1.3  二项分布与泊松分布t282.1.4  几何分布与超几何分布t292.2  抽样统计分析t312.2.1  抽样的相关概念t312.2.2  概率抽样的典型方法t332.2.3  非随机抽样的典型方法t342.3  基本抽样分布t342.3.1  经验分布、理论分布与抽样分布t342.3.2  三大抽样分布t362.3.3  小概率事件t382.4  常用的抽样分布与区间估计t402.4.1  常用的统计量抽样分布t402.4.2  置信区间与区间估计t422.5  常用的参数检验t452.5.1  假设检验一般过程t452.5.2  常用的参数检验统计量t472.6  常用的单样本非参数检验t482.6.1  卡方检验t482.6.2  二项分布检验t492.6.3  固定参数的超几何分布检验t492.6.4  游程检验t502.6.5  单样本K-S检验t542.7  本章小结t56本章概念与关键词t57练习与思考t57第3章  可视化图与分组检验t593.1  数据的常用可视化图分析t593.1.1  数据的常用可视化图t593.1.2  基于图的可视化观测一般过程t623.2  均值比较和t检验t623.2.1  分组统计t623.2.2  数据标准化与Z-Scoret633.2.3  单样本t检验t643.2.4  两独立样本t检验t653.2.5  两配对样本t检验t673.3  方差齐性检验t683.3.1  Levene方差齐性检验t683.3.2  基于F检验的方差齐性检验t693.3.3  Brown-Forsythe方差齐性检验t703.3.4  Bartlett’s方差齐性检验t703.4  两独立样本的非参数检验t713.4.1  Mann-Whitney U检验t713.4.2  两独立样本K-S检验t743.4.3  两独立样本游程检验t763.4.4  两独立样本Moses特别反应检验t773.4.5  两独立样本Brown-Mood中位数检验t783.5  两配对样本的非参数检验t813.5.1  两配对样本符号检验t813.5.2  中位数、分位数及比例的符号检验t823.5.3  两配对样本Wilcoxon符号秩检验t833.5.4  Wilcoxon符号秩单样本检验t853.5.5  两配对样本McNemar检验t863.5.6  边缘齐性检验t883.6  多样本的非参数检验t883.6.1  多独立样本中位数检验t883.6.2  多独立样本Kruskal-Wallis检验t903.6.3  多独立样本Jonckheere-Terpstra检验t913.6.4  多配对样本Friedman检验t943.6.5  多配对样本Kendall协同系数检验t963.6.6  多配对样本Cochran’s Q检验t973.7  本章小结t98本章概念与关键词t99练习与思考t99第4章  方差分析与相关性分析t1024.1  方差分析t1024.1.1  方差分析中的变量t1024.1.2  单因素方差分析t1034.1.3  单因素方差Brown-Forsythe检验t1054.1.4  单因素方差Welch’s t检验t1064.1.5  无交互作用的双因素方差分析t1074.1.6  有交互作用的双因素方差分析t1094.2  Post Hoc检验t1114.2.1  LSD检验t1114.2.2  Studentized极差分布t1124.2.3  Tukey’s Range检验t1134.2.4  Tukey-Kramer检验t1154.2.5  SNK检验t1174.2.6  其他几种常用检验方法t1184.3  连续属性数据的相关性分析t1194.3.1  协方差的线性相关性度量t1194.3.2  相关系数的线性相关性度量t1224.3.3  Spearman秩相关系数t1244.4  离散属性相关性分析t1264.4.1  交叉列联表分析t1264.4.2  用卡方检验进行离散相关性分析t1274.4.3  列联表上常用的指标t1284.4.4  Fisher’s exact检验t1294.5  本章小结t131本章概念与关键词t132练习与思考t132第5章  数据的预处理与距离分析t1345.1  数据的预处理t1345.1.1  数据清理t1345.1.2  数据集成t1365.1.3  数据变换t1375.1.4  数据归约t1375.2  数据的常用组织方式t1385.2.1  数据的常用逻辑组织t1385.2.2  数据的常用物理组织t1395.2.3  高精度计算与矩阵计算t1395.2.4  编程语言、软件工具t1405.3  相似度计算与距离分析t1405.3.1  相似度与距离的转换t1405.3.2  闵可夫斯基距离t1435.3.3  马氏距离t1455.3.4  混合属性的相似度与距离t1475.4  kNN分类模型t1485.4.1  kNN分类模型概述t1485.4.2  距离加权kNN分类模型t1505.5  参数的点估计t1515.5.1  原点矩与中心矩t1515.5.2  矩估计法t1525.5.3  极大似然估计法t1535.6  本章小结t156本章概念与关键词t156练习与思考t156第6章  回归分析t1586.1  一元线性回归t1586.1.1  一元线性回归问题描述t1586.1.2  一元线性回归模型与求解t1596.1.3  确认回归方程的精度t1616.1.4  总体回归的方差分析t1626.1.5  残差分析t1646.1.6  回归方程参数检验t1676.1.7  回归方程预测与控制t1686.2  多元线性回归t1706.2.1  多元线性回归问题描述t1706.2.2  多元线性回归模型与求解t1726.2.3  确认回归方程的精度t1736.2.4  残差分析t1746.2.5  回归方程参数检验t1756.2.6  回归方程预测t1766.3  常用的曲线回归t1776.3.1  曲线回归问题t1776.3.2  多项式回归t1776.3.3  指数回归与对数回归t1796.3.4  其他常见曲线回归t1796.4  最小二乘法及其应用t1796.4.1  最小二乘法线性拟合t1796.4.2  伪逆矩阵求解t1806.4.3  Moore-Pseudo逆矩阵t1816.4.4  最小均方误差算法t1826.4.5  非线性回归t1836.4.6  智能优化求解技术t1836.5  Logistic回归t1846.5.1  Logistic回归分类与基本函数t1846.5.2  Logistic回归系数计算t1856.6  本章小结t186本章概念与关键词t187练习与思考t187第7章  空间降维技术t1897.1  主成分分析t1897.1.1  主成分分析描述t1897.1.2  基于协方差矩阵的主成分分析t1907.1.3  基于相关系数矩阵的主成分分析t1927.1.4  主成分分析与因子分析的联系t1937.1.5  主成分分析的作用t1947.2  因子分析案例研究t1967.2.1  研究的目的与内容t1967.2.2  变量选取与数据来源t1967.2.3  因子分析过程t1977.2.4  因子回归分析t1987.2.5  案例研究结论t1997.3  奇异值分解t2007.3.1  SVD的协同过滤推荐t2007.3.2  SVD在协同过滤中的应用t2037.3.3  SVD增量式协同过滤方法t2047.4  主成分回归与逐步回归t2057.4.1  多重共线性t2057.4.2  主成分回归t2077.4.3  逐步回归t2077.5  本章小结t208本章概念与关键词t208练习与思考t209第8章  关联规则与点对相关性t2108.1  频繁模式与关联规则的基本概念t2108.1.1  频繁模式的基本概念t2108.1.2  关联规则的基本概念t2118.1.3  极大频繁模式与闭频繁模式t2128.2  频繁模式挖掘t2138.2.1  Apriori算法t2138.2.2  垂直数据格式t2148.2.3  基于频繁模式计算关联规则t2158.3  频繁模式树t2168.3.1  频繁模式树的构建t2168.3.2  频繁模式树的递归过程t2198.4  点对相似度的典型度量t2208.4.1  点对关系常见度量t2208.4.2  点对相关性度量的几种特性t2228.5  信息熵及其应用与点对相关性度量t2248.5.1  信息熵t2248.5.2  联合熵与互信息t2268.5.3  信息增益、相对熵和交叉熵t2288.5.4  互信息、交叉熵用于相关性t2298.6  本章小结t230本章概念与关键词t230练习与思考t231第9章  决策树t2329.1  分类问题与模型训练t2329.1.1  分类问题描述t2329.1.2  分类问题举例与泛化问题t2339.1.3  分类模型的常见评价指标t2359.2  决策树及ID3算法t2369.2.1  决策树概述t2369.2.2  ID3算法t2389.3  C4.5算法与连续属性特征分类树t2419.3.1  C4.5算法t2419.3.2  连续属性的决策树构建t2419.4  CART决策树t2439.4.1  CART分类树t2439.4.2  CART回归树t2449.5  决策树剪枝t2509.5.1  剪枝问题的提出与先剪枝技术t2509.5.2  错误率降低剪枝法t2519.5.3  悲观剪枝法t2519.5.4  代价复杂度剪枝法t2549.6  ROC曲线与AUC指标t2559.6.1  ROC曲线描述与绘制t2559.6.2  ROC曲线绘制与作用t2579.6.3  AUC指标与应用t2589.7  本章小结t259本章概念与关键词t259练习与思考t260第10章  贝叶斯分类t26110.1  连续属性贝叶斯分类器t26110.1.1  单个连续属性贝叶斯分类t26110.1.2  多个连续属性的最小总风险决策t26210.1.3  多个连续属性的最小平均误差率决策t26310.2  正态概率分布下的贝叶斯分类器t26410.2.1  分类器的判别函数表示形式t26410.2.2  正态分布下的贝叶斯判别函数t26410.2.3  正态分布下的贝叶斯判别举例t26510.3  离散属性贝叶斯分类器t26710.3.1  离散属性贝叶斯模型t26710.3.2  朴素贝叶斯分类器t26710.4  朴素贝叶斯文本分类和TAN贝叶斯模型t27010.4.1  朴素贝叶斯文本分类器t27010.4.2  TAN贝叶斯分类模型t27210.5  贝叶斯分类器中的参数估计与非参数估计t27610.5.1  贝叶斯分类器中的参数估计t27610.5.2  非参数估计t27710.6  本章小结t278本章概念与关键词t279练习与思考t279第11章  特征空间与判别分析t28011.1  特征空间t28011.1.1  特征空间构造t28011.1.2  特征空间评价t28211.1.3  特征空间变换t28411.1.4  证据空间t28511.2  特征提取与特征选择t28511.2.1  特征提取t28511.2.2  特征选择t28511.2.3  jiang相关系数t28611.2.4  过滤式特征选择t28811.2.5  封装式特征选择t28811.2.6  嵌入式特征选择t28911.3  极大似然判别分析t28911.3.1  极大似然判别分析的工作过程t28911.3.2  极大似然判别分析的应用举例t29011.4  距离判别分析t29011.4.1  距离与相似度的常用度量t29011.4.2  距离判别分析的工作原理t29111.4.3  距离判别法的检验与多总体距离判别t29311.4.4  两总体方差是否有相同的检验t29411.4.5  加权的距离或相似度应用于距离判别分析与kNN分类模型t29611.5  Fisher判别分析t29611.5.1  两类别的线性判别中的很好投影方向t29611.5.2  两类别的线性判别过程t29811.5.3  多重线性判别分析t29911.5.4  Fisher判别分析应用举例t30111.6  本章小结t303本章概念与关键词t303练习与思考t303第12章  感知机与支持向量机t30512.1  线性判别函数t30512.1.1  线性判别函数表示t30512.1.2  多重线性判别函数t30612.1.3  广义线性判别函数t30612.2  感知机分类器t30712.2.1  M-P模型t30712.2.2  感知机结构t30812.2.3  感知机训练算法t30912.2.4  感知机应用举例t31212.3  感知机训练算法扩展t31312.3.1  感知机的典型训练算法t31312.3.2  感知机松弛算法t31412.3.3  最小均方误差求解算法t31412.3.4  Ho-kashyap求解算法t31612.3.5  多分类扩展伪逆求解t31712.3.6  感知机的对偶形式t31812.4  优选间隔超平面与结构风险t31912.4.1  优选间隔超平面t31912.4.2  经验风险最小化与结构风险最小化t32012.5  支持向量机t32312.5.1  线性可分时的支持向量机t32312.5.2  数据不可分时的线性SVMt32712.5.3  非线性支持向量机t33212.5.4  支持向量机中的其他问题t33612.6  本章小结t338本章概念与关键词t339练习与思考t339第13章  人工神经网络t34113.1  激活函数与多层感知机t34113.1.1  常见激活函数t34113.1.2  多层感知机结构t34413.1.3  多层感知机设计t34513.2  BP神经网络t34713.2.1  BP神经网络及BP算法t34713.2.2  BP算法训练中的注意事项t35113.3  BP神经网络应用t35513.3.1  二分类问题应用t35513.3.2  多分类问题与拟合问题t35913.4  深度学习t36113.4.1  深度学习技术环境t36113.4.2  卷积神经网络t36313.4.3  卷积神经网络训练与应用举例t36813.4.4  循环神经网络t37313.4.5  其他深度学习技术t37613.5  本章小结t378本章概念与关键词t379练习与思考t379第14章  集成学习t38114.1  机器学习中的若干问题t38114.1.1  机器学习的主要任务类型t38114.1.2  机器学习的泛化问题t38214.1.3  维数灾难问题t38414.1.4  机器学习模型的优越性问题t38514.2  统计量重抽样技术t38614.2.1  偏差与方差t38614.2.2  刀切法统计量估计t38714.2.3  自助法统计量估计t38814.3  分类器重抽样技术与组合分类器t38914.3.1  Bagging法t38914.3.2  Boosting法t38914.3.3  Bagging法与Boosting法的主要特点t39014.3.4  组合分类器t39014.4  随机森林与Adaboost算法t39314.4.1  随机森林t39314.4.2  Adaboost算法t39614.5  分类模型中的若干问题t39714.5.1  用二分类器处理多分类问题t39714.5.2  多标签分类方法t39914.5.3  类别数据不平衡问题t40014.5.4  单纯提高准确率与单纯提高召回率的方法t40114.6  本章小结t402本章概念与关键词t403练习与思考t403第15章  聚类分析与离群点分析t40415.1  聚类问题与聚类类型t40415.1.1  聚类问题t40415.1.2  聚类类型t40515.2  基于划分的聚类t40615.2.1  k-means聚类t40615.2.2  k-medoids聚类t40815.3  层次聚类t41015.3.1  簇间距离的计算t41015.3.2  层次聚类方法t41015.4  基于密度的聚类t41215.4.1  DBSCAN聚类t41215.4.2  OPTICS聚类t41515.5  基于网格的聚类与基于模型的聚类t41715.5.1  CLIQUE聚类t41715.5.2  自组织神经网络聚类原理t41815.6  离群点分析t42015.6.1  离群点分析t42015.6.2  离群点检测t42015.7  本章小结t421本章概念与关键词t422练习与思考t422附录A  Mann-Whitney U检验的临界表t424附录B  Wilcoxosigned-rank检验按符号秩和的临界表t424附录C  Wilcoxosigned-rank检验按mi(正号秩,负号秩)的临界表t425附录D  q分布(Studentized range distribution)的临界表t426附录E  Dunnett双尾检验的临界表t428附录F  相关系数R和判定系数R2的临界表t430附录G  鸢尾花数据集t431参考文献t433
作者介绍

序言

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP