• Python商业数据挖掘
21年品牌 40万+商家 超1.5亿件商品

Python商业数据挖掘

30.75 2.6折 118 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者[美]GalitShmueli,PeterC.Bruce,P

出版社清华大学出版社

ISBN9787302590248

出版时间2021-11

版次1

装帧平装

开本16开

纸张胶版纸

定价118元

上书时间2024-05-21

纵列風

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:Python商业数据挖掘
定价:118.00元
作者:[美]GalitShmueli,PeterC.Bruce,PeterGedeck,NitinR.P
出版社:清华大学出版社
出版日期:2021-11-01
ISBN:9787302590248
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
通过学习《Python商业数据挖掘(第6版)》,读者将掌握使用Python实现数据挖掘的各种方法,并深入理解在将这些方法应用于数据挖掘的过程中存在的商业问题和机遇。
内容提要
本书前5版好评如潮,作为第6版,本书首次使用了Python语言。本书除了介绍用于统计和机器学习等领域的预测、分类、可视化、降维、推荐系统、聚类、文本挖掘、网络分析等方法之外,内容还包括: 新加入的合著者Peter Gedeck拥有使用Python讲解商业分析课程的丰富经验以及将机器学习应用于新药发现过程的专业技能。在本书中,他十分乐于将这些经验和技能与读者分享。 讨论数据挖掘中的伦理问题。 根据教师和学生的反馈意见对内容做了更新。 通过多个案例展示数据挖掘技术的实际应用。 每章后面的习题有助于读者评估和加深对该章内容的理解。 在线支持网站提供了数据集、教学资料、习题答案、PPT教案和案例解决方案。
目录
第I 部分 预备知识 章 引言............................................................31.1 商业分析简介...........................................31.2 什么是数据挖掘......................................41.3 数据挖掘及相关术语..............................41.4 大数据........................................................51.5 数据科学...................................................61.6 为什么有这么多不同的方法.................61.7 术语与符号...............................................71.8 本书的线路图...........................................8第2 章 数据挖掘过程概述................................112.1 引言..........................................................112.2 数据挖掘的核心思想............................112.2.1 分类.................................................112.2.2 预测.................................................122.2.3 关联规则与推荐系统........................122.2.4 预测分析..........................................122.2.5 数据规约与降维技术........................122.2.6 数据探索和可视化...........................122.2.7 监督学习与无监督学习....................132.3 数据挖掘步骤.........................................132.4 前期步骤.................................................152.4.1 数据集的组织...................................152.4.2 预测West Roxbury 小区的房价........152.4.3 在Python 程序中载入并浏览数据....162.4.4 Python 包的导入...............................182.4.5 从数据库获得采样数据....................182.4.6 在分类任务中对小概率事件的过采样.............................................192.4.7 数据预处理和数据清理....................192.5 预测力和过拟合.................................... 242.5.1 过拟合............................................. 242.5.2 数据分区的创建和使用.................... 262.6 建立预测模型........................................ 282.7 在本地计算机上用Python 实现数据挖掘................................................. 322.8 自动化数据挖掘解决方案................... 332.9 数据挖掘中的伦理规范....................... 332.10 习题........................................................ 37第Ⅱ部分 数据探索与降维技术第3 章 数据可视化.............................................433.1 引言.......................................................... 433.2 数据实例................................................. 453.3 基本图形:条形图、折线图和散点图..................................................... 463.3.1 分布图:箱线图和直方图................ 483.3.2 热图:可视化相关性和缺失值......... 513.4 多维数据的可视化................................ 533.4.1 添加变量:颜色、大小、形状、多面板和动画.................................. 533.4.2 数据操作:重定标、聚合与层次结构、缩放与过滤........................... 563.4.3 趋势线和标签.................................. 593.4.4 扩展到大型数据集........................... 603.4.5 多变量图:平行坐标图.................... 623.4.6 交互式可视化.................................. 633.5 专用的可视化技术................................ 653.5.1 网络数据可视化............................... 653.5.2 层次数据可视化:树状结构图......... 663.5.3 地理数据可视化:地图.................... 683.6 小结..........................................................713.7 习题..........................................................71第4 章 降维.........................................................754.1 引言..........................................................754.2 维数的诅咒.............................................754.3 实际考虑..................................................764.4 数据摘要..................................................774.5 相关性分析.............................................804.6 减少分类变量的分类值个数...............814.7 把分类变量转换为数值型变量..........824.8 主成分分析.............................................824.8.1 主成分..............................................874.8.2 数据归一化......................................884.8.3 使用主成分进行分类和预测.............914.9 利用回归模型实现降维.......................914.10 利用分类树与回归树实现降维........914.11 习题........................................................91第Ⅲ部分 性能评价第5 章 评估预测性能........................................975.1 引言..........................................................975.2 评估预测性能.........................................985.3 评估分类器的性能............................. 1025.4 判断排名性能.......................................1115.5 过采样....................................................1155.6 习题........................................................119第Ⅳ部分 预测与分类方法第6 章 多元线性回归......................................1256.1 引言....................................................... 1256.2 解释模型和预测模型......................... 1266.3 估计回归方程和预测结果................ 1276.4 线性回归中的变量选择.................... 1316.4.1 减少预测变量的数量..................... 1316.4.2 正则化(收缩模型).......................... 1366.5 statmodels 包的使用........................... 1386.6 习题....................................................... 139第7 章 k-近邻算法...........................................1437.1 k-近邻分类器(分类结果变量).......... 1437.1.1 确定近邻记录................................ 1437.1.2 分类规则........................................1447.1.3 实例:驾驶式割草机......................1447.1.4 设置临界值....................................1487.1.5 多类别的k-近邻算法.....................1497.1.6 把分类变量转换为二元虚拟变量...............................................1497.2 将k-近邻算法应用于数值型结果变量...............................................1497.3 k-近邻算法的优缺点..........................1517.4 习题........................................................151第8 章 朴素贝叶斯分类器.............................1558.1 引言........................................................1558.1.1 临界概率方法................................1558.1.2 条件概率........................................1568.2 使用完全或精准的贝叶斯分类器....................................................1578.2.1 使用“归类为有可能的类别”准则...............................................1578.2.2 使用临界概率方法.........................1578.2.3 精准贝叶斯方法存在的实际问题...1578.2.4 朴素贝叶斯的独立条件假设...........1588.3 朴素贝叶斯分类器的优缺点............1648.4 习题........................................................165第9 章 分类树与回归树.................................1679.1 引言........................................................1679.2 分类树....................................................1699.3 评估分类树的性能..............................1759.4 如何避免过拟合..................................1789.4.1 停止树的生长................................1799.4.2 调节分类树的参数.........................1809.4.3 限制分类树规模的其他方法...........1829.5 从分类树推断分类规则.....................1839.6 多于两个类别的分类树.....................1839.7 回归树....................................................1839.8 改进预测方法:随机森林法和提升树....................................................1869.8.1 随机森林法....................................1869.8.2 提升树...........................................1889.9 树的优缺点...........................................1899.10 习题......................................................1900 章 Logistic 回归.....................................19310.1 引言......................................................19310.2 Logistic 回归模型..............................19410.3 实例:接受个人贷款申请...............19610.3.1 只有单个预测变量的模型..........19610.3.2 根据数据估计Logistic 模型:计算参数估计值.........................19710.3.3 用几率解释结果(用于分析目的)..........................................19910.4 评估分类性能.....................................20010.5 用于多类别分类的Logistic回归......................................................20210.5.1 定序类别....................................20210.5.2 定类类别....................................20310.5.3 比较定序类别模型和定类类别模型...................................20410.6 分析实例:预测航班是否延误......20610.6.1 训练模型....................................21010.6.2 模型的解释................................21110.6.3 模型的性能................................21210.6.4 变量选择....................................21310.7 statmodels 包的使用..........................21610.8 习题......................................................2171 章 神经网络............................................22111.1 引言......................................................22111.2 神经网络的概念和结构...................22211.3 在数据上拟合神经网络...................22211.3.1 计算节点的输出结果..................22311.3.2 训练模型....................................22511.3.3 对事故的严重程度进行分类.......22911.3.4 避免过拟合................................23111.3.5 把神经网络的输出结果用于预测和分类................................23111.4 要求用户输入.....................................23111.5 探索预测变量与因变量的关系......23211.6 深度学习.............................................23211.6.1 卷积神经网络............................23311.6.2 局部特征图................................23411.6.3 层次特征....................................23411.6.4 学习过程....................................23511.6.5 无监督学习................................23511.6.6 结论...........................................23611.7 神经网络的优缺点............................23611.8 习题......................................................2372 章 判别分析............................................ 23912.1 引言......................................................23912.2 记录与类别的距离...........................24112.3 Fisher 线性分类函数........................24212.4 判别分析的分类性能.......................24512.5 先验概率.............................................24512.6 误分类成本不均等...........................24612.7 多类别情形下的分类.......................24612.8 判别分析的优缺点...........................24912.9 习题......................................................2503 章 组合方法:集成学习和增益模型.................................................... 25313.1 集成学习.............................................25313.1.1 为什么集成学习可以改进预测能力...................................25413.1.2 集成学习的优缺点.....................25713.2 增益(说服)模型.................................25713.2.1 建立一个简单的预测模型..........26013.2.2 建立增益模型............................26013.2.3 使用Python 程序计算增益.........26113.2.4 应用增益模型的结果.................26213.3 小结......................................................26213.4 习题......................................................263第Ⅴ部分 挖掘记录之间的关系4 章 关联规则和协同过滤...................... 26714.1 关联规则...........

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP