Python数据挖掘入门与实践(第2版)
全新正版 极速发货
¥
47.43
6.0折
¥
79
全新
库存7件
作者(澳)罗伯特·莱顿
出版社人民邮电出版社
ISBN9787115528025
出版时间2020-03
装帧平装
开本16开
定价79元
货号1202039092
上书时间2024-07-12
商品详情
- 品相描述:全新
- 商品描述
-
目录
版权信息
译者序
前言
致谢
章数据挖掘入门
1.1什么是数据挖掘
1.2使用Python和JupyterNotebook
1.3亲和性分析的简单示例
1.4商品推荐
1.5分类的简单示例
1.6什么是分类
1.7本章小结
第2章用scikit-learn估计器解决分类问题
2.1scikit-learn估计器
2.2预处理
2.3流水线
2.4本章小结
第3章用决策树预测获胜球队
3.1加载数据集
3.2决策树
3.3体育赛事结果预测
3.4随机森林
3.5本章小结
第4章用亲和性分析推荐电影
4.1亲和性分析
4.2电影推荐问题
4.3Apriori算法的原理与实现
4.4本章小结
第5章特征与scikit-learn转换器
5.1特征提取
5.2特征的选取
5.3特征创建
5.4主成分分析
5.5创建自己的转换器
5.6单元测试
5.7组装成型
5.8本章小结
第6章用朴素贝叶斯算法探索社交媒体
6.1消歧
6.2从社交媒体下载数据
6.3文本转换器
6.4朴素贝叶斯
6.5朴素贝叶斯的应用
6.6从模型中找出有用的特征
6.7本章小结
第7章用图挖掘实现推荐关注
7.1加载数据集
7.2从Twitter获取关注者信息
7.3创建图
7.4寻找子图
7.5本章小结
第8章用神经网络识别验证码
8.1人工神经网络
8.2创建数据集
8.3训练与分类
8.4预测单词
8.5本章小结
第9章作者归属问题
9.1文档的作者归属
9.2获取数据
9.3功能词的使用
9.4支持向量机
9.5字符n元语法
9.6安然(Enron)数据集
9.7组装成型
9.8评估
9.9本章小结
0章聚类新闻文章
10.1发现热门话题
10.2从任意网站提取文本
10.3为新闻文章分组
10.4k-均值算法
10.5聚类集成
10.6在线学习
10.7本章小结
1章用深度神经网络实现图像中的对象检测
11.1对象分类
11.2应用场景
11.3深度神经网络
11.4TensorFlow简介
11.5使用Keras
11.6GPU优化
11.7应用
11.8本章小结
2章大数据处理
12.1大数据
12.2MapReduce
12.3应用MapReduce
12.4朴素贝叶斯预测
12.5提取博客文章
12.6训练朴素贝叶斯
12.7组装成型
12.8在亚马逊EMR基础设施上训练
12.9本章小结
附录A下一步工作
内容摘要
本书以实践为宗旨,对数据挖掘进行了详细地入门引导。本书囊括了比赛结果预测、电影推荐、特征提取、好友推荐、破解验证码、作者归属、新闻聚类等大量经典案例,并以此为基础提供了大量练习和额外活动。在练习中,本书介绍了数据挖掘的基本工具和基本方法;在额外活动中,本书为深入了解数据挖掘指明了方向。本书适合希望应用Python进行数据挖掘的程序员阅读。
主编推荐
本书由浅入深地介绍了数据挖掘的基础知识;
图文并茂,同时提供了种类繁多的Python库来支持具体实践;
第二版更新了示例和代码,每一章都引入了新的算法和技术。
本书将手把手指引你:
基于过去结果预测体育赛事胜负
根据行文风格确定文档作者
调用API下载社会媒体或其他在线服务的数据集
在复杂数据集中寻找并提取合适的特征
创建解决现实问题的模型
运用各种各样的数据集,设计并开发数据挖掘应用
利用深度神经网络完成图像中的对象检测
— 没有更多了 —
以下为对购买帮助不大的评价