• Python网络数据爬取及分析从入门到精通
21年品牌 40万+商家 超1.5亿件商品

Python网络数据爬取及分析从入门到精通

28.3 4.7折 59.8 九五品

仅1件

北京通州
认证卖家担保交易快速发货售后保障

作者杨秀璋,颜娜

出版社北京航空航天大学出版社

ISBN9787512427136

出版时间2018-05

版次1

装帧平装

开本16开

纸张胶版纸

定价59.8元

上书时间2024-11-30

纵列風

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:Python网络数据爬取及分析从入门到精通
定价:59.80元
作者:杨秀璋,颜娜
出版社:北京航空航天大学出版社
出版日期:2018-05-01
ISBN:9787512427136
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
这是一套以实例为主、使用Python语言讲解网络数据爬虫及分析的实战指南。本套书通俗易懂,涵盖了Python基础知识、数据爬取、数据分析、数据预处理、数据可视化、数据存储、算法评估等多方面知识,每一部分知识都从安装过程、导入扩展包到算法原理、基础语法,再结合实例进行详细讲解。本套书包括两本:《Python网络数据爬取及分析从入门到精通(爬取篇)》和《Python网络数据爬取及分析从入门到精通(分析篇)》。看完此书,真正让你做到从入门到精通。
内容提要
本书采用通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python语言进行网络数据分析的知识,主要内容包括Python数据分析常用库、可视化分析、回归分析、聚类分析、分类分析、关联规则挖掘分析、数据预处理及文本聚类、词云热点与主题分布分析、复杂网络与基于数据库技术的分析等。书中所有知识点都结合了具体的实例进行介绍,涉及的实例都给出了详细分析流程,程序代码都给出了具体的注释,采用图文结合的形式讲解,让读者能更加轻松地领会Python网络数据分析的精髓,快速提高自己的开发能力。本书既可作为Python开发入门者的自学用书,也可作为高等院校数据分析、数据挖掘、机器学习、大数据等相关专业的教学参考书或实验指导书,还可供Python数据分析人员查阅、参考。
目录
章 网络数据分析概述                        11.1 数据分析                             11.2 相关技术                             31.3 Anaconda开发环境                        51.4 常用数据集                            91.4.1 Sklearn数据集                        91.4.2 UCI数据集                         101.4.3 自定义爬虫数据集                      111.4.4 其他数据集                         121.5 本章小结                            13参考文献                              14第2章 Python数据分析常用库                     152.1 常用库                             152.2 NumPy                             172.2.1 Array用法                          172.2.2 二维数组操作                        192.3 Pandas                             212.3.1 读/写文件                         222.3.2 Series                          242.3.3 DataFrame                         262.4 Matplotlib                            262.4.1 基础用法                          272.4.2 绘图简单示例                        282.5 Sklearn                             312.6 本章小结                            32参考文献                              32第3章 Python可视化分析                       333.1 Matplotlib可视化分析                       333.1.1 绘制曲线图                         333.1.2 绘制散点图                         373.1.3 绘制柱状图                         403.1.4 绘制饼状图                         423.1.5 绘制3D图形                        433.2 Pandas读取文件可视化分析                    453.2.1 绘制折线对比图                       453.2.2 绘制柱状图和直方图                     483.2.3 绘制箱图                          513.3 ECharts可视化技术初识                      533.4 本章小结                            57参考文献                              57第4章 Python回归分析                        584.1 回 归                             584.1.1 什么是回归                         584.1.2 线性回归                          594.2 线性回归分析                          604.2.1 LinearRegression                       614.2.2 线性回归预测糖尿病                     634.3 多项式回归分析                         684.3.1 基础概念                          684.3.2 PolynomialFeatures                      694.3.3 多项式回归预测成本和利润                  704.4 逻辑回归分析                          734.4.1 LogisticRegression                      754.4.2 鸢尾花数据集回归分析实例                  754.5 本章小结                            83参考文献                              83第5章 Python聚类分析                        855.1 聚 类                             855.1.1 算法模型                          855.1.2 常见聚类算法                        865.1.3 性能评估                          885.2 K-Means                            905.2.1 算法描述                          905.2.2 用K-Means分析篮球数据                  965.2.3 K-Means聚类优化                      995.2.4 设置类簇中心                        1035.3 BIRCH                             1055.3.1 算法描述                          1055.3.2 用BIRCH 分析氧化物数据                 1065.4 降维处理                            1105.4.1 PCA降维                          1115.4.2 Sklearn PCA降维                      1115.4.3 PCA降维实例                        1135.5 本章小结                            117参考文献                              118第6章 Python分类分析                       1196.1 分 类                             1196.1.1 分类模型                          1196.1.2 常见分类算法                        1206.1.3 回归、聚类和分类的区别                   1226.1.4 性能评估                          1236.2 决策树                             1236.2.1 算法实例描述                        1236.2.2 DTC算法                          1256.2.3 用决策树分析鸢尾花                     1266.2.4 数据集划分及分类评估                    1286.2.5 区域划分对比                        1326.3 KNN分类算法                         1366.3.1 算法实例描述                        1366.3.2 KNeiorsClassifier                    1386.3.3 用KNN分类算法分析红酒类型               1396.4 SVM 分类算法                         1476.4.1 SVM 分类算法的基础知识                  1476.4.2 用SVM 分类算法分析红酒数据               1486.4.3 用优化SVM 分类算法分析红酒数据集            1516.5 本章小结                            154参考文献                              154第7章 Python关联规则挖掘分析                   1567.1 基本概念                            1567.1.1 关联规则                          1567.1.2 置信度与支持度                       1577.1.3 频繁项集                          1587.2 Apriori算法                          1597.3 Apriori算法的实现                       1637.4 本章小结                            167参考文献                              167第8章 Python数据预处理及文本聚类                 1688.1 数据预处理概述                         1688.2 中文分词                            1708.2.1 中文分词技术                        1708.2.2 Jieba中文分词工具                     1718.3 数据清洗                            1758.3.1 概 述                           1758.3.2 中文语料清洗                        1768.4 特征提取及向量空间模型                     1798.4.1 特征规约                          1798.4.2 向量空间模型                        1818.4.3 余弦相似度计算                       1828.5 权重计算                            1848.5.1 常用权重计算方法                      1848.5.2 TF-IDF                          1858.5.3 用Sklearn计算TF-IDF                   1868.6 文本聚类                            1888.7 本章小结                            192参考文献                              192第9章 Python词云热点与主题分布分析                1939.1 词 云                             1939.2 WordCloud的安装及基本用法                   1949.2.1 WordCloud的安装                      1949.2.2 WordCloud的基本用法                    1959.3 LDA                              2039.3.1 LDA的安装过程                      2039.3.2 LDA的基本用法及实例                   2049.4 本章小结                            214参考文献                              2140章 复杂网络与基于数据库技术的分析                21510.1 复杂网络                           21510.1.1 复杂网络和知识图谱                    21510.1.2 NetworkX                         21710.1.3 用复杂网络分析学生关系网                 21910.2 基于数据库技术的数据分析                   22410.2.1 数据准备                         22410.2.2 基于数据库技术的可视化分析                22510.2.3 基于数据库技术的可视化对比                23210.3 基于数据库技术的博客行为分析                 23410.3.1 幂率分布                         23410.3.2 用幂率分布分析博客数据集                 23510.4 本章小结                           245参考文献                              245本套后记                               246致谢                                248
作者介绍
杨秀璋,毕业于北京理工大学软件学院,长期从事Web数据挖掘、Python数据分析、网络数据爬取工作及研究。他现任教于贵州财经大学信息学院,主讲“数据挖掘与分析”“大数据技术及应用”课程,并从事大数据分析、数据挖掘、知识图谱等领域的项目研究与开发;有多年的Python编程、数据分析及知识图谱研究经验,实战经验较为丰富。此外,他还积极分享编程知识和开源代码编写经验,先后在CSDN、博客园、阿里云栖社区撰写博客,仅在CSDN就分享了300多篇原创文章,开设了11个专栏,累计阅读量超过250万人次。
序言

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP