大数据分析与挖掘实用案例教程
¥
23.99
3.7折
¥
65
九品
仅1件
作者万欣
出版社电子工业出版社
出版时间2022-01
版次1
装帧其他
货号A14
上书时间2024-12-10
商品详情
- 品相描述:九品
图书标准信息
-
作者
万欣
-
出版社
电子工业出版社
-
出版时间
2022-01
-
版次
1
-
ISBN
9787121427800
-
定价
65.00元
-
装帧
其他
-
开本
其他
-
纸张
胶版纸
-
页数
344页
-
字数
545.6千字
- 【内容简介】
-
大数据分析与挖掘已经广泛应用于各行各业。本书以项目实践为基础,对大数据分析与挖掘的基础知识进行了介绍,结了机器学、大数据分析与挖掘过程、数据分析挖掘框架和库,分析了当前的研究热点与前沿技术。为了增强本书的实用、提高读者的动手能力,本书结合案例讨论了爬虫与数据处理、echart和python可视化、描述分析、并联分析、回归与分类、聚类、序列挖掘等基本方法的实现与实践。本书结合实际案例,探讨了文本分析、主题模型、系统、知识图谱、情感分析等实现与实践。此外,本书还介绍了大数据分析与挖掘在管理领域的应用案例。本书适合作为高等学校数据挖掘、智能、数据分析等课程的教材,也可供数据分析与数据挖掘从业人员阅读,还可供从事数据挖掘、机器学应用研究的科研人员参。
- 【作者简介】
-
:
吴江,博士生导师,武汉大学珞珈特聘教授;在华中科技大学管理学院获得博士学位,是美国卡内基梅隆大学计算机学院的联合培养博士。目前兼任湖北省电子商务学会秘书长、中国“双法”研究会计算机模拟分会常务理事、中国系统工程学会数据科学与知识系统工程专业委员会常务委员、中国科技情报学会健康信息学专委会副主任委员等职务。研究方向为商务数据智能、社会网络计算、乡村数字转型等。在国内外发表学术论文100多篇,出版学术专著2部。先后主持国家重点研发计划项目、教育部哲学社会科学研究重大课题攻关项目、国家高端智库项目、国家自然科学基金面上项目等10余项国家级项目。
- 【目录】
-
篇 绪 论
章 大数据分析与挖掘的概念与理论
1.1 概述
1.2 机器学
1.2.1 机器学的定义
1.2.2 机器学类型
1.2.3 机器学的应用与工具
1.3 数据挖掘与知识发现过程
1.3.1 crisp-dm
1.3.2 知识发现
1.4 大数据分析与挖掘中的研究热点与前沿
1.4.1 智能研究热点与前沿
1.4.2 大数据分析热点与前沿
1.4.3 机器学热点与前沿
1.4.4 数据挖掘热点与前沿
1.4.5 本章小结
本章参文献
本书涉及的环境、语言、框架和库
第2篇 基础实践篇
第2章 爬虫与数据处理――“茶悦”话题情感趋向的影响因素
2.1 相关理论
2.1.1 python爬虫
2.1.2 其他相关理论
2.2 背景与分析目标
2.3 数据采集与处理
2.3.1 茶悦品牌的选择
2.3.2 数据的选择
2.3.3 数据的采集
2.3.4 数据的处理
2.4 数据的分析与挖掘
2.4.1 情绪分析
2.4.2 词云分析
2.5 拓展思
2.6 本章小结
本章参文献
第3章 echarts可视化――b站分区热度及其影响因素分析
3.1 echarts介绍及使用
3.1.1 echarts实例
3.1.2 系列
3.1.3 组件
3.1.4 用option描述图表
3.1.5 组件的定位
3.1.6 坐标系
3.1.7 小例子:实现历图
3.1.8 自定义配置参数
3.2 其他相关理论
3.2.1 主题模型
3.2.2 数据预处理
3.3 背景与分析目标
3.4 数据采集与处理
3.4.1 数据采集
3.4.2 数据处理
3.5 数据分析与挖掘
3.5.1 分区热度
3.5.2 影响因素之标题分析
3.5.3 影响因素之时长和发布时间分析
3.6 拓展思
3.7 本章小结
本章参文献
第4章 python可视化――社科项目选题分析
4.1 python可视化
4.2 背景与分析目标
4.3 数据采集与处理
4.4 数据分析与挖掘
4.4.1 matplotlib可视化分析
4.4.2 词云图
4.4.3 知识图谱
4.5 拓展思
4.6 本章小结
本章参文献
第5章 描述分析――热映电影背后的成因分析
5.1 描述分析
5.1.1 描述分析的含义
5.1.2 基于python的描述统计分析
5.2 背景与分析目标
5.2.1 背景
5.2.2 分析目标
5.3 数据采集与处理
5.3.1 数据采集
5.3.2 数据处理
5.4 数据分析与挖掘
5.4.1 电影行业的整体发展情况
5.4.2 电影类型随时间的变化趋势
5.5 拓展思
5.5.1 数据分析的意义
5.5.2 数据分析的分类
5.6 本章小结
本章参文献
第6章 关联分析――提高相亲旅游成功率的分析
6.1 相关理论
6.1.1 关联分析概念
6.1.2 频繁项集挖掘方法
6.2 背景与分析目标
6.3 数据采集与处理
6.3.1 数据采集
6.3.2 数据预处理
6.4 数据分析与挖掘
6.4.1 用户属定位
6.4.2 旅游路线及内容规划
6.4.3 结
6.5 拓展思
6.5.1 理论意义
6.5.2 实践意义
6.5.3 优点
6.5.4 不足之处
6.6 本章小结
本章参文献
第7章 回归与分类――房房价影响因素及预测分析
7.1 回归与分类
7.1.1 回归分析
7.1.2 分类与预测
7.2 背景与分析目标
7.3 数据采集与处理
7.4 数据分析与挖掘
7.4.1 数据分析
7.4.2 机器学与预测房价
7.5 拓展思
7.6 本章小结
本章参文献
第8章 分类――民宿价格和评分影响因素分析
8.1 相关理论
8.1.1 分类
8.1.2 线回归
8.2 背景与分析目标
8.3 数据采集与处理
8.3.1 数据采集
8.3.2 数据预处理
8.4 数据分析与挖掘
8.4.1 民宿价格影响因素分析
8.4.2 民宿评分影响因素分析
8.4.3 结论与对策建议
8.5 拓展思
8.5.1 理论意义
8.5.2 实践意义
8.5.3 不足之处
8.6 本章小结
本章参文献
第9章 聚类――新冠肺炎疫情分析及的数据挖掘
9.1 聚类
9.1.1 聚类方法
9.1.2 k-means
9.1.3 dbscan
9.2 背景与分析目标
9.3 数据采集与处理
9.3.1 数据选择
9.3.2 数据采集
9.3.3 数据预处理
9.4 数据分析与挖掘
9.4.1 疫情数据拟合分析
9.4.2 数据信息挖掘
9.5 拓展思
9.5.1 理论意义
9.5.2 实践意义
9.6 本章小结
本章参文献
0章 序列挖掘――景区客流量影响因素分析与预测
10.1 相关理论
10.1.1 序列挖掘
10.1.2 其他相关理论
10.2 背景与分析目标
10.3 数据采集与处理
10.3.1 数据采集
10.3.2 影响因素分析
10.3.3 数据处理
10.4 数据分析与挖掘
10.4.1 稳时间序列分析
10.4.2 非稳时间序列分析
10.4.3 其他时间序列分析
10.5 拓展思
10.5.1 理论意义
10.5.2 实践意义
10.5.3 优点
10.5.4 不足之处
10.6 本章小结
本章参文献
第3篇 提高实践篇
1章 文本分析――工作报告分析
11.1 文本分析相关理论
11.1.1 概念和方法
11.1.2 工具
11.2 背景与分析目标
11.3 数据采集与处理
11.4 数据分析与挖掘
11.5 本章小结
本章参文献
2章 主题模型――生育价值观变化分析
12.1 主题模型
12.1.1 lsi
12.1.2 plsi
12.1.3 plsa
12.1.4 lda
12.2 背景与分析目标
12.3 数据采集与处理
12.3.1 数据选择
12.3.2 数据采集
12.3.3 数据预处理
12.4 数据分析与挖掘
12.4.1 各因素影响研究分析
12.4.2 数据的特征分析
12.4.3 语义网络分析
12.4.4 情感分析
12.4.5 lda主题构建
12.5 拓展思
12.5.1 理论意义
12.5.2 实践意义
12.5.3 优点
12.5.4 不足之处
12.6 本章小结
本章参文献
3章 系统――基于牛客网的职位分析
13.1 系统
13.1.1 基于内容的
13.1.2 协同过滤
13.1.3 混合式
13.2 背景与分析目标
13.3 数据采集与处理
13.4 数据分析与挖掘
13.4.1 可视化分析
13.4.2 系统设计与开发
13.4.3 知识图谱
13.5 拓展思
13.5.1 理论意义
13.5.2 实践意义
13.5.3 优点
13.5.4 不足之处
13.6 本章小结
本章参文献
4章 知识图谱――影评分析
14.1 相关理论
14.1.1 知识图谱
14.1.2 其他相关理论
14.2 背景与分析目标
14.3 数据采集与处理
14.3.1 数据采集
14.3.2 数据描述
14.3.3 数据预处理
14.4 数据分析与挖掘
14.4.1 知识图谱的构建
14.4.2 tf-idf特征提取
14.4.3 情感分析
14.4.4 lda主题模型
14.5 拓展思
14.5.1 理论意义
14.5.2 实践意义
14.5.3 优点
14.5.4 不足之处
14.6 本章小结
本章参文献
5章 情感分析――景区印象分析
15.1 相关理论
15.1.1 情感分析
15.1.2 其他相关理论
15.2 背景与分析目标
15.2.1 背景
15.2.2 分析目标
15.2.3 a01景区的竞争形势
15.3 数据采集与处理
15.3.1 数据爬取与清洗
15.3.2 分词与去停用词
15.4 情感分析
15.4.1 关键词提取(tf-idf)
15.4.2 词云图
15.4.3 情感分类(正、负面情感)
15.4.4 lda主题模型
15.5 数据分析与挖掘
15.5.1 描述统计
15.5.2 社会关系网络
15.5.3 ss分析
15.5.4 swot分析
15.6 拓展思
15.7 本章小结
本章参文献
第4篇 管理应用篇
6章 网红经济背景下审丑现象的受众心理及原因分析――以马某某事件为例
16.1 引言
16.2 文献回顾及相关理论
16.2.1 文献回顾
16.2.2 相关理论
16.3 数据来源与处理
16.3.1 数据来源
16.3.2 数据处理
16.3.3 研究方法
16.4 数据挖掘与分析
16.4.1 博文关键词词频分析
16.4.2 原因类博文分析
16.4.3 数据分析
16.5 本章小结
16.5.1 丑味网红流行的原因
16.5.2 用户追捧审丑的原因
本章参文献
7章 丁真走红背后的那些事――基于数据分析
17.1 引言
17.2 文献回顾
17.3 研究方法及理论基础
17.3.1 研究方法
17.3.2 理论基础
17.4 数据挖掘与分析
17.4.1 数据爬取
17.4.2 数据处理
17.4.3 分析过程与结果
17.5 本章小结
本章参文献
8章 “准社会交往”原则下网红受欢迎的原因分析――基于丁真数据
18.1 引言
18.2 文献回顾
18.3 理论与方法
18.4 数据挖掘与分析
18.4.1 数据爬取
18.4.2 数据处理
18.4.3 分析过程与结果
18.5 本章小结
18.5.1 结论
18.5.2 启示
18.5.3 不足之处
本章参文献
9章 基于经济理论对消费者购买行为影响因素的分析
19.1 引言
19.2 相关理论
19.2.1 经济
19.2.2 购买意愿
19.3 数据爬取
19.4 数据处理
19.4.1 分词处理
19.4.2 数据数值化
19.5 数据分析
19.5.1 多元线回归分析
19.5.2 一元分析与多元分析混合
19.6 情感分析
19.6.1 数据筛选
19.6.2 一般消费者情感分析
19.6.3 消费者情感分析
19.6.4 对比结论
19.7 经济乱象
19.8 建议
本章参文献
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价