• 【假一罚四】大数据分析:从理论到实践成生辉
21年品牌 40万+商家 超1.5亿件商品

【假一罚四】大数据分析:从理论到实践成生辉

集团直发,全新正版书籍,假一罚四,放心选购。24小时内发货。可开发票

36.3 7.4折 49 全新

库存2件

浙江嘉兴
认证卖家担保交易快速发货售后保障

作者成生辉

出版社电子工业

ISBN9787121412615

出版时间2021-07

装帧平装

开本16开

定价49元

货号31187908

上书时间2024-06-20

朗朗图书书店

已实名 已认证 进店 收藏店铺
  • 店主推荐
  • 最新上架

   商品详情   

品相描述:全新
商品描述
商品简介

 

本书包含10章,分为:第1章,阐述数据分析的基础理论;第2章,介绍数据清洗和数据获取的知识和方法;第3章至第9章,覆盖了基础统计分析、多维数据分析、时序数据分析、地理数据分析、图数据分析、文本数据分析和多媒体数据分析,包括每种分析方法的基础定义、分析方法和工具使用到具体领域的可视化实用案例;第10章,以中国社会发展数据演示分析方法的使用。书中提到的基础理论知识都有配套的在线实践工具,能够让用户在学习基础理论知识之后和实践进行连接,真正达到学以致用的效果。通过实践工具,用户可以实现独自完成数据可视化分析案例的产出。本书采用了可视化辅助分析的办法,通俗易懂,不拘泥于数学公式。 本书不仅可作为数据分析初学者的入门手册,也可作为数据分析学者进行数据研究和案例分析的参考指南。

 

作者简介
成生辉,香港中文大学深圳和深圳市大数据研究院研究科学家,大数据可视化实验室负责人,Dagoo平台创始人。博士毕业于石溪纽约州立大学计算系,曾在德国弗里德里希?席勒大学,德国莱比锡大学医学研究所,美国布鲁克海文国家实验室和哈佛大学进行访问研究。先后在2015和2016国际可视化年会上获得最佳海报提名奖,并受邀在大会上担任授课导师。他担任2019年国际可视化年会(短文)程序委员会委员,中国可视化与可视分析专委会委员,CSIG-VIS2019高峰论坛(深圳)执行主席,入选深圳市海外高层次人才。近期,他被世界银行聘为顾问。

目录
第1章  引言1
1.1  大数据的发展历程1
1.2  大数据的概念和定义3
1.2.1  大量(Volume)4
1.2.2  多样(Variety)5
1.2.3  价值密度低(Value)5
1.2.4  高速(Velocity)5
1.2.5  真实性(Veracity)6
1.3  大数据对社会的影响6
1.3.1  大数据促进经济发展6
1.3.2  大数据提升社会保障7
1.3.3  数据治国8
1.4  大数据的分析方法9
1.4.1  统计9
1.4.2  数据挖掘10
1.4.3  人工智能11
1.5  数据可视化技术11
1.5.1  可视化历史11
1.5.2  可视化概述12
1.5.3  可视化应用15
第2章  数据预处理17
2.1  什么是网络爬虫17
2.2  网络爬虫的实现18
2.2.1  Python编程语言18
2.2.2  正则表达式19
2.2.3  超文本标记语言21
2.2.4  超文本传输协议23
2.3  数据清洗24
2.3.1  处理缺失值24

2.3.2  处理异常值25
2.3.3  处理噪声26
第3章  基础统计分析29
3.1  统计学的基本概念29
3.2  连续变量的统计描述30
3.2.1  频数30
3.2.2  集中趋势描述指标32
3.2.3  离散趋势描述指标33
3.3  分类变量的统计描述33
3.4  常用统计图34
3.4.1  饼图35
3.4.2  柱状图36
3.4.3  散点图38
3.4.4  折线图39
3.5  统计分析应用示例41
3.5.1  人口变化总趋势41
3.5.2  人口结构变化42
3.5.3  二胎与生育率43
第4章  多维数据分析45
4.1  多维数据概述45
4.2  多维数据过滤分析46
4.3  相关性分析50
4.3.1  一般性相关性分析50
4.3.2  多维数据可视化相关性分析51
4.4  聚类分析52
4.5  降维分析54
4.5.1  主成分分析54
4.5.2  多维尺度变换56
4.5.3  T分布随机邻域嵌入57
4.6  多维特征提取58
4.6.1 雷达图59
4.6.2  用户画像59
4.6.3  Radviz特征提取60
4.7  多维数据分析应用示例61
4.7.1  郡县特征的关联度61
4.7.2  多维度分析得票率的关键因素63
第5章  时序数据分析65
5.1  时序数据概述65
5.2  多维时序数据呈现――折线67
5.3  多维时序数据呈现――柱状69
5.4  预测分析72
5.4.1  移动平均72
5.4.2  指数平滑73
5.4.3  三次指数平滑74
5.5  周期性检测75
5.6  时序分析应用示例77
5.6.1  美国各州新冠病毒肺炎确诊病例数的动态变化77
5.6.2  美国纽约州、加州疫情发展变化79
5.6.3  美国疫情总体态势80
5.6.4  美国疫情预测81
第6章  地理数据分析83
6.1  地理热度分析83
6.2  地理空间分析86
6.3  连接地图87
6.4  地理分析应用示例88
6.4.1  美国疫情确诊情况88
6.4.2  美国疫情死亡情况90
6.4.3  美国疫情传播分析91
6.4.4  宅在家里还是出门旅行93
第7章  图数据分析95
7.1  图数据概述95
7.2  树图96
7.3  图数据的量化可视化分析98
7.3.1  矩形树图98
7.3.2  旭日图98
7.4  图数据嵌套关系分析99
7.4.1  矩形堆积图99
7.4.2  圆堆积图100
7.5  图数据中的关联数据101
7.5.1  弧线图101
7.5.2  极坐标弧线图101
7.5.3  弦图102
7.5.4  冲积图103
7.6  力导向布局分析104
7.6.1  力导向设计思路104
7.6.2  力导向布局优点104
7.6.3  力导向布局缺点105
7.7  搜索算法105
7.7.1  广度优先搜索算法106
7.7.2  深度优先搜索算法108
7.8  最短路径算法109
7.9  图分析应用示例109
7.9.1  美国人口普查分区110
7.9.2  美国新冠病毒肺炎确诊病例按人口普查分区分布110
第8章  文本数据分析115
8.1  文本数据概述115
8.2  文本向量化116
8.2.1  词袋模型116
8.2.2  Word2Vec模型116
8.3  分词118
8.4  关键词提取120
8.5  知识图谱121
8.6  其他文本处理技术简介122
8.7  文本分析应用示例124
8.7.1  特朗普和拜登社交媒体回复――舆情分析124
8.7.2  特朗普和拜登在社交媒体上的宣传策略125
8.7.3  小结127
第9章  多媒体数据分析129
9.1  数字图像处理129
9.1.1  亮度调整130
9.1.2  直方图均衡化132
9.1.3  高斯平滑133
9.1.4  边缘检测135
9.2  数字音频处理135
9.3  数字视频处理137
9.4  多媒体分析应用示例137
第10章  综合应用示例:中国社会发展调研139
10.1  经济总体指标分析139
10.2  城镇化发展分析142
10.3  国际影响力分析145
10.4  科技发展分析147
10.5  教育发展分析149
10.6  文化发展分析151
10.7  医疗卫生发展分析153
10.8  环境治理状况分析154
10.9  居民收入变化分析156
参考资料

内容摘要
本书包含10章,分为:第1章,阐述数据分析的基础理论;第2章,介绍数据清洗和数据获取的知识和方法;第3章至第9章,覆盖了基础统计分析、多维数据分析、时序数据分析、地理数据分析、图数据分析、文本数据分析和多媒体数据分析,包括每种分析方法的基础定义、分析方法和工具使用到具体领域的可视化实用案例;第10章,以中国社会发展数据演示分析方法的使用。书中提到的基础理论知识都有配套的在线实践工具,能够让用户在学习基础理论知识之后和实践进行连接,真正达到学以致用的效果。通过实践工具,用户可以实现独自完成数据可视化分析案例的产出。本书采用了可视化辅助分析的办法,通俗易懂,不拘泥于数学公式。 本书不仅可作为数据分析初学者的入门手册,也可作为数据分析学者进行数据研究和案例分析的参考指南。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP