¥ 19.68 5.3折 ¥ 36.8 全新
库存3件
作者林正炎 张朋 梁克维 庞天晓
出版社高等教育出版社
出版时间2023-12
版次1
装帧其他
货号R4库 12-18
上书时间2024-12-19
第一章引言
1.1什么是大数据/3
1.2数据分析过程/6
1.3专业领域知识/7
1.4数据科学家做什么/8
习题/9
第二章大数据的预处理、云计算和可视化
2.1大数据的数据结构和形式/13
2.2数据清洗/15
2.3云计算和云存储/20
2.4数据可视化/21
习题/24
第三章回归与分类
3.1线性回归/29
3.2线性回归的推广/36
3.3逻辑斯谛回归/44
3.4判别分类/47
3.5k最近邻分类/51
3.6决策树/53
3.7Bagging分类/62
3.8随机森林分类/66
3.9AdaBoost算法分类/67
3.10支持向量机/71
3.11案例分析/81
习题/86
第四章聚类及相关数据分析方法
4.1聚类分析/93
4.2 EM 算法/109
4.3文本分析/117
4.4关联规则和推荐系统/130
习题/137
第五章高维统计中的变量选择
5.1经典降维方法/143
5.2正则化方法/155
5.3自编码器/164
5.4贝叶斯方法在变量选择中的应用/167
习题/172
第六章神经网络与深度学习
6.1人工智能、机器学习和深度学习的关系/177
6.2神经网络/178
6.3深度神经网络/188
6.4卷积神经网络/189
6.5循环神经网络/199
6.6强化学习/207
6.7其他的学习模型/209
习题/213
第七章深度学习在人工智能中的应用
7.1无人驾驶汽车/217
7.2自然语言处理/219
7.3医疗健康/227
7.4图神经网络/229
7.5推荐系统/234
习题/240
参考文献
1.1什么是大数据
大数据的定义众说纷纭,还没有一个统一的说法,通常,大数据指的是所涉及的资料量规模巨大到超出传统数据处理能力,超越经典统计方法研究范围,无法通过目前主流软件工具,在合理的时间内达到攫取、管理、处理并整理成为帮助人们进行决策的资讯.当前它是数据科学中最受人关注的研究对象。
在五花八门的传统学科中,统计学是唯一一门以数据为研究对象的学科,它的起源可以追溯到 18世纪的数学家,如拉普拉斯(1749-1827)和贝叶斯(1702--1761).计算机科学作为一门数值计算的学科,从几十年前诞生起就在改变着我们的生活。
大数据的新颖性并非植根于最新的科学知识,而是源于一个重要的颠覆性的技术演变:数据化,数据化使以前从未量化过的世界得以进入数据时代,从个人层面来看:书籍、电影、购物、出行等,,无不在持续地数据化,当我们在社交网络上与人交流时,我们的思想也在数据化,在商务层面,公司正在把以前丢弃的半结构化数据,如网络活动日志、计算机网络活动记录、机械信号等进行数据化,非结构化数据,如书面报告、电子邮件以及语音记录等,现在不只用于存档,还能通过数据化加以分析利用。
1.1.1大数据概论
数据化并不是大数据革命的唯一要素,另一个因素是数据分析的普遍化,当大数据的概念还没有提出来的时候,这一领域的参与者只有谷歌、雅虎、IBM或 SAS 等大公司在21世纪初,这些公司拥有的庞大的计算资源使它们能够利用分析技术开发和创新产品,对自己的业务做出决策,从而占据优势,如今,这些公司与其他公司(还有个人)之间在分析技术上的差距正在缩小,云计算允许任何个人在短时间内分析大量数据.实现解决方案所需的大多数关键算法不难找到,而且分析技术是免费的,因为开源开发是该领域的标准做法,因此,几乎任何个人或公司都可以使用丰富的数据来做出基于数据的决策。
大数据是信息化发展的新阶段,随着信息技术和人类生活交汇融合,互联网快速普及,全球数据呈现爆发增长、海量数据集聚的特点,对经济发展、社会治理、行政管理、人民生活都产生了重大影响.世界各国都把推进经济数字化作为实现创新发展的重要动能,在前沿技术研发、数据开放共享、隐私安全保护、人才培养等方面做出了前瞻性的布局。
……
本书包括引言、大数据的预处理、云计算和可视化、回归与分类、聚类及相关数据分析方法、高维统计中的变量选择、神经网络与深度学习、深度学习在人工智能中的应用七章,主要介绍大数据技术的基本原理和方法,特别是以统计模型为主的各类数据模型以及它们的计算方法,也会提及这些方法在某些领域(如人工智能)中的应用。
— 没有更多了 —
以下为对购买帮助不大的评价