数据科学技术与应用――基于Python实现(第2版) 9787121415159
正版图书,可开发票,请放心购买。
¥
30.39
7.8折
¥
39
全新
库存6件
作者宋晖
出版社电子工业出版社
ISBN9787121415159
出版时间2021-07
装帧平装
开本16开
定价39元
货号29287327
上书时间2024-12-01
商品详情
- 品相描述:全新
- 商品描述
-
导语摘要
本书内容涵盖数据科学和大数据技术的基础知识,围绕数据科学的工作流程,详细介绍了从数据中获取知识的方法和技术,包括数据采集、数据整理与探索、数据可视化和数据建模预测等。本书介绍了人工智能前沿领域中文本、图像、语音、序列数据的主流分析处理方法,同时也阐述了基于大数据分布式计算框架处理海量数据的平台和工具。全书设计收集了多个数据应用案例,采用Python语言及相关科学计算工具包实现数据分析过程,帮助读者通过实际案例培养数据思维,掌握数据分析的实践技能,运用统计学、人工智能等先进技术解决实际问题。 本书通俗易懂、实例丰富、技术先进,配备丰富的教学资源,可作为各类高等院校数据科学、大数据技术的入门教材,以及计算机基础教学较高层次课程的教材,也可以作为数据科学实践的技术参考书。
作者简介
宋晖博士、教授,长期从事Web数据挖掘、机器学习和智能信息处理方面的研究和教学工作,主持完成多项数据挖掘、智能分析和信息系统的研发,在数据科学方向有深厚的理论基础以及丰富的实践经验。
目录
章数据科学基础(1)
1.1数据科学概述(1)
1.1.1数据的力量(1)
1.1.2数据科学的知识结构(2)
1.1.3数据科学的工作流程(4)
1.2数据科学的关键技术(5)
1.2.1数据采集(5)
1.2.2数据预处理(7)
1.2.3数据存储与管理(8)
1.2.4数据分析(9)
1.3Python数据分析工具(9)
1.3.1科学计算集成环境(9)
1.3.2Python编译环境(10)
1.3.3JupyterNotebook(11)
1.4Python语言基础(12)
1.4.1常用数据类型(12)
1.4.2流程控制(14)
1.4.3函数和方法库(16)
综合练习题(17)
第2章多维数据结构与运算(18)
2.1多维数组对象(18)
2.1.1多维数组(张量)(18)
2.1.2一维数组对象(19)
2.1.3二维数组对象(21)
2.1.4创建多维数组的常用函数(23)
2.2多维数组运算(25)
2.2.1基本算术运算(26)
2.2.2函数和矩阵运算(27)
2.2.3随机数组生成函数(29)
2.3案例:随机游走轨迹模拟(30)
综合练习题(33)
第3章数据汇总与统计(34)
3.1统计的基本概念(34)
3.1.1统计的含义(34)
3.1.2常用统计量(35)
3.2pandas数据结构(37)
3.2.1Series对象(37)
3.2.2Series对象的数据访问(38)
3.2.3DataFrame对象(40)
3.2.4DataFrame对象的数据访问(41)
3.3数据文件的读/写(45)
3.3.1读/写CSV文件和TXT文件(45)
3.3.2读取Excel文件(48)
3.4数据清洗(49)
3.4.1缺失数据处理(49)
3.4.2去除重复数据(52)
3.5数据规整化(52)
3.5.1数据合并(52)
3.5.2数据排序(55)
3.6统计分析(56)
3.6.1通用函数与运算(57)
3.6.2统计函数(57)
3.6.3相关性分析(60)
3.6.4案例:问卷调查反馈表分析(60)
综合练习题(63)
第4章数据可视化(64)
4.1Python绘图基础(64)
4.1.1认识基本图形(64)
4.1.2pandas快速绘图(64)
4.1.3Matplotlib精细绘图(66)
4.2可视化数据探索(71)
4.2.1绘制常用图形(71)
4.2.2使用pyecharts绘制交互数据图(81)
综合练习题(85)
第5章机器学习建模分析(88)
5.1机器学习概述(88)
5.1.1机器学习与人工智能(88)
5.1.2Python机器学习方法库(90)
5.2回归分析(90)
5.2.1回归分析原理(90)
5.2.2回归分析实现(91)
5.2.3回归分析性能评估(94)
5.3分类分析(96)
5.3.1分类学习原理(96)
5.3.2决策树(98)
5.3.3支持向量机(102)
5.4聚类分析(106)
5.4.1聚类任务(106)
5.4.2K-means算法(107)
5.4.3聚类方法的性能评估(110)
5.5数据降维(112)
5.5.1降维分析方法(112)
5.5.2主成分分析(113)
5.6集成学习(115)
5.6.1随机森林算法的基本原理(116)
5.6.2梯度提升机算法的基本原理(116)
5.6.3集成学习建模分析(117)
综合练习题(119)
第6章神经网络与深度学习建模分析(120)
6.1神经网络概述(120)
6.1.1神经元与感知器(120)
6.1.2神经网络模型(121)
6.1.3神经网络分类实现(122)
6.2深度学习(125)
6.2.1深度学习的基本原理(125)
6.2.2深度学习框架Keras(126)
6.2.3深度学习建模分析实例(128)
综合练习题(130)
第7章文本数据处理(131)
7.1文本处理概述(131)
7.1.1文本处理的常见任务(131)
7.1.2文本处理的基本步骤(132)
7.2中文文本处理(134)
7.2.1中文分词(134)
7.2.2词性标注(135)
7.2.3特征提取(136)
7.3实例:垃圾邮件的识别(140)
7.3.1数据来源(140)
7.3.2基于词袋模型识别垃圾邮件(141)
7.3.3基于词向量模型识别垃圾邮件(143)
综合练习题(146)
第8章图像数据处理(147)
8.1数字图像概述(147)
8.1.1数字图像(147)
8.1.2数字图像类型(147)
8.1.3数字图像处理(148)
8.2Python图像处理(149)
8.2.1Python图像处理库(149)
8.2.2图像的基本操作(150)
8.3案例:深度学习实现图像分类(152)
8.3.1卷积神经网络(152)
8.3.2基于Keras实现图像分类(153)
综合练习题(157)
第9章时序数据与语音处理(158)
9.1时序数据概述(158)
9.1.1时序数据特性(158)
9.1.2时序数据特征的提取(159)
9.2时序数据分析方法(161)
9.2.1时序数据分析过程(161)
9.2.2温度预测实例(162)
9.3语音识别技术(166)
9.3.1语音识别技术简介(166)
9.3.2语音识别中的时序数据处理(167)
9.3.3在线语音识别实例(169)
综合练习题(171)
0章大数据技术(172)
10.1大数据概述(172)
10.1.1大数据的特点(172)
10.1.2大数据技术(174)
10.1.3大数据基础设施(175)
10.2分布式计算框架(177)
10.2.1Hadoop概述(178)
10.2.2MapReduce分布式计算(180)
10.2.3Spark分布式计算(182)
10.2.4Spark分布式计算(183)
10.3分布式建模分析工具(185)
10.3.1HadoopMahout(185)
10.3.2SparkMLlib(186)
10.3.3SparkMLlib建模分析(187)
综合练习题(188)
参考资料(189)
内容摘要
本书内容涵盖数据科学和大数据技术的基础知识,围绕数据科学的工作流程,详细介绍了从数据中获取知识的方法和技术,包括数据采集、数据整理与探索、数据可视化和数据建模预测等。本书介绍了人工智能前沿领域中文本、图像、语音、序列数据的主流分析处理方法,同时也阐述了基于大数据分布式计算框架处理海量数据的平台和工具。全书设计收集了多个数据应用案例,采用Python语言及相关科学计算工具包实现数据分析过程,帮助读者通过实际案例培养数据思维,掌握数据分析的实践技能,运用统计学、人工智能等优选技术解决实际问题。本书通俗易懂、实例丰富、技术优选,配备丰富的教学资源,可作为各类高等院校数据科学、大数据技术的入门教材,以及计算机基础教学较高层次课程的教材,也可以作为数据科学实践的技术参考书。
主编推荐
宋晖博士、教授,长期从事Web数据挖掘、机器学习和智能信息处理方面的研究和教学工作,主持完成多项数据挖掘、智能分析和信息系统的研发,在数据科学方向有深厚的理论基础以及丰富的实践经验。
— 没有更多了 —
以下为对购买帮助不大的评价