数据科学技术与应用——基于Python实现(第2版)
¥
18
4.6折
¥
39
八五品
仅1件
作者宋晖
出版社电子工业出版社
出版时间2021-07
版次1
装帧其他
货号9787121415159
上书时间2024-08-23
商品详情
- 品相描述:八五品
图书标准信息
-
作者
宋晖
-
出版社
电子工业出版社
-
出版时间
2021-07
-
版次
1
-
ISBN
9787121415159
-
定价
39.00元
-
装帧
其他
-
开本
16开
-
纸张
胶版纸
-
页数
196页
-
字数
313.000千字
- 【内容简介】
-
本书内容涵盖数据科学和大数据技术的基础知识,围绕数据科学的工作流程,详细介绍了从数据中获取知识的方法和技术,包括数据采集、数据整理与探索、数据可视化和数据建模预测等。本书介绍了人工智能前沿领域中文本、图像、语音、序列数据的主流分析处理方法,同时也阐述了基于大数据分布式计算框架处理海量数据的台和工具。全书设计收集了多个数据应用案例,采用python语言及相关科学计算工具包实现数据分析过程,帮助读者通过实际案例培养数据思维,掌握数据分析的实践技能,运用统计学、人工智能等优选技术解决实际问题。本书通俗易懂、实例丰富、技术优选,配备丰富的资源,可作为各类高等院校数据科学、大数据技术的入门教材,以及计算机基础较高层次课程的教材,也可以作为数据科学实践的技术参书。
- 【作者简介】
-
宋晖博士、教授,长期从事web数据挖掘、机器学和智能信息处理方面的研究和工作,主持完成多项数据挖掘、智能分析和信息系统的研发,在数据科学方向有深厚的理论基础以及丰富的实践经验。
- 【目录】
-
章数据科学基础(1)
1.1数据科学概述(1)
1.1.1数据的力量(1)
1.1.2数据科学的知识结构(2)
1.1.3数据科学的工作流程(4)
1.2数据科学的关键技术(5)
1.2.1数据采集(5)
1.2.2数据预处理(7)
1.2.3数据存储与管理(8)
1.2.4数据分析(9)
1.3python数据分析工具(9)
1.3.1科学计算集成环境(9)
1.3.2python编译环境(10)
1.3.3jupyternotebook(11)
1.4python语言基础(12)
1.4.1常用数据类型(12)
1.4.2流程控制(14)
1.4.3函数和方法库(16)
综合练题(17)
第2章多维数据结构与运算(18)
2.1多维数组对象(18)
2.1.1多维数组(张量)(18)
2.1.2一维数组对象(19)
2.1.3二维数组对象(21)
2.1.4创建多维数组的常用函数(23)
2.2多维数组运算(25)
2.2.1基本算术运算(26)
2.2.2函数和矩阵运算(27)
2.2.3数组生成函数(29)
2.3案例:游走轨迹模拟(30)
综合练题(33)
第3章数据汇与统计(34)
3.1统计的基本概念(34)
3.1.1统计的含义(34)
3.1.2常用统计量(35)
3.2pandas数据结构(37)
3.2.1series对象(37)
3.2.2series对象的数据访问(38)
3.2.3dataframe对象(40)
3.2.4dataframe对象的数据访问(41)
3.3数据文件的读/写(45)
3.3.1读/写csv文件和txt文件(45)
3.3.2读取excel文件(48)
3.4数据清洗(49)
3.4.1缺失数据处理(49)
3.4.2去除重复数据(52)
3.5数据规整化(52)
3.5.1数据合并(52)
3.5.2数据排序(55)
3.6统计分析(56)
3.6.1通用函数与运算(57)
3.6.2统计函数(57)
3.6.3相关分析(60)
3.6.4案例:问卷调查反馈表分析(60)
综合练题(63)
第4章数据可视化(64)
4.1python绘图基础(64)
4.1.1认识基本图形(64)
4.1.2pandas快速绘图(64)
4.1.3matplotlib精细绘图(66)
4.2可视化数据探索(71)
4.2.1绘制常用图形(71)
4.2.2使用pyecharts绘制交互数据图(81)
综合练题(85)
第5章机器学建模分析(88)
5.1机器学概述(88)
5.1.1机器学与人工智能(88)
5.1.2python机器学方法库(90)
5.2回归分析(90)
5.2.1回归分析(90)
5.2.2回归分析实现(91)
5.2.3回归分析能评估(94)
5.3分类分析(96)
5.3.1分类学(96)
5.3.2决策树(98)
5.3.3支持向量机(102)
5.4聚类分析(106)
5.4.1聚类任务(106)
5.4.2k-means算法(107)
5.4.3聚类方法的能评估(110)
5.5数据降维(112)
5.5.1降维分析方法(112)
5.5.2主成分分析(113)
5.6集成学(115)
5.6.1森林算法的基本(116)
5.6.2梯度提升机算法的基本(116)
5.6.3集成学建模分析(117)
综合练题(119)
第6章神经网络与深度学建模分析(120)
6.1神经网络概述(120)
6.1.1神经元与感知器(120)
6.1.2神经网络模型(121)
6.1.3神经网络分类实现(122)
6.2深度学(125)
6.2.1深度学的基本(125)
6.2.2深度学框架keras(126)
6.2.3深度学建模分析实例(128)
综合练题(130)
第7章文本数据处理(131)
7.1文本处理概述(131)
7.1.1文本处理的常见任务(131)
7.1.2文本处理的基本步骤(132)
7.2中文文本处理(134)
7.2.1中文分词(134)
7.2.2词标注(135)
7.2.3特征提取(136)
7.3实例:垃圾邮件的识别(140)
7.3.1数据来源(140)
7.3.2基于词袋模型识别垃圾邮件(141)
7.3.3基于词向量模型识别垃圾邮件(143)
综合练题(146)
第8章图像数据处理(147)
8.1数字图像概述(147)
8.1.1数字图像(147)
8.1.2数字图像类型(147)
8.1.3数字图像处理(148)
8.2python图像处理(149)
8.2.1python图像处理库(149)
8.2.2图像的基本作(150)
8.3案例:深度学实现图像分类(152)
8.3.1卷积神经网络(152)
8.3.2基于keras实现图像分类(153)
综合练题(157)
第9章时序数据与语音处理(158)
9.1时序数据概述(158)
9.1.1时序数据特(158)
9.1.2时序数据特征的提取(159)
9.2时序数据分析方法(161)
9.2.1时序数据分析过程(161)
9.2.2温度预测实例(162)
9.3语音识别技术(166)
9.3.1语音识别技术简介(166)
9.3.2语音识别中的时序数据处理(167)
9.3.3在线语音识别实例(169)
综合练题(171)
0章大数据技术(172)
10.1大数据概述(172)
10.1.1大数据的特点(172)
10.1.2大数据技术(174)
10.1.3大数据基础设施(175)
10.2分布式计算框架(177)
10.2.1hadoop概述(178)
10.2.2mapreduce分布式计算(180)
10.2.3spark分布式计算(182)
10.2.4spark分布式计算(183)
10.3分布式建模分析工具(185)
10.3.1hadoopmahout(185)
10.3.2sparkmllib(186)
10.3.3sparkmllib建模分析(187)
综合练题(188)
参资料(189)
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价