• 数据科学技术与应用——基于Python实现(第2版)
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

数据科学技术与应用——基于Python实现(第2版)

18 4.6折 39 八五品

仅1件

上海浦东
认证卖家担保交易快速发货售后保障

作者宋晖

出版社电子工业出版社

出版时间2021-07

版次1

装帧其他

货号9787121415159

上书时间2024-08-23

朝花夕拾二手书店

六年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:八五品
图书标准信息
  • 作者 宋晖
  • 出版社 电子工业出版社
  • 出版时间 2021-07
  • 版次 1
  • ISBN 9787121415159
  • 定价 39.00元
  • 装帧 其他
  • 开本 16开
  • 纸张 胶版纸
  • 页数 196页
  • 字数 313.000千字
【内容简介】


本书内容涵盖数据科学和大数据技术的基础知识,围绕数据科学的工作流程,详细介绍了从数据中获取知识的方法和技术,包括数据采集、数据整理与探索、数据可视化和数据建模预测等。本书介绍了人工智能前沿领域中文本、图像、语音、序列数据的主流分析处理方法,同时也阐述了基于大数据分布式计算框架处理海量数据的台和工具。全书设计收集了多个数据应用案例,采用python语言及相关科学计算工具包实现数据分析过程,帮助读者通过实际案例培养数据思维,掌握数据分析的实践技能,运用统计学、人工智能等优选技术解决实际问题。本书通俗易懂、实例丰富、技术优选,配备丰富的资源,可作为各类高等院校数据科学、大数据技术的入门教材,以及计算机基础较高层次课程的教材,也可以作为数据科学实践的技术参书。

【作者简介】


宋晖博士、教授,长期从事web数据挖掘、机器学和智能信息处理方面的研究和工作,主持完成多项数据挖掘、智能分析和信息系统的研发,在数据科学方向有深厚的理论基础以及丰富的实践经验。
【目录】


章数据科学基础(1)

1.1数据科学概述(1)

1.1.1数据的力量(1)

1.1.2数据科学的知识结构(2)

1.1.3数据科学的工作流程(4)

1.2数据科学的关键技术(5)

1.2.1数据采集(5)

1.2.2数据预处理(7)

1.2.3数据存储与管理(8)

1.2.4数据分析(9)

1.3python数据分析工具(9)

1.3.1科学计算集成环境(9)

1.3.2python编译环境(10)

1.3.3jupyternotebook(11)

1.4python语言基础(12)

1.4.1常用数据类型(12)

1.4.2流程控制(14)

1.4.3函数和方法库(16)

综合练题(17)

第2章多维数据结构与运算(18)

2.1多维数组对象(18)

2.1.1多维数组(张量)(18)

2.1.2一维数组对象(19)

2.1.3二维数组对象(21)

2.1.4创建多维数组的常用函数(23)

2.2多维数组运算(25)

2.2.1基本算术运算(26)

2.2.2函数和矩阵运算(27)

2.2.3数组生成函数(29)

2.3案例:游走轨迹模拟(30)

综合练题(33)

第3章数据汇与统计(34)

3.1统计的基本概念(34)

3.1.1统计的含义(34)

3.1.2常用统计量(35)

3.2pandas数据结构(37)

3.2.1series对象(37)

3.2.2series对象的数据访问(38)

3.2.3dataframe对象(40)

3.2.4dataframe对象的数据访问(41)

3.3数据文件的读/写(45)

3.3.1读/写csv文件和txt文件(45)

3.3.2读取excel文件(48)

3.4数据清洗(49)

3.4.1缺失数据处理(49)

3.4.2去除重复数据(52)

3.5数据规整化(52)

3.5.1数据合并(52)

3.5.2数据排序(55)

3.6统计分析(56)

3.6.1通用函数与运算(57)

3.6.2统计函数(57)

3.6.3相关分析(60)

3.6.4案例:问卷调查反馈表分析(60)

综合练题(63)

第4章数据可视化(64)

4.1python绘图基础(64)

4.1.1认识基本图形(64)

4.1.2pandas快速绘图(64)

4.1.3matplotlib精细绘图(66)

4.2可视化数据探索(71)

4.2.1绘制常用图形(71)

4.2.2使用pyecharts绘制交互数据图(81)

综合练题(85)

第5章机器学建模分析(88)

5.1机器学概述(88)

5.1.1机器学与人工智能(88)

5.1.2python机器学方法库(90)

5.2回归分析(90)

5.2.1回归分析(90)

5.2.2回归分析实现(91)

5.2.3回归分析能评估(94)

5.3分类分析(96)

5.3.1分类学(96)

5.3.2决策树(98)

5.3.3支持向量机(102)

5.4聚类分析(106)

5.4.1聚类任务(106)

5.4.2k-means算法(107)

5.4.3聚类方法的能评估(110)

5.5数据降维(112)

5.5.1降维分析方法(112)

5.5.2主成分分析(113)

5.6集成学(115)

5.6.1森林算法的基本(116)

5.6.2梯度提升机算法的基本(116)

5.6.3集成学建模分析(117)

综合练题(119)

第6章神经网络与深度学建模分析(120)

6.1神经网络概述(120)

6.1.1神经元与感知器(120)

6.1.2神经网络模型(121)

6.1.3神经网络分类实现(122)

6.2深度学(125)

6.2.1深度学的基本(125)

6.2.2深度学框架keras(126)

6.2.3深度学建模分析实例(128)

综合练题(130)

第7章文本数据处理(131)

7.1文本处理概述(131)

7.1.1文本处理的常见任务(131)

7.1.2文本处理的基本步骤(132)

7.2中文文本处理(134)

7.2.1中文分词(134)

7.2.2词标注(135)

7.2.3特征提取(136)

7.3实例:垃圾邮件的识别(140)

7.3.1数据来源(140)

7.3.2基于词袋模型识别垃圾邮件(141)

7.3.3基于词向量模型识别垃圾邮件(143)

综合练题(146)

第8章图像数据处理(147)

8.1数字图像概述(147)

8.1.1数字图像(147)

8.1.2数字图像类型(147)

8.1.3数字图像处理(148)

8.2python图像处理(149)

8.2.1python图像处理库(149)

8.2.2图像的基本作(150)

8.3案例:深度学实现图像分类(152)

8.3.1卷积神经网络(152)

8.3.2基于keras实现图像分类(153)

综合练题(157)

第9章时序数据与语音处理(158)

9.1时序数据概述(158)

9.1.1时序数据特(158)

9.1.2时序数据特征的提取(159)

9.2时序数据分析方法(161)

9.2.1时序数据分析过程(161)

9.2.2温度预测实例(162)

9.3语音识别技术(166)

9.3.1语音识别技术简介(166)

9.3.2语音识别中的时序数据处理(167)

9.3.3在线语音识别实例(169)

综合练题(171)

0章大数据技术(172)

10.1大数据概述(172)

10.1.1大数据的特点(172)

10.1.2大数据技术(174)

10.1.3大数据基础设施(175)

10.2分布式计算框架(177)

10.2.1hadoop概述(178)

10.2.2mapreduce分布式计算(180)

10.2.3spark分布式计算(182)

10.2.4spark分布式计算(183)

10.3分布式建模分析工具(185)

10.3.1hadoopmahout(185)

10.3.2sparkmllib(186)

10.3.3sparkmllib建模分析(187)

综合练题(188)

参资料(189)

点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP