• 【假一罚四】数据科学概论――从概念到应用薛薇
  • 【假一罚四】数据科学概论――从概念到应用薛薇
21年品牌 40万+商家 超1.5亿件商品

【假一罚四】数据科学概论――从概念到应用薛薇

集团直发,全新正版书籍,假一罚四,放心选购。24小时内发货。可开发票

62.5 7.9折 79 全新

库存3件

浙江嘉兴
认证卖家担保交易快速发货售后保障

作者薛薇

出版社电子工业

ISBN9787121441332

出版时间2022-08

装帧平装

开本其他

定价79元

货号31539518

上书时间2024-06-17

朗朗图书书店

已实名 已认证 进店 收藏店铺
  • 店主推荐
  • 最新上架

   商品详情   

品相描述:全新
商品描述
商品简介

本书引导读者从数据科学基本概念出发,全面了解数据科学相关知识,掌握数据科学中数据处理的流程和方法。本书在理论上突出可读性和完整性,力求兼具一定的广度和深度;在实践上强调对常用技术工具的操作性,力求体现数据科学应用的多样性和代表性。全书共12章,可分为三大部分:第1、2章是数据科学概述部分;第3~6章是数据科学理论基础和重点工具部分;第7~12章是数据科学全流程的技术与方法部分(包括数据采集、数据存储与管理、数据可视化、数据分析、数据安全与伦理,以及数据科学的应用与案例)。登录华信教育资源网(www.hxedu.com.cn)可下载本书涉及的案例与示例的全部代码和数据集,以及各章PPT和教学大纲等资料。本书可作为高等院校数据科学相关专业的教学用书,也可作为数据科学相关研究从业人员的参考用书。



作者简介
薛薇,工学硕士,经济学博士,中国人民大学应用统计学科研究中心研究员,中国人民大学统计学院副教授。主要研究领域:机器学习和文本挖掘、复杂网络建模等。关注统计和数据挖掘算法及软件应用。涉足企业客户终身价值测算,基于文本挖掘的热点事件主题提取和分类,金融、贸易等复杂网络动态建模等方面。主要代表性教材:《SPSS统计分析方法及应用》《R语言数据挖掘方法及应用》《R语言:大数据分析中的统计方法及应用》《SPSSModeler数据挖掘方法及应用》《数据科学概论――从概念到应用》等。

目录
目录
  第1章  数据与信息概述1
1.1  数据的概念、特征和作用1
1.1.1  数据的概念1
1.1.2  数据的特征2
1.1.3  数据的作用3
1.2  数据的尺度与类型3
1.2.1  定性数据和定量数据4
1.2.2  离散数据和连续数据5
1.2.3  结构化数据和非结构化数据5
1.3  数据的表格化8
1.3.1  个体数据的表格化8
1.3.2  批量汇总数据的表格化9
1.3.3  统计指标11
1.4  数据的数字化12
1.4.1  二进制与数字化12
1.4.2  文本的数字化13
1.4.3  数字的数字化15
1.4.4  多媒体的数字化17
1.4.5  数字化转型与数字化经济18
1.5  信息与信息熵19
1.5.1  信息熵:不确定性的度量19
1.5.2  信息增益:不确定性减少的度量20
  第2章  数据科学概述22
2.1  数据科学的科学观22
2.1.1  从科学高度看数据科学22
2.1.2  通过案例初识数据科学23
2.2  数据科学概念25
2.2.1  数据科学产生的重大技术背景25
2.2.2  数据科学产生的典型应用背景25
2.2.3  数据科学的定义27
2.3  历史观察:探讨数据科学的发展历程27
2.3.1  古代:从结绳记事到阿拉伯数字27
2.3.2  古典:政治算术和国势学29
2.3.3  近代:随机现象、概率论与数理统计29
2.3.4  现代:抽样与推断统计31
2.3.5  计算机时代:技术革命带来的繁荣32
2.3.6  大数据时代:奠定数据科学基础33
2.4  数据世界:探讨数据科学的对象37
2.4.1  数据世界和数据科学37
2.4.2  数据世界和数字孪生38
2.5  DIKW模型:探讨数据科学中的若干基本概念39
2.5.1  DIKW模型39
2.5.2  从DIKW模型看数据科学41
2.6  维恩图:探讨数据科学的学科交叉性42
2.6.1  文献中的数据科学维恩图42
2.6.2  数据科学学科交叉性的总结43
2.7  从数据到模型:探讨数据科学的一般方法45
2.7.1  反问题的方法45
2.7.2  数据驱动的方法46
2.7.3  模型化的方法47
2.8  数据处理流程:探讨数据科学方法论53
2.8.1  传统理念下的数据处理方法论53
2.8.2  计算机时代的数据处理方法论54
2.8.3  大数据时代的数据处理方法论56
2.9  三维视角:总览数据科学58
2.9.1  从三维视角看数据科学58
2.9.2  理论方法维度58
2.9.3  处理流程维度60
2.9.4  应用领域维度60
  第3章  数据科学中的计算机基础61
3.1  计算机系统概述61
3.1.1  计算机的发展62
3.1.2  计算机的种类62
3.2  计算机硬件63
3.2.1  计算机硬件的组成63
3.2.2  计算机硬件的工作原理64
3.3  计算机软件65
3.3.1  操作系统65
3.3.2  计算机语言66
3.3.3  应用软件68
3.4  计算机网络68
3.4.1  局域网、广域网和因特网69
3.4.2  计算机网络的通信协议71
3.5  计算机应用的技术模式72
3.5.1  主机/终端模式72
3.5.2  客户机/服务器模式73
3.5.3  浏览器/服务器模式74
3.5.4  云计算模式75
3.5.5  对等模式78
3.6  计算机应用79
3.6.1  科学计算79
3.6.2  数据处理与大数据80
3.6.3  人工智能81
3.6.4  过程控制85
  第4章  数据科学中的数学与统计学基础86
4.1  微积分与数据科学应用87
4.1.1  微积分的产生背景87
4.1.2  微积分的基本思想方法88
4.1.3  梯度下降法及数据科学应用示例90
4.2  线性代数与数据科学应用93
4.2.1  向量与向量空间及应用示例93
4.2.2  矩阵与线性变换及应用示例95
4.2.3  特征值与奇异值及数据科学应用示例99
4.3  统计学与数据科学应用103
4.3.1  描述统计要点104
4.3.2  概率与概率分布要点107
4.3.3  推断统计和多元统计分析要点108
4.3.4  贝叶斯思维在数据科学中的应用109
4.4  集合论与数据科学的应用113
4.4.1  集合论与罗素悖论113
4.4.2  粗糙集与数据科学应用示例115
4.5  图论与数据科学的应用120
4.5.1  欧拉和哥尼斯堡七桥问题120
4.5.2  图论的发展沿革121
4.5.3  图论与数据科学应用示例122
  第5章  数据科学中的SQL基础125
5.1  SQL概述125
5.1.1  SQL的优点125
5.1.2  MySQL和SQL入门127
5.2  SQL的数据定义和应用130
5.2.1  SQL数据定义语句131
5.2.2  SQL数据定义应用133
5.3  SQL的数据操纵和应用137
5.3.1  SQL数据操纵语句137
5.3.2  SQL数据操纵应用137
5.4  SQL的数据查询139
5.4.1  SELECT语句的简单应用139
5.4.2  SELECT语句的进阶应用145
5.4.3  SELECT语句的其他应用150
5.5  MySQL的系统管理151
5.5.1  MySQL的用户管理151
5.5.2  MySQL的权限管理152
5.5.3  MySQL的事务管理153
5.5.4  MySQL的文件存储和日志管理155
5.5.5  MySQL的客户端数据库管理工具Navicat158
  第6章  数据科学中的Python基础160
6.1  Python概述160
6.1.1  Python的特点160
6.1.2  Python的安装和启动161
6.1.3  第一个Python程序与帮助162
6.2  Python基础164
6.2.1  Python的基本数据类型和组织164
6.2.2  Python的程序结构和流程控制169
6.2.3  异常处理结构173
6.3  Python语言进阶176
6.3.1  面向对象程序设计176
6.3.2  模块与包177
6.3.3  Python综合:chaos混沌态178
6.4  NumPy入门181
6.4.1  NumPy数组的创建182
6.4.2  NumPy数组的访问185
6.4.3  NumPy数组的计算186
6.5  Pandas入门190
6.5.1  Pandas的数据组织191
6.5.2  Pandas的数据加工处理194
6.6  Matplotlib入门196
6.6.1  Matplotlib的基本绘图196
6.6.2  Matplotlib的参数配置198
6.6.3  Matplotlib的子图设置200
6.6.4  Matplotlib的常见统计图201
6.7  Python综合应用示例:对空气质量监测数据的分析206
6.7.1  空气质量数据的预处理207
6.7.2  空气质量数据的基本分析209
6.7.3  空气质量数据的可视化212
  第7章  数据采集217
7.1  传统数据采集方式和技术218
7.1.1  普查和统计报表制度218
7.1.2  抽样调查和问卷调查220
7.1.3  观察法和实验法221
7.1.4  传统数据采集技术224
7.2  互联网数据采集226
7.2.1  互联网数据采集概述227
7.2.2  网站运营数据库和数据分析及采集227
7.2.3  网页埋点和数据采集229
7.2.4  开放数据库和数据采集231
7.2.5  搜索引擎和数据采集233
7.2.6  网页爬虫和数据采集236
7.3  物联网数据采集240
7.3.1  物联网数据采集概述240
7.3.2  传感器和数据采集241
7.3.3  卫星通信和数据采集242
7.3.4  射频识别技术、条形码和数据采集244
7.4  数据采集与人工智能245
7.4.1  数据标注与数据采集246
7.4.2  文本数据采集和挖掘248
7.4.3  图像数据采集和识别249
  第8章  数据存储与管理251
8.1  数据文件和数据库系统251
8.1.1  数据文件251
8.1.2  数据库系统的概念254
8.1.3  关系型数据库系统和联机事务处理255
8.1.4  数据库索引技术257
8.2  数据仓库系统260
8.2.1  数据仓库的概念260
8.2.2  数据仓库系统的基本结构261
8.2.3  联机分析处理264
8.2.4  知识发现与商业智能266
8.3  数据库系统的技术发展268
8.3.1  并行数据库技术269
8.3.2  分布式数据库技术271
8.3.3  NoSQL数据库系统和NewSQL数据库系统272
8.4  Hadoop大数据系统275
8.4.1  什么是Hadoop275
8.4.2  HDFS276
8.4.3  MapReduce计算框架279
8.4.4  Hadoop大数据生态系统280
8.5  Spark大数据系统286
8.5.1  什么是Spark287
8.5.2  Spark大数据生态系统288
8.5.3  Spark大数据平台databricks应用290
8.6  Flink大数据系统294
8.6.1  流数据294
8.6.2  Flink大数据生态系统297
8.7  数据湖系统300
8.7.1  什么是数据湖系统300
8.7.2  数据湖系统的基本功能301
8.7.3  典型的数据湖系统302
  第9章  数据可视化305
9.1  数据可视化概述305
9.1.1  数据可视化起源和发展305
9.1.2  数据可视化元素307
9.1.3  数据可视化步骤和原则308
9.2  数据可视化一般方法309
9.2.1  电子地图及地图图表309
9.2.2  高维数据的可视化展现312
9.3  数据可视化实现和Tableau应用315
9.3.1  数据可视化实现方式316
9.3.2  Tableau及其应用317
9.4  数据可视化的新发展325
9.4.1  计算机图形学326
9.4.2  虚拟现实及相关技术327
9.4.3  增强现实技术329
  第10章  数据分析332
10.1  数据分析方法、目标及软件工具332
10.1.1  数据分析方法332
10.1.2  数据分析目标337
10.1.3  数据分析软件工具:sklearn简介338
10.2  数据预处理340
10.2.1  数据标准化处理340
10.2.2  缺失值处理342
10.2.3  特征选择与特征提取344
10.3  经典聚类算法347
10.3.1  聚类分析概述347
10.3.2  层次聚类349
10.3.3  K-均值聚类351
10.3.4  DBSCAN聚类353
10.3.5  聚类分析应用实例355
10.4  数据预测:经典统计方法360
10.4.1  数据预测中的一般问题360
10.4.2  一般线性回归分析362
10.4.3  二项逻辑回归分析365
10.4.4  数据预测应用实例367
10.5  数据预测:经典机器学习方法370
10.5.1  K-近邻分析370
10.5.2  决策树算法373
10.5.3  支持向量机377
10.5.4  分类算法的对比379
  第11章  数据安全与伦理384
11.1  数据安全概述384
11.1.1  什么是数据安全384
11.1.2  数据安全的分类385
11.2  数据安全体系388
11.2.1  数据安全管理系统388
11.2.2  数据安全法律法规系统389
11.2.3  数据安全技术系统391
11.3  传统数据安全技术393
11.3.1  数据加密393
11.3.2  数据脱敏394
11.4  大数据时代的数据安全技术396
11.4.1  区块链396
11.4.2  联邦学习398
11.5  数据伦理和算法伦理402
11.5.1  数据伦理与案例403
11.5.2  算法伦理与案例405
  第12章  数据科学的应用与案例408
12.1  数据科学的商业应用:RFM分析与客户终身价值408
12.1.1  客户购买行为的RFM分析408
12.1.2  客户终身价值409
12.1.3  客户终身价值的计算和应用案例411
12.1.4  应用启示:理解业务才能做好分析415
12.2  数据科学的海关应用:抽样方案升级416
12.2.1  海关稽查案例417
12.2.2  海关稽查抽样的数据模拟418
12.2.3  应用启示:数据治理体系424
12.3  数据科学的企业应用:数字化转型426
12.3.1  数字化转型概述426
12.3.2  数字化转型案例427
12.3.3  应用启示:数字化转型的评估模型430
  附录A  MySQL函数列表432

内容摘要
本书引导读者从数据科学基本概念出发,全面了解数据科学相关知识,掌握数据科学中数据处理的流程和方法。本书在理论上突出可读性和完整性,力求兼具一定的广度和深度;在实践上强调对常用技术工具的操作性,力求体现数据科学应用的多样性和代表性。全书共12章,可分为三大部分:第1、2章是数据科学概述部分;第3~6章是数据科学理论基础和重点工具部分;第7~12章是数据科学全流程的技术与方法部分(包括数据采集、数据存储与管理、数据可视化、数据分析、数据安全与伦理,以及数据科学的应用与案例)。登录华信教育资源网(www.hxedu.com.cn)可下载本书涉及的案例与示例的全部代码和数据集,以及各章PPT和教学大纲等资料。本书可作为高等院校数据科学相关专业的教学用书,也可作为数据科学相关研究从业人员的参考用书。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP