• Julia数据科学应用
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

Julia数据科学应用

38.61 5.6折 69 全新

仅1件

山东泰安
认证卖家担保交易快速发货售后保障

作者[美]扎卡赖亚斯·弗格里斯(Zacharias Voulgaris)

出版社人民邮电出版社

出版时间2018-02

版次1

装帧其他

货号R4库 12-18

上书时间2024-12-19

齐鲁淘宝书店

十四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 [美]扎卡赖亚斯·弗格里斯(Zacharias Voulgaris)
  • 出版社 人民邮电出版社
  • 出版时间 2018-02
  • 版次 1
  • ISBN 9787115473288
  • 定价 69.00元
  • 装帧 其他
  • 开本 16开
  • 纸张 胶版纸
  • 页数 286页
  • 字数 240千字
【内容简介】
数据科学通过各种统计学和机器学习的技术与方法,将数据转换为有用的信息或知识。Julia是一种在数据科学领域逐渐流行起来的语言。
  《Julia数据科学应用》会提出一系列在数据科学流程中常见的、有代表性的实际问题,并指导读者使用Julia去解决这些问题。全书共13章,涵盖了Julia基础知识、工作环境搭建、语言基础和高 级内容、数据科学应用、数据可视化、机器学习方法(包括无监督式学习方法和监督式学习方法)、图分析方法等重要的话题。附录部分给出了学习和使用Julia的一些有用的参考资料,还给出了各章的思考题的答案。
  本书适合对数据科学的知识和应用方法感兴趣的读者阅读,特别适合有志于学习Julia并从事数据科学相关工作的人员学习参考。
【作者简介】
Zacharias Voulgaris博士出生于希腊雅典。他就读于克里特理工大学生产工程与管理专业,后转而学习计算机科学,在伦敦城市大学获得了信息系统与技术的硕士学位,此后,又研究数据科学,在伦敦大学获得了机器学习博士学位。他曾经在佐治亚理工大学工作并任研究员,他还担任过SEO经理、数据科学家,还做过Microsoft公司的程序经理,负责Bing的数据分析流程。除了数据科学,他对新技术、文学和音乐抱有浓厚的兴趣。
【目录】
第 1章  Julia简介1

1.1  Julia如何提高数据科学水平2

1.1.1  数据科学工作流程3

1.1.2  Julia被数据科学社区接受的过程5

1.2  Julia 扩展6

1.2.1  包的质量6

1.2.2  找到新的包6

1.3  关于本书7

第 2章  建立数据科学工作环境9

2.1  Julia IDE9

2.1.1  Juno10

2.1.2  IJulia11

2.1.3  其他IDE12

2.2  Julia扩展包13

2.2.1  找到并选择扩展包13

2.2.2  安装扩展包14

2.2.3  使用扩展包15

2.2.4  破解扩展包16

2.3  IJulia基础16

2.3.1  文件处理16

2.3.2  在.jl文件中组织代码19

2.3.3  引用代码20

2.3.4  工作目录20

2.4  要使用的数据集21

2.4.1  数据集描述21

2.4.2  下载数据集23

2.4.3  加载数据集24

2.5  在Julia中实现一个简单的机器学习算法25

2.5.1  算法描述26

2.5.2  算法实现27

2.5.3  算法测试30

2.6  将工作区保存到数据文件32

2.6.1  将数据保存为分隔值文件32

2.6.2  将数据保存为Julia数据文件33

2.6.3  将数据保存为文本文件35

2.7  帮助36

2.8  小结36

2.9  思考题37

第3章  Julia入门39

3.1  数据类型39

3.2  数组42

3.2.1  数组基础42

3.2.2  在数组中引用多个元素43

3.2.3  多维数组44

3.3  字典44

3.4  基本命令与函数45

3.4.1  print()和println()46

3.4.2  typemax()和typemin()46

3.4.3  collect()47

3.4.4  show()47

3.4.5  linspace()48

3.5  数学函数48

3.5.1  round()48

3.5.2  rand()和randn()49

3.5.3  sum()52

3.5.4  mean()53

3.6  数组与字典函数53

3.6.1  in53

3.6.2  append!()54

3.6.3  pop!()54

3.6.4  push!()55

3.6.5  splice!()55

3.6.6  insert!()56

3.6.7  sort()和sort!()57

3.6.8  get()57

3.6.9  keys()和values()58

3.6.10  length()和size()58

3.7  其他函数59

3.7.1  time()59

3.7.2  条件语句59

3.7.3  string()61

3.7.4  map()62

3.7.5  versioin()62

3.8  运算符、循环语句与条件语句62

3.8.1  运算符63

3.8.2  循环语句64

3.8.3  break命令66

3.9  小结66

3.10  思考题67

第4章  Julia进阶68

4.1  字符串处理68

4.1.1  split()69

4.1.2  join()70

4.1.3  正则表达式函数70

4.2  定制函数74

4.2.1  函数结构74

4.2.2  匿名函数75

4.2.3  多分派75

4.2.4  函数示例76

4.3  实现简单算法77

4.4  创建完整解决方案79

4.5  小结83

4.6  思考题84

第5章  Julia数据科学应用概述85

5.1  数据科学工作流程85

5.2  数据工程88

5.2.1  数据准备88

5.2.2  数据探索90

5.2.3  数据表示92

5.3  数据建模93

5.3.1  数据发现93

5.3.2  数据学习94

5.4  信息萃取96

5.4.1  数据产品创建96

5.4.2  知识、交付物与可视化产品97

5.5  保持开放型思维99

5.6  在实际问题中应用数据科学流程99

5.6.1  数据准备99

5.6.2  数据探索100

5.6.3  数据表示101

5.6.4  数据发现101

5.6.5  数据学习102

5.6.6  数据产品创建102

5.6.7  知识、交付物和可视化产品103

5.7  小结103

5.8  思考题105

第6章  Julia数据工程106

6.1  数据框106

6.1.1  创建并填充数据框107

6.1.2  数据框基础108

6.1.3  引用数据框中的特定变量109

6.1.4  探索数据框109

6.1.5  筛选数据框110

6.1.6  在数据框变量上应用函数111

6.1.7  使用数据框进行工作111

6.1.8  修改数据框113

6.1.9  对数据框的内容进行排序113

6.1.10  数据框的一些补充建议114

6.2  导入与导出数据115

6.2.1  使用.json数据文件115

6.2.2  保存数据到.json文件115

6.2.3  将数据文件加载到数据框116

6.2.4  保存数据框到数据文件116

6.3  数据清洗117

6.3.1  数值型数据的清洗117

6.3.2  文本型数据的清洗118

6.4  数据格式化与转换119

6.4.1  数值型数据的格式化119

6.4.2  文本数据的格式化119

6.4.3  数据类型的重要性120

6.5  对数值型数据进行转换120

6.5.1  标准化121

6.5.2  离散化(分箱)与二值化122

6.5.3  二值变量转换为连续型变量(仅对于二值分类问题)123

6.5.4  文本数据转换124

6.5.5  大小写标准化124

6.5.6  向量化124

6.6  初步的特征评价126

6.6.1  回归126

6.6.2  分类126

6.6.3  特征评价补充说明127

6.7  小结128

6.8  思考题129

第7章  探索数据集130

7.1  倾听数据130

本章要使用的扩展包131

7.2  计算基本统计量和相关性131

7.2.1  变量概要133

7.2.2  变量之间的相关性134

7.2.3  两个变量之间的可比性136

7.3  绘制统计图136

7.3.1  图形语法137

7.3.2  为可视化准备数据137

7.3.3  箱线图138

7.3.4  条形图138

7.3.5  折线图139

7.3.6  散点图140

7.3.7  直方图143

7.3.8  导出统计图到文件144

7.4  假设检验145

7.4.1  检验的基础知识145

7.4.2  错误类型146

7.4.3  灵敏度与特异度146

7.4.4  显著性水平与检验力146

7.4.5  KRUSKAL-WALLIS检验147

7.4.6  T-检验147

7.4.7  卡方检验149

7.5  其他检验151

7.6  统计检验附加说明151

7.7  案例研究:探索OnlineNewsPopularity数据集151

7.7.1  变量统计152

7.7.2  可视化153

7.7.3  假设154

7.7.4  奇妙的T-SNE方法155

7.7.5  结论156

7.8  小结156

7.9  思考题159

第8章  构建数据空间160

8.1  主成分分析161

8.1.1  在Julia中使用PCA162

8.1.2  独立成分分析:主成分分析的常用替代方法164

8.2  特征评价与选择165

8.2.1  方法论概述165

8.2.2  在Julia中使用余弦相似度进行特征评价与选择166

8.2.3  在Julia中使用DID进行特征评价与选择168

8.2.4  特征评价与选择方法的优缺点170

8.3  其他数据降维技术170

8.3.1  其他降维方法概述171

8.3.2  何时使用高 级降维方法172

8.4  小结172

8.5  思考题173

第9章  数据抽样与结果评价175

9.1  抽样技术175

9.1.1  基本抽样176

9.1.2  分层抽样176

9.2  分类问题的性能指标177

9.2.1  混淆矩阵177

9.2.2  准确度178

9.2.3  精 确度与召回度180

9.2.4  F1指标181

9.2.5  误判成本181

9.2.6  受试者工作特征(ROC)曲线及相关指标182

9.3  回归问题的性能指标185

9.3.1  MSE及其变种RMSE186

9.3.2  SSE187

9.3.3  其他指标187

9.4  K折交叉验证(KFCV)188

9.4.1  在Julia中应用KFCV189

9.4.2  KFCV小提示189

9.5  小结190

9.6  思考题192

第 10章  无监督式机器学习193

10.1  无监督式学习基础知识193

10.1.1  聚类的类型194

10.1.2  距离的度量195

10.2  使用K-均值算法分组数据196

10.2.1  使用Julia实现K-均值聚类197

10.2.2  对K-均值算法的使用建议198

10.3  密度和DBSCAN算法199

10.3.1  DBSCAN算法199

10.3.2  在Julia中应用DBSCAN200

10.4  层次聚类201

10.4.1  在Julia中使用层次聚类201

10.4.2  何时使用层次聚类203

10.5  聚类的验证方式203

10.5.1  Silhouettes203

10.5.2  关于聚类验证的一些建议204

10.6  关于有效进行聚类的一些建议204

10.6.1  处理高维数据205

10.6.2  标准化205

10.6.3  可视化建议205

10.7  小结206

10.8  思考题207

第 11章  监督式机器学习209

11.1  决策树210

11.1.1  在Julia中使用决策树211

11.1.2  关于决策树的一些建议214

11.2  回归树214

11.2.1  在Julia中实现回归树215

11.2.2  关于回归树的一些建议216

11.3  随机森林216

11.3.1  在Julia中使用随机森林进行分类216

11.3.2  在Julia中使用随机森林进行回归218

11.3.3  关于随机森林的一些建议219

11.4  基本神经网络220

11.4.1  在Julia中使用神经网络221

11.4.2  关于神经网络的一些建议223

11.5  极限学习机224

11.5.1  在Julia中使用ELM224

11.5.2  关于ELM的一些建议226

11.6  用于回归分析的统计模型227

11.6.1  在Julia中使用统计回归227

11.6.2  关于统计回归的一些建议230

11.7  其他监督式学习系统230

11.7.1  提升树230

11.7.2  支持向量机230

11.7.3  直推式系统231

11.7.4  深度学习系统232

11.7.5  贝叶斯网络232

11.8  小结233

11.9  本章思考题235

第 12章  图分析236

12.1  图的重要性237

12.2  定制数据集239

12.3  图的统计量240

12.4  环的检测242

用Julia检测环243

12.5  连通子图244

12.6  团245

12.7  图的路径246

12.8  生成树248

12.8.1  在Julia中实现MST249

12.8.2  用文件保存和加载图250

12.9  Julia在图分析中的作用251

12.10  小结252

12.11  思考题254

第 13章  更上一层楼255

13.1  Julia社区255

13.1.1  与其他Julia用户进行交流255

13.1.2  代码库256

13.1.3  视频文件256

13.1.4  新闻257

13.2  学以致用257

13.2.1  从这些特征开始258

13.2.2  关于这个项目的一些思考259

13.3  在数据科学中使用Julia的思考260

13.3.1  不断提高Julia编程水平260

13.3.2  贡献Julia项目261

13.3.3  Julia在数据科学中的未来262

附录A  下载安装Julia与IJulia264

附录B  与Julia相关的一些常用站点266

附录C  本书所用的扩展包268

附录D  Julia与其他平台的集成269

D.1  Julia与R的集成269

D.1.1  在R中运行Julia脚本269

D.1.2  在Julia中运行R脚本270

D.2  Julia与Python的集成270

D.2.1  在Python中运行Julia脚本270

D.2.2  在Julia中运行Python脚本271

附录E  Julia中的并行处理272

附录F  各章思考题答案275
点击展开 点击收起

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP