全栈数据之门 网络技术 任柳江
none
¥
48.85
6.2折
¥
79
全新
仅1件
作者任柳江
出版社电子工业出版社
ISBN9787121309052
出版时间2017-03
版次1
装帧其他
开本16
页数396页
字数445千字
定价79元
货号xhwx_1201475608
上书时间2024-12-25
商品详情
- 品相描述:全新
-
正版特价新书
- 商品描述
-
目录:
目录
前言 自强不息,厚德载物 / x
0x1 linux,自由之光 / 001
0x10 linux,你是我的眼 / 001
0x11 linux基础,从零开始 / 003
01 linux之门 / 003
02 文件作 / 004
03 权限管理 / 006
04 / 008
05 实战经验 / 010
0x12 sed与 grep,文本处理 / 010
01 文本工具 / 010
02 grep的使用 / 011
03 grep家族 / 013
04 sed的使用 / 014
05 综合案例 / 016
0x13 数据工程, shell / 018
01 shell分析 / 018
02 文件探索 / 019
03 内容探索 / 020
04 交差并补 / 020
05 其他常用的命令 / 021
06 批量作 / 022
07 结语 / 025
0x14 shell 快捷键,emacs 之门 / 025
01 提高效率 / 025
02 光标移动 / 026
03 文本编辑 / 027
04 命令搜索 / 028
05 emacs 入门 / 029
06 emacs 思维 / 031
0x15 缘起linux,一入mac 误终身 / 032
01 开源生万物 / 032
02 有钱换mac / 032
03 程序员需求 / 033
04 非程序员需求 / 034
05 一入mac 误终身 / 035
0x16 大成者,集群安装 / 036
01 离线安装 / 036
02 host 与ssh 配置 / 037
03 sudo 与k 环境 / 039
04 准备hadoop 包 / 040
05 开启 与配置源 / 041
06 安装ambari-server / 041
07 后续服务安装 / 042
08 结语 / 044
0x2 python,道法自然 / 045
0x20 python,灵犀一指 / 045
0x21 python 基础,兴趣为王 / 047
01 语言 / 047
02 数据结构 / 047
03 文件读写 / 049
04 使用模块 / 050
05 函数式编程 / 052
06 一道面试题 / 053
07 兴趣驱动 / 055
0x22 喜新厌旧,2迁移 3 / 056
01 新旧交替 / 056
02 基础变化 / 057
03 编码问题 / 058
04 其他变化 / 058
05 2to3脚本 / 060
06 pyspark配置 / 061
07 喜新厌旧 / 062
0x23 anaconda,ipython / 062
01 anaconda / 062
02 安装与配置 / 063
03 pip与源 / 064
04 ipython与 jupyter / 065
05 结语 / 067
0x24 美不胜收,python工具 / 067
01 缘起 / 067
02 调试与开发 / 068
03 排版与格式化 / 070
04 辅助工具 / 072
05 实用 / 074
0x25 numpy基础,线代数 / 075
01 numpy的使用 / 075
02 索引与切片 / 076
03 变形与统计 / 078
04 矩阵运算 / 080
05 实用方法 / 083
06 结语 / 085
0x26 numpy实战,pca降维 / 085
01 pca介绍 / 085
02 数据均值化 / 086
03 协方差矩阵 / 087
04 特征值与向量 / 088
05 数据映降维 / 089
06 sklearn 实现 / 090
0x3 大数据,其大无外 / 093
0x30 太大数据,极生两仪 / 093
0x31 神象住世,hadoop / 095
01 hadoop / 095
02 hdfs / 096
03 角与管理 / 097
04 文件作 / 098
05 结语 / 100
0x32 分治之美,mapreduce / 100
01 map 与reduce 函数 / 100
02 分而治之 / 102
03 hello,world / 103
04 streaming 接 / 105
0x33 hive 基础,蜂巢与仓库 / 106
01 引言 / 106
02 hive 接 / 107
03 分区建表 / 108
04 分区机制 / 110
05 数据导入/ 导出 / 111
06 hive-ql / 112
07 结语 / 114
0x34 hive 深入,实战经验 / 115
01 排序与分布式 / 115
02 多表插入与mapjoin / 116
03 加载map-reduce 脚本 / 117
04 使用第三方udf / 119
05 实战经验 / 120
06 生成id / 121
0x35 hbase库,实时业务 / 122
01 理论基础 / 122 02 shell作 / 123 03 关联 hive表 / 126 04 数据导入 / 128 05 实用经验 / 130
0x36 sql与 nosql,sqoop为媒 / 130
01 sql与 nosql / 130 02 从 mysql导入 hdfs / 131 03 增量导入 / 134 04 映到 hive / 135 05 导入 hive表 / 136 06 从 hdfs导出到 mysql / 137 07 从 hive导出到 mysql / 138
0x4 数据分析,见微知著 / 141
0x40 大数据分析,鲁班为祖师 / 141 0x41 sql技能, mysql / 143
01 sql工具 / 143 02 基础作 / 144 03 查询套路 / 145 04 join查询 / 146 05 union与 ests / 149 06 实战经验 / 151
0x42 快刀 awk,斩乱数据 / 152
01 快刀 / 152 02 一二三要点 / 152 03 一个示例 / 154 04 应用与统计 / 154 05 斩乱麻 / 156
0x43 pandas,数据之框 / 157
01 数据为框 / 157
02 加载数据 / 158
03 行列索引 / 159
04 行列作 / 161
05 合并聚合 / 163
06 迭代数据 / 164
07 结语 / 165
0x44 zeppelin,一统江湖 / 166
01 心潮澎湃 / 166
02 基本使用 / 168
03 sql 与可视化 / 169
04 安装zeppelin / 172
05 配置zeppelin / 173
06 数据安全 / 174
07 使用心得 / 176
0x45 数据分组,聚合窗 / 177
01 mysql 聚合 / 177
02 spark 聚合 / 178
03 非聚合字段 / 179
04 hive 实现 / 180
05 group_concat / 181
06 hive 窗函数 / 183
07 dataframe 窗 / 184
08 结语 / 185
0x46 全栈分析,六层内功 / 186
01 引言 / 186
02 mysql 版本 / 186
03 awk 版本 / 187
04 python 版本 / 188
05 hive 版本 / 189
06 map-reduce 版本 / 190
07 spark 版本 / 190
08 结语 / 191
0x5 机器学,人类失控 / 193
0x50 机器学,琅琊论断 / 193 0x51 酸酸甜甜,orange / 195
01 可视化学 / 195 02 数据探索 / 196 03 模型与评估 / 199 04 组件介绍 / 200 05 与 python进行整合 / 202 06 结语 / 204
0x52 sklearn,机器学 / 205
01 sklearn介绍 / 205 02 数据预处理 / 206 03 建模与预测 / 207 04 模型评估 / 209 05 模型持久化 / 210 06 三个层次 / 210
0x53 特征转换,量纲伸缩 / 211
01 特征工程 / 211 02 独热编码 / 212 03 sklearn示例 / 213 04 标准化与归一化 / 215 05 sklearn与 spark实现 / 216 06 结语 / 219
0x54 描述统计,基础指标 / 220
01 描述统计 / 220 02 pandas实现 / 222 03 方差与协方差 / 223 04 spark-rdd实现 / 224 05 dataframe实现 / 226 06 spark-sql实现 / 227 07 结语 / 227
0x55 模型评估,交验证 / 228
01 测试与训练 / 228
02 评价指标 / 229
03 交验证 / 231
04 验证数据 / 232
05 oob 数据 / 233
0x56 文本特征,词袋模型 / 234
01 自然语言 / 234
02 中文分词 / 235
03 词袋模型 / 236
04 词频统计 / 237
05 tf-idf / 238
06 结语 / 239
0x6 算法预测,占天卜地 / 241
0x60 命由己做,福自己求 / 241
0x61 近朱者赤,相亲knn / 243
01 朴素的思想 / 243
02 算法介绍 / 243
03 分类与回归 / 244
04 k 与半径 / 245
05 优化计算 / 246
06 实例应用 / 247
0x62 物以类聚,kmeans / 248
01 算法描述 / 248
02 建立模型 / 249
03 理解模型 / 251
04 距离与相似 / 252
05 降维与可视化 / 253
06 无监督学 / 255
0x63 很很天真,朴素贝叶斯 / 257
01 朴素思想 / 257
02 概率公式 / 257
03 三种实现 / 258
04 sklearn 示例 / 260
05 朴素却不 / 262
0x64 菩提之树,决策姻缘 / 263
01 缘起 / 263 02 orange演示 / 264 03 scikit-learn模拟 / 266 04 熵与基尼指数 / 267 05 决策过程分析 / 268 06 spark模拟 / 270 07 结语 / 271
0x65 之美,森林 / 271
01 树与森林 / 271 02 处处 / 273 03 sklearn示例 / 274 04 mllib示例 / 275 05 特点与应用 / 276
0x66 自,深度之门 / 277
01 深度学 / 277 02 特征学 / 278 03 自动 / 280 04 keras代码 / 282 05 抗噪 / 283
0x7 spark,唯快不破 / 285
0x70 人生苦短,快用 spark / 285 0x71 pyspark之门,强者联盟 / 287
01 全栈框架 / 287 02 环境搭建 / 288 03 分布式部署 / 289 04 示例分析 / 290 05 两类算子 / 292 06 map与 reduce / 293 07 amb的野心 / 294
0x72 rdd 算子,计算之魂 / 295
01 算子之道 / 295
02 获取数据 / 296
03 过滤与排序 / 297
04 聚合数据 / 298
05 join 连接 / 299
06 union 与zip / 300
07 读写文件 / 301
08 结语 / 303
0x73 分布式sql,蝶恋飞舞 / 304
01 sql 工具 / 304
02 命令行cli / 304
03 读hive 数据 / 305
04 将结果写入hive / 306
05 读写mysql 数据 / 307
06 读写三种文件 / 308
0x74 dataframe,三角之恋 / 310
01 dataframe / 310
02 生成数据框 / 311
03 合并与join / 313
04 select 作 / 314
05 sql 作 / 315
06 自定义udf / 316
07 三角之恋 / 318
0x75 之父,scala 入世 / 319
01 spark 与scala / 319
02 scala repl / 320
03 编译scala / 321
04 sbt 编译 / 322
05 示例分析 / 323
06 编译提交 / 325
0x76 机器之心,ml 套路 / 326
01 城市套路深 / 326
02 算法与特征工程 / 327 03 管道工作流 / 328 04 onehotencoder示例 / 329 05 ml回归实战 / 331 06 特征处理与算法 / 332 07 拟合与评估 / 334
0x8 数据科学,全栈智慧 / 337
0x80 才高八斗,共分天下 / 337 0x81 自学数据,神蟒领舞 / 339
01 机器学 / 339 02 语言领域 / 339 03 python数据生态 / 340 04 相关资料 / 341 05 书籍 / 342 06 感的职业 / 343
0x82 数据科学,七大技能 / 343
01 七大技能 / 343 02 sql与 nosql技能 / 344 03 linux工具集 / 344 04 python或者 r语言生态 / 345 05 hadoop与 spark生态 / 345 06 概率、统计与线代数 / 346 07 机器学与深度学 / 346 08 业务及杂项 / 347 09 结语 / 347
0x83 大无所大,生态框架 / 348
01 计算生态 / 348 02 离线计算 / 348 03 交互分析 / 349 04 实时处理 / 350 05 算法挖掘 / 351 06 发行版本 / 352
07 其他工具 / 353
0x84 集体智慧,失控哲学 / 354
01 数据是宝 / 354
02 一分为二 / 355
03 回归统一 / 356
04 聚少成多 / 356
05 你中有我 / 357
06 从小看大 / 358
07 大事化小 / 358
08 少即是多 / 359
0x85 一技之长,一生之用 / 359
01 一技之长 / 359
02 数据分析相关 / 360
03 python 相关 / 360
04 hadoop 相关 / 361
05 spark 相关 / 361
06 模型相关 / 362
07 算法相关 / 362
08 一生之用 / 363
0x86 知识作谱,数据为栈 / 363
01 知识作谱 / 363
02 理论基础 / 363
03 python/r 编程 / 364
04 分析与可视化 / 365
05 大数据 / 365
06 etl 与特征工程 / 366
07 机器学与深度学 / 366
08 工具与库 / 367
09 全栈为用 / 367
内容简介:
本书以数据分析领域很热的python语言为主要线索,介绍了数据分析库numpy、panda与机器学库cikitlearn,使用了可视化环境orange3来理解算法的一些细节。对于机器学,既有常用算法knn与kmean的应用,决策树与森林的实战,还涉及常用特征工程与深度学中的自动编程器。在大数据hadoop与hive环境的基础之上,使用park的ml/mllib库集成了前面的各部分内容,让分布式机器学更容易。大量的工具与技能实战的介绍将各部分融合成一个全栈的数据科学内容。
作者简介:
任柳江,网名云戒。有近10年经验的linux及emac重度用户,熟悉python及其web开发、机器态环境。曾在2008年组织创建linux电子杂志桃源。做过安全测试和开发,同时具有开发的能力和测试的思维。爱好易学与佛学,目前专攻大数据与机器学。
— 没有更多了 —
正版特价新书
以下为对购买帮助不大的评价