深度学 自然语言处理 人工智能 ()斋藤康毅 新华正版
¥
42.2
4.3折
¥
99
全新
库存133件
作者 ()斋藤康毅
出版社 人民邮电出版社
ISBN 9787115547644
出版时间 2020-10
版次 1
装帧 平装
开本 32
页数 420页
字数 394千字
定价 99元
货号 xhwx_1202150930
上书时间 2024-09-29
商品详情
品相描述:全新
正版特价新书
商品描述
主编: 豆瓣评分9.4的书深度学入门:基于python的理论与实现续作,带你快速直达自然语言处理领域! 1.简明易懂 本书内容精炼,聚焦深度学视角下的自然语言处理,延续前作的行文风格,采用通俗的语言和大量直观的示意图详细讲解,帮助读者加深对深度学技术的理解,轻松入门自然语言处理。 2.侧重 不依赖外部库,使用python 3从零开始创建深度学程序,通过亲自创建程序并运行,读者可透彻掌握word2vec、rnn、ltm、gru、eq2eq和attention等技术背后的运行。 3.学曲线缓 按照“文字介绍→代码实现→分析结果→发现问题→进行改善”的流程,逐步深入,读者只需具备基础的神经网络和python知识,即可轻松读懂。 4.提供源代码 5.双印刷 目录: 译者序 前言 ii 章 神经网络的复 1 1.1 数学和python的复 1 1.1.1 向量和矩阵 1 1.1.2 矩阵的对应元素的运算 4 1.1.3 广播 4 1.1.4 向量内积和矩阵乘积 6 1.1.5 矩阵的形状检查 7 1.2 神经网络的推理 8 1.2.1 神经网络的推理的全貌图 8 1.2.2 层的类化及正向传播的实现 14 1.3 神经网络的学 18 1.3.1 损失函数 18 1.3.2 导数和梯度 21 1.3.3 链式法则 23 1.3.4 计算图 24 1.3.5 梯度的推导和反向传播的实现 35 1.3.6 权重的更新 39 1.4 使用神经网络解决问题 41 1.4.1 螺旋状数据集 41 1.4.2 神经网络的实现 43 1.4.3 学用的代码 45 1.4.4 trainer 类 49 1.5 计算的高速化 50 1.5.1 位精度 51 1.5.2 gpu(cupy) 52 1.6 小结 54 第2章 自然语言和单词的分布式表示 57 2.1 什么是自然语言处理 57 2.2 同义词词典 59 2.2.1 word 61 2.2.2 同义词词典的问题 61 2.3 基于的方法 63 2.3.1 基于python的语料库的预处理 63 2.3.2 单词的分布式表示 66 2.3.3 分布式设 67 2.3.4 共现矩阵 68 2.3.5 向量间的相似度 72 2.3.6 相似单词的排序 74 2.4 基于的方法的改进 77 2.4.1 点互信息 77 2.4.2 降维 81 2.4.3 基于svd的降维 84 2.4.4 ptb数据集 86 2.4.5 基于ptb数据集的评价 88 2.5 小结 91 第3章 word2vec 93 3.1 基于推理的方法和神经网络 93 3.1.1 基于的方法的问题 94 3.1.2 基于推理的方法的概要 95 3.1.3 神经网络中单词的处理方法 96 3.2 简单的word2vec 101 3.2.1 cbow模型的推理 101 3.2.2 cbow模型的学 106 3.2.3 word2vec的权重和分布式表示 108 3.3 学数据的准备 110 3.2.1 上下文和目标词 110 3.3.2 转化为one-hot 表示 113 3.4 cbow模型的实现 114 3.5 word2vec的补充说明 120 3.5.1 cbow模型和概率 121 3.5.2 skip-gram 模型 122 3.5.3 基于与基于推理 125 3.6 小结 127 第4章 word2vec的高速化 129 4.1 word2vec的改进① 129 4.1.1 embed层 132 4.1.2 embed层的实现 133 4.2 word2vec的改进② 137 4.2.1 中间层之后的计算问题 138 4.2.2 从多分类到二分类 139 4.2.3 sigmoid 函数和交熵误差 141 4.2.4 多分类到二分类的实现 144 4.2.5 负采样 148 4.2.6 负采样的采样方法 151 4.2.7 负采样的实现 154 4.3 改进版word2vec的学 156 4.3.1 cbow模型的实现 156 4.3.2 cbow模型的学代码 159 4.3.3 cbow模型的评价 161 4.4 wor2vec相关的其他话题 165 4.4.1 word2vec的应用例 166 4.4.2 单词向量的评价方法 168 4.5 小结 170 第5章 rnn 173 5.1 概率和语言模型 173 5.1.1 概率视角下的word2vec 174 5.1.2 语言模型 176 5.1.3 将cbow模型用作语言模型? 178 5.2 rnn 181 5.2.1 循环的神经网络 181 5.2.2 展开循环 183 5.2.3 backpropagation through time 185 5.2.4 truncated bptt 186 5.2.5 truncated bptt的mini-batch 学 190 5.3 rnn的实现 192 5.3.1 rnn层的实现 193 5.3.2 time rnn层的实现 197 5.4 处理时序数据的层的实现 202 5.4.1 rnnlm的全貌图 202 5.4.2 time层的实现 205 5.5 rnnlm的学和评价 207 5.5.1 rnnlm的实现 207 5.5.2 语言模型的评价 211 5.5.3 rnnlm的学代码 213 5.5.4 rnnlm的trainer类 216 5.6 小结 217 第6章 gated rnn 219 6.1 rnn的问题 220 6.1.1 rnn的复 220 6.1.2 梯度消失和梯度爆炸 221 6.1.3 梯度消失和梯度爆炸的原因 223 6.1.4 梯度爆炸的对策 228 6.2 梯度消失和lstm 229 6.2.1 lstm的接 230 6.2.2 lstm层的结构 231 6.2.3 输出门 234 6.2.4 遗忘门 236 6.2.5 新的记忆单元 237 6.2.6 输入门 238 6.2.7 lstm的梯度的流动 239 6.3 lstm的实现 240 6.4 使用lstm的语言模型 248 6.5 进一步改进rnnlm 255 6.5.1 lstm层的多层化 256 6.5.2 基于dropout抑制过拟合 257 6.5.3 权重共享 262 6.5.4 更好的rnnlm的实现 263 6.5.5 前沿研究 269 6.6 小结 270 第7章 基于rnn生成文本 273 7.1 使用语言模型生成文本 274 7.1.1 使用rnn生成文本的步骤 274 7.1.2 文本生成的实现 278 7.1.3 更好的文本生成 281 7.2 seq2seq 模型 283 7.2.1 seq2seq 的 283 7.2.2 时序数据转换的简单尝试 287 7.2.3 可变长度的时序数据 288 7.2.4 加法数据集 290 7.3 seq2seq 的实现 291 7.3.1 encoder类 291 7.3.2 decoder类 295 7.3.3 seq2seq 类 300 7.3.4 seq2seq 的评价 301 7.4 seq2seq 的改进 305 7.4.1 反转输入数据(reverse) 305 7.4.2 (peeky) 308 7.5 seq2seq 的应用 313 7.5.1 聊天机器人 314 7.5.2 算法学 315 7.5.3 自动图像描述 316 7.6 小结 318 第8章 attention 321 8.1 attention 的结构 321 8.1.1 seq2seq 存在的问题 322 8.1.2 的改进 323 8.1.3 的改进① 325 8.1.4 的改进② 333 8.1.5 的改进③ 339 8.2 带attention 的seq2seq 的实现 344 8.2.1 的实现 344 8.2.2 的实现 345 8.2.3 seq2seq 的实现 347 8.3 attention 的评价 347 8.3.1 期格式转换问题 348 8.3.2 带attention 的seq2seq 的学 349 8.3.3 attention 的可视化 353 8.4 关于attention 的其他话题 356 8.4.1 双向rnn 356 8.4.2 attention 层的使用方法 358 8.4.3 seq2seq 的深层化和skip connection 360 8.5 attention 的应用 363 8.5.1 google neural machine translation(gnmt) 363 8.5.2 transformer 365 8.5.3 neural turing machine(ntm) 369 8.6 小结 373 附录a sigmoid 函数和tanh 函数的导数 375 a.1 sigmoid 函数 375 a.2 tanh 函数 378 a.3 小结 380 附录b 运行word 381 b.1 nltk的安装 381 b.2 使用word获得同义词 382 b.3 word和单词网络 384 b.4 基于word的语义相似度 385 附录c gru 387 c.1 gru的接 387 c.2 gru的计算图 388 后记 391 参文献 395 内容简介: 深度学:自然语言处理是深度学入门:基于python 的理论与实现的续作,围绕自然语言处理和时序数据处理,介绍深度学中的重要技术,包括word2vec、rnn、ltm、gru、eq2eq 和attention 等。本书语言实,结合大量示意图和python代码,按照“提出问题”“思解决问题的新方法”“加以改善”的流程,基于深度学解决自然语言处理相关的各种问题,使读者在此过程中更深入地理解深度学中的重要技术。 作者简介: 斋藤康毅,1984年出生于本长崎县,东京大学,并完成东京大学院课程。现从事计算机视觉与机器学相关的研究和开发工作。是introducing python、python in practice、the element of puting ytem、buil machine learning ytem with python的文版译者。
— 没有更多了 —
以下为对购买帮助不大的评价