消息首页搜索举报

深度学习语音识别技术实践

正版原版带防伪标签 16开近全新内页无笔迹勾画无松线脱页无裁损不缺页详见实物拍图

28 3.1折 89 九五品

仅1件

上海闵行

认证卖家担保交易快速发货售后保障

作者柳若边

出版社清华大学出版社

出版时间2019-04

版次1

装帧平装

上书时间2024-09-07

梦里书香

十五年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 5小时
好评率暂无

最新上架

上海市志口岸分志出入境检验检疫卷（1978-2010）全新未拆封 ¥150.00

新泾镇志（上下）未拆封 ¥130.00

七宝镇志（布面精装） ¥50.00

上海市闸北区地名志 ¥45.00

紫隄村志（江南名镇志） ¥20.00

至慧至雅——从圣玛利亚女校、中西女中到上海市第三女子中学（全新未拆封） ¥68.00

上海商务年鉴（2020）全新未拆封 ¥12.00

上海商务年鉴（2021）全新未拆封 ¥12.00

上海工业年鉴（2022）精装 ¥15.00

商品详情

品相描述：九五品

图书标准信息

作者柳若边
出版社清华大学出版社
出版时间 2019-04
版次 1
ISBN 9787302516927
定价 89.00元
装帧平装
开本其他
页数 292页
字数 355千字

【内容简介】: 语音识别已经逐渐进入人们的日常生活。语音识别技术是涉及语言、计算机、数学等领域的交叉学科。《深度学习：语音识别技术实践》介绍了包括C#、Perl、Python、Java在内的多种编程语言实践，开源语音识别工具包Kaldi的使用与代码分析，深度学习的开发环境搭建，卷积神经网络，以及语音识别中常见的语言模型——N元模型和依存模型等，让读者快速了解语音识别基础，掌握开发语音识别程序的算法。
《深度学习：语音识别技术实践》从语音识别的基础开始讲起，并辅以翔实的案例，既适合需要具体实现语音识别的程序员使用，也适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读。
【作者简介】: 柳若边

猎兔搜索团队核心成员，曾供职于中国万网、三星等多家业内知名公司，现任某教育培训机构专业讲师。猎兔搜索创立于2004年，专注于自然语言处理等人工智能领域的技术开发与实现。在北京和上海等地均有猎兔培训的学员，猎兔搜索出版的相关技术图书读者遍及全国各省(市、区)及海外华人圈。
【目录】: 目  录

章  语音识别技术1
1.1  总体结构1
1.2  Linux基础2
1.3  安装Micro编辑器4
1.4  安装Kaldi5
1.5  yesno例子6
1.5.1  数据准备7
1.5.2  词典准备8
1.6  构建一个简单的ASR12
1.7  Voxforge例子21
1.8  数据准备23
1.9  加权有限状态转换34
1.9.1  FSA35
1.9.2  FST35
1.9.3  WFST37
1.9.4  Kaldi对OpenFst的改进38
1.10  语音识别语料库39
1.10.1  TIMIT语料库39
1.10.2  LibriSpeech语料库40
1.10.3  中文语料库40
1.11  Linux shell脚本基础40
1.11.1  Bash41
1.11.2  AWK44
第2章  C#开发语音识别46
2.1  准备开发环境46
2.2  计算卷积47
2.3  记录语音48
2.4  读入语音信号52
2.5  离散傅里叶变换53
2.6  移除静音54
第3章  Perl开发语音识别58
3.1  变量58
3.1.1  数字58
3.1.2  字符串59
3.1.3  数组60
3.1.4  散列表60
3.2  多维数组62
3.3  常量62
3.4  操作符63
3.5  控制流66
3.6  文件与目录67
3.7  例程68
3.8  执行命令69
3.9  正则表达式69
3.9.1  基本类型69
3.9.2  正则表达式模式70
3.10  命令行参数72

第4章  Python开发语音识别73
4.1  Windows操作系统下安装Python73
4.2  Linux操作系统下安装Python75
4.3  选择版本76
4.4  开发环境76
4.5  注释77
4.6  变量77
4.6.1  数值77
4.6.2  字符串79
4.7  数组80
4.8  列表80
4.9  元组80
4.10  字典81
4.11  控制流81
4.11.1  条件判断81
4.11.2  循环82
4.12  模块83
4.13  函数84
4.14  读写文件86
4.15  面向对象编程87
4.16  命令行参数88
4.17  数据库90
4.18  日志记录90
4.19  异常处理92
4.20  测试92
4.21  语音活动检测93
4.22  使用numpy93
第5章  Java开发语音识别94
5.1  实现卷积95
5.2  KaldiJava96
5.2.1  使用Ant97
5.2.2  使用Maven99
5.2.3  使用Gradle100
5.2.4  概率分布函数102
5.3  TensorFlow的Java接口104
5.3.1  在Windows操作系统下使用TensorFlow104
5.3.2  在Linux操作系统下使用TensorFlow106
第6章  语音信号处理109
6.1  使用FFmpeg109
6.2  标注语音110
6.3  时间序列112
6.4  端点检测113
6.5  动态时间规整114
6.6  傅里叶变换117
6.6.1  离散傅里叶变换117
6.6.2  快速傅里叶变换120
6.7  MFCC特征124
6.8  说话者识别125
6.9  解码125
第7章  深度学习132
7.1  神经网络基础132
7.1.1  实现多层感知器135
7.1.2  计算过程143
7.2  卷积神经网络150
7.3  搭建深度学习开发环境156
7.3.1  使用Cygwin模拟环境156
7.3.2  使用CMake157
7.3.3  使用Keras158
7.3.4  安装TensorFlow161
7.3.5  安装TensorFlow的Docker容器162
7.3.6  使用TensorFlow164
7.3.7  一维卷积208
7.3.8  二维卷积210
7.3.9  扩张卷积213
7.3.10  TensorFlow实现简单的语音识别214
7.4  nnet3实现代码216
7.4.1  数据类型217
7.4.2  基本数据结构219
7.5  编译Kaldi230
7.6  端到端深度学习232
7.7  Dropout解决过度拟合问题232
7.8  矩阵运算235
第8章  语言模型238
8.1  概率语言模型238
8.1.1  一元模型240
8.1.2  数据基础240
8.1.3  改进一元模型249
8.1.4  二元词典251
8.1.5  完全二叉树数组257
8.1.6  三元词典261
8.1.7  N元模型262
8.1.8  生成语言模型264
8.1.9  评估语言模型265
8.1.10  平滑算法266
8.2  KenLM语言模型工具包271
8.3  ARPA文件格式275
8.4  依存语言模型278