消息首页搜索举报

图解语音识别

全新正版急速发货

32.14 5.4折 59 全新

库存26件

江苏无锡

认证卖家担保交易快速发货售后保障

作者(日)荒木雅弘著陈舒扬,杨文刚译

出版社人民邮电出版社

ISBN9787115528711

出版时间2020-04

装帧平装

开本32开

定价59元

货号1202044007

上书时间2024-10-27

当科图书专营店

四年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 14小时
好评率暂无

最新上架

智能网联汽车测试与评价技术 ¥90.62

木意已欣欣 ¥22.85

华为通信科技史话 ¥30.91

研学旅行概论 ¥29.71

谁住在花园里? ¥18.60

原乡祭 ¥35.89

电子陶瓷简明教程 ¥21.97

哲学探索（2021年第2辑，总第3辑） ¥72.08

短视频运营从入门到精通微课版 ¥25.59

商品详情

品相描述：全新

商品描述: 作者简介
荒木雅弘（作者）
1964年出生于日本大阪。1993年完成了日本京都大学研究生院研究科信息工程专业博士课程的学习。先后担任过京都大学工学部助教和京都大学综合信息媒体中心讲师。1999年开始担任日本京都工艺纤维大学工艺系助理教授，2007年晋升为研究生院工艺科学研究科副教授。目前正在开发以语义网为知识库的对话系统，研究用于多模态对话系统的描述语言。
陈舒扬（译者）
软件开发工程师，任职于某日企，从事软件开发工作。热爱编程和游戏，崇尚开源精神，对机器学习领域的东西都很着迷。
杨文刚（译者）
长期从事软件开发和系统运维工作。现任职于某世界五百强企业，探索数字化转型业务，内容涉及大数据、机器学习、深度学习等技术。

目录
第1章开篇

1.1什么是语音识别2

1.2语音识别的历史4

1.3语音识别的用处6

1.4为什么很难8

1.5本书的目标10

1.6小结12

第2章什么是语音

2.1语音学16

2.2声音是如何产生的——发音语音学16

2.3声音的真面目——声学语音学23

2.4声音是如何被感知的——感知语音学29

2.5总结32

第3章统计模式识别

3.1什么是模式识别34

3.2统计模式识别的思路36

3.3生成模型的训练40

3.4判别模型的训练44

3.5统计语音识别的概要45

3.6总结48

第4章有限状态自动机

4.1什么是有限状态自动机50

4.2用有限状态自动机表达的语言53

4.3各种各样的有限状态自动机55

4.4有限状态自动机的性质58

4.5总结59

第5章语音特征的提取

5.1特征提取的步骤62

5.2语音信号的数字化64

5.3人类听觉模拟——频谱分析67

5.4另一个精巧设计——倒谱分析69

5.5噪声去除72

5.6总结73

第6章语音识别：基本声学模型

6.1声学模型的单位76

6.2什么是隐马尔可夫模型78

6.3隐马尔可夫模型的概率计算81

6.4状态序列的估计83

6.5参数训练85

6.6总结89

第7章语音识别：高级声学模型

7.1实际的声学模型92

7.2判别训练94

7.3深度学习96

7.4总结98

第8章语音识别：语言模型

8.1基于语法规则的语言模型100

8.2统计语言模型的思路101

8.3统计语言模型的建立方法103

8.4总结108

第9章语音识别：搜索算法

9.1填补声学模型和语言模型之间的空隙112

9.2状态空间搜索113

9.3用树形字典减少浪费115

9.4用集束搜索缩小范围116

9.5用多次搜索提高精度118

9.6总结120

第10章语音识别：WFST运算

10.1WFST的合成运算124

10.2确定化129

10.3权重移动133

10.4最小化134

10.5总结135

第11章语音识别：使用WFST进行语音识别

11.1WFST转换138

11.2声学模型的WFST转换139

11.3发音字典的WFST转换141

11.4语言模型的WFST转换142

11.5WFST的搜索144

11.6总结145

第12章语义分析

12.1什么是语义表示148

12.2基于规则的语义分析处理151

12.3基于统计的语义分析处理153

12.4智能手机的语音服务156

12.5总结159

第13章语音对话系统的实现

13.1对话系统的开发方法162

13.2基于规则的对话管理164

13.3针对对话管理的统计方法166

13.4总结170

第14章终篇

14.1语音分析工具WaveSurfer174

14.2HMM构建工具HTK175

14.3大词汇量连续语音识别引擎Julius177

14.4虚拟代理对话工具MMDAgent179

14.5深入学习之路180

思考题的解答182

参考文献188

后记191

内容摘要
本书从语音识别的历史和基础知识讲起，通过图解的方式对语音识别技术进行了尽可能简单的解释。内容涉及语音学基础知识、统计模式识别、有限状态自动机、语音特征的提取、声学模型和语言模型、搜索算法和基于WFST的语音识别技术等。

此外，本书没有将语音识别限定在"将语音转换成文本"的传统范畴内，而是在此基础上，还讲解了从语音识别技术到人机对话技术的演进过程和方法。内容涉及语义分析和语音对话系统的实现。

本书图例丰富，内容直观且深入浅出，适合语音识别的相关从业人员入门

以及对语音识别感兴趣的人士阅读。

主编推荐
125张图解轻松入门
一本书掌握语音识别基础知识

1.全面
网罗基础知识点，语音识别研究入门佳作
2.易懂
深入浅出，技术领域的“科普书”
3.直观
图文并茂、全彩印刷，阅读起来不费劲

知识点涵盖：
语音学／统计模式识别／有限状态自动机／特征提取／声学模型
语言模型／搜索算法／WFST合成与转换／语义分析／语音对话系统

— 没有更多了 —

图解语音识别

当科图书专营店

商品详情

相关推荐