消息首页搜索举报

图解语音识别

内页干净无笔记划线、实图实拍、品相如图

10 1.7折 59 九品

仅1件

北京昌平

认证卖家担保交易快速发货售后保障

作者[日]荒木雅弘

出版社人民邮电出版社

出版时间2020-04

版次1

装帧其他

货号23

上书时间2024-05-24

锦喜福

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 10小时
好评率暂无

店主推荐
最新上架

中国书画中国书画杂志 2020年第1期，第2期，第3期，第4期，第5期，第6期，第7期，第8期，第9期，第10期，第11期，第12期全年全套12期 12本合售书内干净书品九品（第二期、第四期有脱页） ¥360.00

中国楹联法书精品选集（上下卷） ¥432.00

服装设计概论 1962年出版罕见珍本 ¥3000.00

中国陶瓷美术史纲【讨论稿】油印本第五章隋唐五代 ¥888.00

韩国战争史 ¥800.00

中国濒危物种生存状况报告-中国药用兰科植物濒危状况评估报告 ¥2600.00

齐白石草虫画册 ¥2000.00

丁云鹏罗汉图 ¥2000.00

官方设定仙剑奇侠传七霜锋之卷美术全集 ¥1000.00

毛泽东选集1-4 ¥30.00

旧唐书全十六册一版一印 ¥400.00

英语！我要怎么教：在家创造浸入式英语环境 ¥20.00

甄嬛传（典藏版）3本合售 ¥15.00

形式主义批评的终结 ¥80.00

疯狂的简洁 ¥10.00

中国哲学史：民国学术经典中国史系列 ¥35.00

左汉桥书画集：-我与现代书法 ¥8.00

中国藏传佛教白描图集 ¥15.00

商品详情

品相描述：九品

图书标准信息

作者 [日]荒木雅弘
出版社人民邮电出版社
出版时间 2020-04
版次 1
ISBN 9787115528711
定价 59.00元
装帧其他
开本 16开
纸张胶版纸
页数 191页
字数 186千字

【内容简介】: 《图解语音识别》从语音识别的历史和基础知识讲起，通过图解的方式对语音识别技术进行了尽可能简单的解释。内容涉及语音学基础知识、统计模式识别、有限状态自动机、语音特征的提取、声学模型和语言模型、搜索算法和基于WFST 的语音识别技术等。此外，本书没有将语音识别限定在“将语音转换成文本”的传统范畴内，而是在此基础上，还讲解了从语音识别技术到人机对话技术的演进过程和方法。内容涉及语义分析和语音对话系统的实现。
【作者简介】: 荒木雅弘（作者） 1964年出生于日本大阪。1993年完成了日本京都大学研究生院研究科信息工程专业博士课程的学习。先后担任过京都大学工学部助教和京都大学综合信息媒体中心讲师。1999年开始担任日本京都工艺纤维大学工艺系助理教授，2007年晋升为研究生院工艺科学研究科副教授。目前正在开发以语义网为知识库的对话系统，研究用于多模态对话系统的描述语言。陈舒扬（译者）软件开发工程师，任职于某日企，从事软件开发工作。热爱编程和游戏，崇尚开源精神，对机器学习领域的东西都很着迷。杨文刚（译者）长期从事软件开发和系统运维工作。现任职于某世界五百强企业，探索数字化转型业务，内容涉及大数据、机器学习、深度学习等技术。
【目录】: 目录

第　1章开篇

1.1　什么是语音识别　2

1.2　语音识别的历史　4

1.3　语音识别的用处　6

1.4　为什么很难　8

1.5　本书的目标　10

1.6　小结　12

第　2章什么是语音

2.1　语音学　16

2.2　声音是如何产生的——发音语音学　16

2.3　声音的真面目——声学语音学　23

2.4　声音是如何被感知的——感知语音学　29

2.5　总结　32

第3章　统计模式识别

3.1　什么是模式识别　34

3.2　统计模式识别的思路　36

3.3　生成模型的训练　40

3.4　判别模型的训练　44

3.5　统计语音识别的概要　45

3.6　总结　48

第4章　有限状态自动机

4.1　什么是有限状态自动机　50

4.2　用有限状态自动机表达的语言　53

4.3　各种各样的有限状态自动机　55

4.4　有限状态自动机的性质　58

4.5　总结　59

第5章　语音特征的提取

5.1　特征提取的步骤　62

5.2　语音信号的数字化　64

5.3　人类听觉模拟——频谱分析　67

5.4　另一个精巧设计——倒谱分析　69

5.5　噪声去除　72

5.6　总结　73

第6章　语音识别：基本声学模型

6.1　声学模型的单位　76

6.2　什么是隐马尔可夫模型　78

6.3　隐马尔可夫模型的概率计算　81

6.4　状态序列的估计　83

6.5　参数训练　85

6.6　总结　89

第7章　语音识别：高级声学模型

7.1　实际的声学模型　92

7.2　判别训练　94

7.3　深度学习　96

7.4　总结　98

第8章　语音识别：语言模型

8.1　基于语法规则的语言模型　100

8.2　统计语言模型的思路　101

8.3　统计语言模型的建立方法　103

8.4　总结　108

第9章　语音识别：搜索算法

9.1　填补声学模型和语言模型之间的空隙　112

9.2　状态空间搜索　113

9.3　用树形字典减少浪费　115

9.4　用集束搜索缩小范围　116

9.5　用多次搜索提高精度　118

9.6　总结　120

第　10章语音识别：WFST运算

10.1　WFST的合成运算　124

10.2　确定化　129

10.3　权重移动　133

10.4　最小化　134

10.5　总结　135

第　11章语音识别：使用 WFST进行语音识别

11.1　WFST转换　138

11.2　声学模型的 WFST转换　139

11.3　发音字典的 WFST转换　141

11.4　语言模型的 WFST转换　142

11.5　WFST的搜索　144

11.6　总结　145

第　12章语义分析

12.1　什么是语义表示　148

12.2　基于规则的语义分析处理　151

12.3　基于统计的语义分析处理　153

12.4　智能手机的语音服务　156

12.5　总结　159

第　13章语音对话系统的实现

13.1　对话系统的开发方法　162

13.2　基于规则的对话管理　164

13.3　针对对话管理的统计方法　166

13.4　总结　170

第　14章终篇

14.1　语音分析工具 WaveSurfer　174

14.2　HMM构建工具 HTK　175

14.3　大词汇量连续语音识别引擎 Julius　177

14.4　虚拟代理对话工具 MMDAgent　179

14.5　深入学习之路　180

思考题的解答　182

参考文献　188

后　记　191

点击展开点击收起

— 没有更多了 —