• 语音识别理论与实践
21年品牌 40万+商家 超1.5亿件商品

语音识别理论与实践

正版保障 假一赔十 可开发票

25.87 6.2折 42 全新

库存19件

广东广州
认证卖家担保交易快速发货售后保障

作者莫宏伟主编

出版社中国水利水电出版社

ISBN9787522619026

出版时间2023-10

装帧平装

开本其他

定价42元

货号14376831

上书时间2024-10-01

灵感书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录

前言


第1章 绪论

1.1 语音识别简史

1.1.1 语音识别早期探索

1.1.2 概率模型一统江湖

1.1.3 神经网络异军突起

1.1.4 商业应用推波助澜

1.2 国内发展现状

1.3 语音识别框架

1.3.1 经典方法

1.3.2 概率模型

1.3.3 深度神经网络-隐马尔可夫(DNN-HMM)模型

1.3.4 端到端语音识别

1.4 开源工具与数据集

1.4.1 深度学习框架

1.4.2 开源工具

1.4.3 数据集

本章小结

课后习题


第2章 语音基础知识

2.1 语音信号基础

2.1.1 声波的特性

2.1.2 声音的采集装置

2.1.3 声音的采样

2.1.4 声音的量化

2.1.5 语音的编码

2.2 声学特征提取

2.2.1 预处理

2.2.2 傅里叶变换

2.2.3 听觉特性

2.2.4 线性预测

2.2.5 倒谱分析

2.2.6 声学特征

本章小结

课后习题


第3章 声学模型

3.1 高斯混合模型

3.1.1 概率统计

3.1.2 高斯分布

3.1.3 GMM的组成和表示

3.2 隐马尔可夫模型

3.2.1 隐马尔可夫模型基本概念

3.2.2 隐马尔可夫模型的定义

3.2.3 隐马尔可夫模型的三个基本问题

3.3 高斯混合模型-隐马尔可夫模型

3.4 基于隐马尔可夫模型的语音识别

3.4.1 建模单元

3.4.2 发音过程与隐马尔可夫模型状态

3.4.3 串接隐马尔可夫模型

本章小结

课后习题


第4章 语言模型

4.1 n-gram模型

4.2 评价指标

4.3 平滑技术

4.3.1 Good-Turing折扣法

4.3.2 Jelinek-Mercer插值法

4.3.3 Kneser-Ney插值法

4.3.4 Katz回退法

4.4 语言模型的训练

4.5 预训练语言模型

4.5.1 基于自回归语言模型的预训练技术

4.5.2 基于自编码语言模型的预训练技术

4.5.3 基于序列到序列语言模型的预训练技术

4.5.4 基于前缀语言模型的预训练技术

4.5.5 基于排列语言模型的预训练技术

4.5.6 预训练技术的改进方法

本章小结

课后习题


第5章 加权有限状态解码器

5.1 基于动态网络的Viterbi解码

5.2 加权有限状态转换器理论

5.2.1 基本概念

5.2.2 半环

5.3 HCLG构建

5.3.1 语料准备

5.3.2 构建语法模型

……

第6章 深度神经网络模型

第7章 端到端语音识别

第8章 Kaldi实战

第9章 语音交互系统

参考文献

附录 课后习题答案



精彩内容

本书主要介绍语音识别原理及其相关应用。全书共9章,分为五大部分:第一部分(第1章)介绍语音识别的发展历史和语音识别领域常用的数据集与工具箱;第二部分(第2章)介绍在语音识别领域常用的语音信号基础知识和声学特征的提取;第三部分(第3章至第7章)详细介绍语音识别的声学模型、语言模型、解码工具,并对语音识别领域的研究热点(端到端语音识别)进行探讨;第四部分(第8章)利用语音识别开源工具包Kaldi进行语音识别实战,包括Kaldi的安装以及如何训练aishell语音识别工程;第五部分(第9章)结合序列到序列的语音识别模型和序列到序列的问答模型来构建语音交互系统。



—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP