数字语音处理理论与应用
买书,就上二手书海官方企业店,清仓处理,真实库存,特价旧书,收藏店铺,优先发货! ps:下午三点之前的订单当天发货,之后明天发货,特殊情况除外。
¥
38.85
3.0折
¥
128
八五品
库存3件
作者[美]Lawrence R.(劳伦斯 R. 拉比纳)、[美]Ronald W. S 著;刘加、张卫强、何亮、路程 译
出版社电子工业出版社
出版时间2015-11
版次1
装帧平装
货号wk-203083
上书时间2024-11-01
商品详情
- 品相描述:八五品
-
正版二手,几十万种图书无法都提供实拍图,但均为7-9成新,无缺页、会有瑕疵或者少许磨损 、或多或少都会有划线、笔记、涂写等,不影响使用。均不保证有光盘、卡片等,辅导习题类笔记较多;书籍有多封面的新老封面随机发货,内容一致,不影响使用,介意勿拍!图片孔网自动匹配,图片与标题不符时以及图片为套装,与标题不符时的下单前请咨询客服,望周知!
图书标准信息
-
作者
[美]Lawrence R.(劳伦斯 R. 拉比纳)、[美]Ronald W. S 著;刘加、张卫强、何亮、路程 译
-
出版社
电子工业出版社
-
出版时间
2015-11
-
版次
1
-
ISBN
9787121275906
-
定价
128.00元
-
装帧
平装
-
开本
16开
-
纸张
胶版纸
-
页数
664页
-
字数
1196千字
-
正文语种
简体中文
- 【内容简介】
-
本书是作者继1978年出版的经典教材《语音信号的数字处理》之后的又一著作,全书除有简练精辟的基础知识介绍外,系统讲解了近30年来语音信号处理的新理论、新方法和在应用上的新进展。全书共14章,分四部分:第一部分介绍语音信号处理基础知识,主要包括数字信号处理基础、语音产生机理、(人的)听觉和听感知机理,以及声道中的声传播原理;第二部分介绍语音信号的时、频域表示和分析;第三部分介绍语音参数估计方法;第四部分介绍语音信号处理的应用,主要包括语音编码、语音和音频信号的频域编辑、语音合成、语音识别及自然语言理解。
- 【作者简介】
-
Lawrence R. Rabiner, 美国工程院和美国科学院院士,美国声学学会、IEEE、贝尔实验室、AT&T会士,以及Eta Kappa Nu、Sigma Xi、Tau Beta Pi等荣誉学会会员。曾担任美国声学学会副主席、IEEE Trans、ASSP主编和IEEE Proceedings编委。主要研究方向包括通信、控制与信号处理、数字信号处理、数字语音处理、多媒体通信、多模态处理、Rabiner教授于2002年从AT&T退休,随后担任罗格斯大学和加州大学圣巴巴拉分校教授,及罗格斯大学先进信息处理中心副主任。
刘加,清华大学教授,主要从事数字信号处理与数字语音信号处理的教学与研究工作,发表论文多篇,在教学与研究方面获得多面荣誉。主要研究方向为信号与信号处理,语音通信等。
- 【目录】
-
第1章 数字语音处理介绍1
1.1 语音信号2
1.2 语音堆5
1.3 数字语音处理的应用6
1.3.1 语音编码6
1.3.2 文语转换合成7
1.3.3 语音识别和其他模式匹配问题7
1.3.4 其他语音应用8
1.4 参考文献评论9
1.5 小结10
第2章 数字信号处理基础回顾11
2.1 引言11
2.2 离散时间信号与系统11
2.3 信号与系统的变换表示13
2.3.1 连续时间傅里叶变换14
2.3.2 z变换14
2.3.3 离散时间傅里叶变换16
2.3.4 离散傅里叶变换17
2.3.5 DTFT的采样18
2.3.6 DFT的性质19
2.4 数字滤波器基础20
2.4.1 FIR系统20
2.4.2 FIR滤波器设计方法21
2.4.3 FIR滤波器实现23
2.4.4 IIR系统23
2.4.5 IIR滤波器设计方法23
2.4.6 IIR系统的实现24
2.4.7 关于FIR和IIR滤波器设计
方法的说明27
2.5 采样27
2.5.1 采样原理27
2.5.2 语音和音频波形的采样率28
2.5.3 改变采样信号的采样率29
2.5.4 抽取29
2.5.5 插值32
2.5.6 非整数采样率变化33
2.5.7 FIR滤波器的优点34
2.6 小结34
习题34
第3章 人类语音产生基础42
3.1 引言42
3.2 语音产生过程42
3.2.1 语音产生机理42
3.2.2 语音特征与语音波形46
3.2.3 语音生成的声学理论49
3.3 语音的短时傅里叶表示50
3.4 声音语音学53
3.4.1 元音55
3.4.2 双元音60
3.4.3 声音的辨音特质60
3.4.4 半元音61
3.4.5 鼻音62
3.4.6 清擦声64
3.4.7 浊擦音65
3.4.8 浊塞音67
3.4.9 清塞音67
3.4.10 破擦声和耳语音69
3.5 美式英语音素的辨音特质70
3.6 小结70
习题71
第4章 听觉、听感知模型和语音感知80
4.1 引言80
4.2 语言链80
4.3 解剖学和耳的功能82
4.3.1 基底膜机理84
4.3.2 临界频带85
4.4 声音的感知85
4.4.1 声音的强度87
4.4.2 人的听觉范围87
4.4.3 响度级90
4.4.4 响度91
4.4.5 音高91
4.4.6 掩蔽效应――音调92
4.4.7 掩蔽效应――噪声93
4.4.8 时域掩蔽效应94
4.4.9 语音编码中的掩蔽效应95
4.4.10 参数鉴别――JND95
4.5 听感知模型96
4.5.1 感知线性预测96
4.5.2 Seneff听感知模型97
4.5.3 Lyon听感知模型99
4.5.4 整体区间直方图方法100
4.5.5 听感知模型小结101
4.6 人类语音感知实验101
4.6.1 噪声中的声音感知102
4.6.2 噪声中的语音感知103
4.7 语音质量和可懂度测量104
4.7.1 主观测试105
4.7.2 语音质量的客观测量106
4.8 小结107
习题107
第5章 声道中的声音传输109
5.1 语音产生的声学原理109
5.1.1 声音传播109
5.1.2 例子:均匀无损声管110
5.1.3 声道中损耗的影响114
5.1.4 嘴唇的辐射影响117
5.1.5 元音的声道传输函数120
5.1.6 鼻腔耦合的影响123
5.1.7 声道中声音的激励123
5.1.8 基于声学理论的模型127
5.2 无损声管模型128
5.2.1 级联无损声管中的波形传播128
5.2.2 边界条件130
5.2.3 与数字滤波器的关系134
5.2.4 无损声管模型的传输函数137
5.3 采样语音信号的数字模型141
5.3.1 声道建模141
5.3.2 辐射模型143
5.3.3 激励模型144
5.3.4 完整模型144
5.4 小结146
习题146
第6章 语音信号处理的时域方法153
6.1 引言153
6.2 语音的短时分析154
6.2.1 短时分析的通用框架156
6.2.2 短时分析中的滤波和采样156
6.3 短时能量和短时幅度159
6.3.1 基于短时能量的自动增益
控制160
6.3.2 短时幅度162
6.4 短时过零率163
6.5 短时自相关函数169
6.6 修正短时自相关函数173
6.7 短时平均幅度差分函数176
6.8 小结177
习题177
第7章 频域表示183
7.1 引言183
7.2 离散时间傅里叶分析184
7.3 短时傅里叶分析186
7.3.1 DTFT解释187
7.3.2 DFT实现188
7.3.3 加窗对分辨率的影响188
7.3.4 关于短时自相关函数193
7.3.5 线性滤波解释193
7.3.6 时域和频域中 的
采样率197
7.4 频谱显示199
7.5 合成的重叠相加法206
7.5.1 精确重建的条件206
7.5.2 合成窗的应用211
7.6 合成的滤波器组求和方法212
7.7 时间抽取滤波器组217
7.7.1 通用FBS抽取系统218
7.7.2 最大抽取滤波器组221
7.8 双通道滤波器组222
7.8.1 正交镜像滤波器组223
7.8.2 QMF滤波器组的多相结构225
7.8.3 共轭正交滤波器225
7.8.4 树形结构滤波器组226
7.9 使用FFT实现FBS方法228
7.9.1 FFT分析技术228
7.9.2 FFT合成技术230
7.10 OLA再论232
7.11 修正的STFT233
7.11.1 乘性修正233
7.11.2 加性修正236
7.11.3 时间标度修正:相位声码器237
7.12 小结242
习题242
第8章 倒谱和同态语音处理255
8.1 简介255
8.2 卷积同态系统256
8.2.1 DTFT表示257
8.2.2 z变换表示260
8.2.3 复倒谱的性质260
8.2.4 复倒谱分析实例262
8.2.5 最小和最大相位信号264
8.3 语音模型的同态分析265
8.3.1 浊音模型的同态分析266
8.3.2 清音模型的同态分析271
8.4 计算语音的短时倒谱和复倒谱273
8.4.1 基于离散傅里叶变换的计算273
8.4.2 基于z变换的计算276
8.4.3 最小相位和最大相位信号的
递归计算278
8.5 自然语音的同态滤波279
8.5.1 语音短时倒谱分析模型280
8.5.2 使用多项式根的短时
分析实例281
8.5.3 应用DFT的浊音分析282
8.5.4 最小相位分析286
8.5.5 应用DFT的清音分析287
8.5.6 短时倒谱分析小结289
8.6 全极点模型的倒谱分析290
8.7 倒谱距离度量291
8.7.1 线性滤波补偿292
8.7.2 加权倒谱距离度量292
8.7.3 群时延频谱293
8.7.4 mel频率倒谱系数294
8.7.5 动态倒谱特征296
8.8 小结296
习题296
第9章 语音信号的线性预测分析301
9.1 引言301
9.2 线性预测分析的基本原理302
9.2.1 线性预测分析方程的基本
公式304
9.2.2 自相关法305
9.2.3 协方差法307
9.2.4 小结308
9.3 模型增益的计算309
9.4 线性预测分析的频域解释311
9.4.1 线性预测短时频谱分析311
9.4.2 均方预测误差的频域解释313
9.4.3 模型阶数p的作用316
9.4.4 线性预测语谱图318
9.4.5 与其他谱分析方法的对比320
9.4.6 选择性线性预测321
9.5 LPC方程组的解322
9.5.1 Cholesky分解322
9.5.2 Levinson-Durbin算法325
9.5.3 格型公式及其解328
9.5.4 计算需求比较334
9.6 预测误差信号335
9.6.1 归一化均方误差的其他
表示法338
9.6.2 LPC参数值的实验评估339
9.6.3 归一化误差随帧位置的变化342
9.7 LPC多项式A(z)的一些性质344
9.7.1 预测误差滤波器的最小
相位性质344
9.7.2 PARCOR系数和LPC多项式的
稳定性344
9.7.3 最佳LP模型根的位置345
9.8 线性预测分析与无损声管模型的
关系348
9.9 LP参数的替代表示351
9.9.1 预测误差多项式的根351
9.9.2 全极点系统 的冲激响应352
9.9.3 冲激响应的自相关352
9.9.4 倒谱352
9.9.5 预测器多项式的自相关系数353
9.9.6 PARCOR系数353
9.9.7 对数面积比系数353
9.9.8 线性谱对参数355
9.10 小结357
习题357
第10章 语音参数的估计算法368
10.1 引言368
10.2 中值平滑和语音处理369
10.3 语音背景/静音的鉴别373
10.4 浊音/清音/静音检测的一种贝叶斯
方法378
10.5 基音周期估计(基音检测)383
10.5.1 理想的基音周期估计383
10.5.2 使用一种并行处理方法的
基音周期估计386
10.5.3 自相关、周期性和中心削波390
10.5.4 一种基于自相关的基音
估计器395
10.5.5 频域中的基音检测397
10.5.6 用于基音检测的同态系统399
10.5.7 使用线性预测参数的基音
检测403
10.6 共振峰估计405
10.6.1 共振峰估计的同态系统405
10.6.2 使用线性预测参数的共振峰
分析410
10.9 小结412
习题412
第11章 语音信号数字编码424
11.1 引言424
11.2 语音信号采样426
11.3 语音统计模型427
11.3.1 自相关函数和功率谱427
11.4 瞬时量化433
11.4.1 均匀量化噪声分析435
11.4.2 瞬时压扩(压缩/扩展)442
11.4.3 最优SNR量化448
11.5 自适应量化453
11.5.1 前馈自适应454
11.5.2 反馈自适应458
11.5.3 自适应量化的总体评价461
11.6 语音模型参数的量化461
11.6.1 语音模型的标量量化462
11.6.2 向量量化463
11.6.3 VQ实现的要素466
11.7 差分量化的一般理论470
11.8 ?调制476
11.8.1 线性?调制476
11.8.2 自适应?调制479
11.8.3 ?调制中的高阶预测器481
11.8.4 LDM到PCM的转换482
11.8.5 Δ-Σ模数转换485
11.9 差分脉冲编码调制486
11.9.1 自适应量化DPCM487
11.9.2 自适应预测DPCM488
11.9.3 ADPCM系统的对比491
11.10 ADPCM编码器的改善492
11.10.1 ADPCM编码的基音预测493
11.10.2 DPCM系统中的噪声整形495
11.10.3 完全量化的自适应预测
编码器498
11.11 综合分析语音编码502
11.11.1 A-b-S语音编码系统的
基本原理504
11.11.2 多脉冲LPC507
11.11.3 码激励线性预测(CELP)509
11.11.4 比特率为4800bps的CELP
编码器514
11.11.5 低延时CELP(LD-CELP)
编码516
11.11.6 A-b-S语音编码小结517
11.12 开环语音编码器517
11.12.1 二态激励模型518
11.12.2 LPC声码器519
11.12.3 残差激励LPC521
11.12.4 混合激励系统522
11.13 语音编码器的应用522
11.13.1 语音编码器的标准化523
11.13.2 语音编码器的质量评价524
11.14 小结526
习题526
第12章 语音和音频的频域编码541
12.1 引言541
12.2 历史回顾542
12.2.1 通道声码器542
12.2.2 相位声码器545
12.2.3 早期的STFT数字编码
工作546
12.3 子带编码546
12.3.1 理想的2子带编码器547
12.3.2 子带编码的量化器552
12.3.3 子带语音编码器示例552
12.4 自适应变换编码554
12.5 音频编码的感知模型556
12.5.1 短时分析和合成556
12.5.2 临界带理论回顾557
12.5.3 听阈558
12.5.4 STFT的声压校正559
12.5.5 掩蔽效应回顾560
12.5.6 掩蔽音的识别562
12.5.7 STFT的量化564
12.6 MPEG-1音频编码标准566
12.6.1 MPEG-1滤波器组566
12.6.2 通道信号的量化571
12.6.3 MPEG-1层II和层III573
12.7 其他语音编码标准574
12.8 小结574
习题574
第13章 文语转换合成方法582
13.1 简介582
13.2 文本分析582
13.2.1 文档结构检测583
13.2.2 文本正则化583
13.2.3 语义分析584
13.2.4 语音学分析584
13.2.5 多音词消歧585
13.2.6 字母-声音转换585
13.2.7 韵律分析586
13.2.8 韵律指定586
13.3 语音合成方法的发展587
13.4 早期的语音合成方法588
13.4.1 声码器588
13.4.2 终端模拟语音合成590
13.4.3 发音器官语音合成方法591
13.4.4 单词拼接合成593
13.5 单元选择方法595
13.5.1 拼接单元的选择595
13.5.2 自然语音中的单元选择597
13.5.3 从文本中进行在线单元选择597
13.5.4 单元选择问题597
13.5.5 转移代价和单元代价599
13.5.6 单元边界平滑和修改600
13.5.7 单元选择方法的实验结果605
13.6 TTS的未来需求605
13.7 可视化TTS605
13.7.1 VTTS处理606
13.8 小结608
习题608
第14章 自动语音识别和自然语言理解610
14.1 引言610
14.2 自动语音识别简述611
14.3 语音识别的整体过程611
14.4 构建一个语音识别系统612
14.4.1 识别任务613
14.4.2 识别特征集613
14.4.3 识别训练614
14.4.4 测试与性能评估614
14.5 ASR中的决策过程614
14.5.1 ASR问题的贝叶斯原理615
14.5.2 Viterbi算法618
14.5.3 步骤1:声学建模619
14.5.4 步骤2:语言模型620
14.6 步骤3:搜索问题623
14.7 简单的ASR系统:孤立的数字识别624
14.8 语音识别器的性能评估625
14.9 口语理解628
14.10 对话管理和口语生成629
14.11 用户界面631
14.12 多模态用户界面631
14.13 小结632
习题632
附录A 语音和音频处理演示637
附录B 频域微分方程求解644
术语表646
点击展开
点击收起
— 没有更多了 —
正版二手,几十万种图书无法都提供实拍图,但均为7-9成新,无缺页、会有瑕疵或者少许磨损 、或多或少都会有划线、笔记、涂写等,不影响使用。均不保证有光盘、卡片等,辅导习题类笔记较多;书籍有多封面的新老封面随机发货,内容一致,不影响使用,介意勿拍!图片孔网自动匹配,图片与标题不符时以及图片为套装,与标题不符时的下单前请咨询客服,望周知!
以下为对购买帮助不大的评价