• 音频信息检索理论与技术
  • 音频信息检索理论与技术
  • 音频信息检索理论与技术
21年品牌 40万+商家 超1.5亿件商品

音频信息检索理论与技术

16 3.3折 48 九品

仅1件

江苏徐州
认证卖家担保交易快速发货售后保障

作者韩纪庆 著

出版社科学出版社

出版时间2011-03

版次1

装帧平装

货号39-6

上书时间2020-06-04

江南之路

六年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
图书标准信息
  • 作者 韩纪庆 著
  • 出版社 科学出版社
  • 出版时间 2011-03
  • 版次 1
  • ISBN 9787030303721
  • 定价 48.00元
  • 装帧 平装
  • 开本 16开
  • 纸张 胶版纸
  • 页数 256页
  • 字数 307千字
【内容简介】
《音频信息检索理论与技术》系统地介绍语音检索研究的相关理论、技术与方法,以及该学科领域取得的新进展。内容将涉及基于语音内容的信息检索、基于说话人特征的信息检索、基于音频及音乐特征的信息检索等范畴。《音频信息检索理论与技术》将从语音检索的理论框架、适合检索要求的语音特征表示、高效索引的构建、高速搜索算法、典型的实用技术,以及典型应用实例等方面系统地介绍语音检索相关的理论与技术。
【目录】
前言
第一部分音频信息检索的发展与理论基础
第1章绪论
1.1信息检索技术的分类及进展
1.1.1概述
1.1.2文本信息检索
1.1.3多媒体信息检索
1.2音频信息检索技术的发展
1.2.1语音文档检索
1.2.2说话人检索
1.2.3音乐检索
1.3音频信息检索的应用
1.4本书的构成
参考文献
第2章音频信息检索的基础
2.1人类对音频信息的认知机理
2.1.1听觉的生理基础
2.1.2听觉的感知机制
2.1.3听觉特性
2.2音频信号的数字处理及特征表示
2.2.1信号的统计特征
2.2.2感知特征
2.3音频信息检索框架及模型
2.4音频信息检索的评价
参考文献
第二部分表示级的音频检索
第3章基于直接匹配的音频样例检索方法
3.1基于分段的实时检索方法
3.1.1片段划分
3.1.2基于检索窗的检索控制
3.1.3基于分段的检索方法
3.1.4快速分段检索方法
3.2MPEG-1压缩域模糊分类的检索方法
3.2.1MPEG音频编码简介
3.2.2MPEG-1压缩域特征选择和提取
3.2.3基于MPEG-1压缩域模糊分类的检索方法
参考文献
第4章基于索引的音频样例检索方法
4.1局部敏感哈希索引方法
4.1.1局部敏感哈希
4.1.2ρ-稳定分布局部敏感哈希
4.1.3ρ-稳定分布局部敏感哈希音频索引方法
4.2基于局部敏感哈希倒排索引的检索方法
4.2.1基于局部敏感哈希的倒排索引构造
4.2.2基于局部敏感哈希倒排索引的搜索
4.3基于树与链表混合索引的检索方法
4.3.1模糊直方图模型
4.3.2树与链表混合索引构造
4.3.3基于树与链表混合索引的搜索
4.3.4时间复杂度分析
参考文献
第5章基于GPU通用计算的快速音频样例检索方法
5.1通用图形处理器与统一计算设备框架
5.1.1通用图形处理器
5.1.2统一计算设备框架
5.2检索算法GPU加速的可行性分析
5.2.1检索算法可移植性分析
5.2.2检索算法计算特点分析
5.3检索算法GPU加速的实现
5.3.1以线程为粒度的算法实现
5.3.2以线程块为粒度的算法实现
5.3.3加速效果比较
参考文献
第三部分语义级语音文档检索
第6章语音文档检索的预处理技术
6.1语音文档检索系统的组成
6.2检索系统中的预处理技术
6.2.1连续语音识别
6.2.2关键词检出
6.3语音文档检索的评价指标
参考文献
第7章语音文档检索的索引和搜索技术
7.1基于关键词检出的检索方法
7.2基于语音识别器最优候选的检索方法
7.2.1基于大词表连续语音识别器最优候选的检索方法
7.2.2基于子词识别器最优候选的检索方法
7.3基于音节网格搜索的检索方法
7.3.1音节网格的若干定义及性质
7.3.2基于音节网格搜索的检索方法
7.3.3索引去冗余方法
7.3.4检索性能分析
7.4基于音节倒排索引的检索方法
7.4.1倒排索引结构
7.4.2采用时间匹配机制的检索方法
7.4.3采用位置匹配机制的检索方法
7.4.4检索性能分析
7.5基于后验概率邻接音节矩阵的检索方法
7.5.1语音文档的表示
7.5.2网格的邻接音节后验概率矩阵
7.5.3语音文档的邻接音节后验概率矩阵
7.5.4检索方法描述
7.5.5基于韵律加权的索引修正
7.5.6检索性能分析
参考文献
第8章语音文档检索中的容错技术
8.1基于模糊匹配策略的容错方法
8.2基于融合策略的容错方法
8.2.1索引层面的融合
8.2.2分数层面的融合
8.3基于扩充网格的容错方法
8.3.1算法的基本思想
8.3.2基于局部路径的简化计算
8.3.3基于扩充网格的检索精度提高方法
8.3.4检索性能分析
8.4基于词片语言模型的容错方法
8.4.1词片
8.4.2基于互信息的词片选择算法
8.4.3基于词片的语言模型
8.4.4采用词片识别器的检索方法
参考文献
第四部分语义级的说话人检索
第9章说话人检索
9.1说话人分割
9.2检索中的说话人识别技术
9.2.1基于GMM的识别方法
9.2.2基于GMM-UBM的识别方法
9.3直接利用说话人识别实现的检索技术
9.3.1极低错误接受率的实现
9.3.2训练语料不充分问题的解决
9.4间接利用说话人识别实现的检索技术
9.4.1锚模型索引方法
9.4.2GMM模型索引方法
参考文献
第五部分语义级的音乐检索
第10章音乐自动标注
10.1音乐声学基础
10.1.1乐音的感知
10.1.2音程、音律、音名与音高标准
10.1.3音乐的要素
10.2音乐自动标注方法及存在的问题
10.3基于谐波结构信息的音乐标注
10.3.1基于BP神经网络的起始点检测
10.3.2基于谐波结构信息的多基频估计方法
10.4基于半音域频率系数的歌曲旋律提取
10.4.1半音域频率系数
10.4.2基于viterbi方法的旋律提取
参考文献
第11章音乐检索
11.1哼唱检索
11.1.1基于规则的哼唱旋律提取
11.1.2乐曲库的索引方法
11.1.3旋律匹配
11.2拍打检索
11.2.1特征提取
11.2.2基于DTW的匹配计算
11.3基于色度图的复调音乐检索
11.3.1色度
11.3.2色度图
11.3.3离散色度图和色度特征
11.3.4基于色度的相关计算与检索
参考文献
点击展开 点击收起

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP