• 语音识别服务实战
21年品牌 40万+商家 超1.5亿件商品

语音识别服务实战

正版新书 新华官方库房直发 可开电子发票

81.93 6.4折 128 全新

库存2件

江苏南京
认证卖家担保交易快速发货售后保障

作者杨学锐//晏超//刘雪松

出版社电子工业出版社

ISBN9787121425905

出版时间2022-03

版次1

装帧平装

开本16开

纸张胶版纸

页数354页

字数406千字

定价128元

货号SC:9787121425905

上书时间2024-12-14

问典书店

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
"杨学锐
大疆创新语音交互算法负责人,复旦大学及Turku大学硕士,长期从事语音算法、深度学习、人工智能等领域的研究与商业落地,在相关领域发表多篇论文及专利。

晏超
北京邮电大学硕士,曾任职于HP Labs, Cisco, Technicolor等公司。现为云从科技语音算法负责人,从事语音识别、声纹识别、说话人日志、语音合成等方向的算法研发工作,构建了云从科技整套语音算法引擎与应用服务平台。

刘雪松
OPPO音频算法专家,复旦大学硕士,曾任职于美国国家仪器、声网、云从科技等公司。在信号处理、音频算法和语音算法等领域有丰富的实战经验,在相关领域发表多篇论文及专利。"
主编推荐:
《语音识别服务实战》系统介绍语音交互流程中的语音前端处理、语音识别和说话人日志等算法原理,重点介绍如何基于WebRTC,Kaldi和gRPC,从零构建产业界稳定、高性能、可商用的语音服务,具有很强的实践性。
媒体评论:
"近年来,随着声传感、声信号处理、模式识别、机器学习、云计算理论与方法的快速发展,以及不同场景下大规模带标注语音数据的出现,语音识别技术再次经历了跨越式发展,也逐渐被大规模推广应用。本领域中介绍近期新技术和应用的著作不少,但大多数主要专注于某些专题的方法和算法。相比而言,本书涵盖的内容比较广泛,既包括前端语音信号处理的基础方法,如端点检测、降噪、回声消除、麦克风阵列和声源测向/定位等,也包括语音识别、模型训练、声纹识别等后端处理技术。书中还介绍了前端和后端处理常用的基础工具,并提供了大量应用的实例。相信读者,尤其是工作在该领域一线的系统、产品与应用研发人员,一定能获益匪浅。                                                         
陈景东  西北工业大学教授、博导、智能声学与临境通信中心主任,
国家特聘专家,IEEE Fellow,“杰出青年科学基金”获得者

一套完整的语音识别系统需要采集设备、前端处理、后端模型前后打通、整体优化,才能达到理想的识别效果。本书作者从事语音算法研究多年,具有丰富的工业应用经验,把项目实战过程和Kaldi开源代码完整详细地总结到书中,技术人员可从中受益,搭建工业级的语音识别系统。
洪青阳 厦门大学副教授、天聪智能创始人

《语音识别服务实战》是一本面向语音识别从业人员的参考书,既包括语音信号的基础知识,也包括构造实用识别系统的全栈过程,内容完整丰富。特别是,该书以开源数据和开源代码为基础进行技术描述,具有很强的实操性,有利于打破知识壁垒,帮助更多青年、学生和非语音方向的工程师快速进入该领域,对行业的发展产生积极的促进作用。
                                         王东清华大学  

在过去的十多年中,语音识别技术的发展速度超出
...
内容简介:
    随着语音算法技术的不断发展与完善,如何进行工程落地成为语音商业应用中普遍面临的问题。工程落地不仅要考虑模型效果,还要考虑资源占用、模块联调且整个架构要具有可靠性、可扩展性和可维护性。
    本书围绕如何从零构建一个完整的语音识别系统,深入浅出地介绍了语音识别前端算法、语音识别算法及说话人日志算法原理;基于Kaldi的模型训练;语音识别工程落地和服务搭建。
    本书适合作为语音技术研究人员及对语音技术感兴趣的开发人员的参考用书。
目录:
第1章  语音识别概述
  1.1  语音识别发展历程
  1.2  语音识别产业与应用
    1.2.1  消费级市场
    1.2.2  企业级市场
  1.3  常用语音处理工具
    1.3.1  WebRTC
    1.3.2  Kaldi
    1.3.3  端到端语音识别工具包
第2章  语音信号基础
  2.1  语音信号的声学基础
    2.1.1  语音产生机理
    2.1.2  语音信号的产生模型
    2.1.3  语音信号的感知
  2.2  语音信号的数字化和时频变换
    2.2.1  语音信号的采样、量化和编码
    2.2.2  语音信号的时频变换
  2.3  本章小结
第3章  语音前端算法
  3.1  语音前端算法概述
  3.2  VAD
    3.2.1  基于门限判决的VAD
    3.2.2  基于高斯混合模型的VAD
    3.2.3  基于神经网络的VAD
  3.3  单通道降噪
    3.3.1  谱减法
    3.3.2  维纳滤波法
    3.3.3  音乐噪声和参数谱减法
    3.3.4  贝叶斯准则下的MMSE
    3.3.5  噪声估计
    3.3.6  基于神经网络的单通道降噪
  3.4  回声消除
    3.4.1  回声消除概述
    3.4.2  线性自适应滤波
    3.4.3  分块频域自适应滤波器
    3.4.4  双讲检测
    3.4.5  延迟估计
    3.4.6  残留回声消除
    3.4.7 
...

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP