PyTorch语音识别实战
正版新书 新华官方库房直发 可开电子发票
¥
50.37
7.3折
¥
69
全新
库存19件
作者王晓华
出版社清华大学出版社
ISBN9787302655657
出版时间2024-03
版次1
装帧平装
开本其他
纸张胶版纸
定价69元
货号SC:9787302655657
上书时间2025-01-09
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
王晓华,高校计算机专业讲师,研究方向为云计算、大数据与人工智能。其创作的部分图书:《从零开始大模型开发与微调:基于PyTorch与ChatGLM》《PyTorch 2.0深度学习从零开始学》《Python机器学习与可视化分析实战》《谷歌JAX深度学习从零开始学》《Spark 3.0大数据分析与挖掘:基于机器学习》《TensorFlow深度学习应用实践》《TensorFlow语音识别实战》《TensorFlow 2.0深度学习从零开始学》《深度学习的数学原理与实现》。
内容简介:
《PyTorch语音识别实战》使用PyTorch 2.0作为语音识别的基本框架,循序渐进地引导读者从搭建环境开始,逐步深入到语音识别基本理论、算法以及应用实践,是较好的一本语音识别技术图书。本书配套示例源码、数据集、PPT课件等资源。
《PyTorch语音识别实战》分为13章,内容包括语音识别之路、PyTorch 2.0深度学习环境搭建、音频信号处理的理论与Python实战、音频处理常用工具包Librosa详解与实战、基于DNN的语音情绪分类识别、一学就会的深度学习基础算法、基于PyTorch卷积层的语音情绪分类识别、词映射与循环神经网络、基于Whisper的语音转换实战、注意力机制与注意力模型详解、鸟叫的多标签分类实战、多模态语音转换模型基础、GLM架构多模态语音文字转换实战。
《PyTorch语音识别实战》内容详尽、示例丰富,适合作为语音识别初学者、深度学习初学者、语音识别技术人员的推荐参考书,同时也非常适合作为高等院校或高职高专深度学习、语音识别等课程的教材。
目录:
第1章 语音识别之路 1
1.1 何谓语音识别 1
1.2 语音识别为什么那么难 2
1.3 语音识别之路——语音识别的发展历程 3
1.3.1 高斯混合-隐马尔科夫时代 4
1.3.2 深度神经网络-隐马尔科夫时代 5
1.3.3 基于深度学习的端到端语音识别时代 6
1.3.4 多模态架构的语音识别与转换 7
1.4 基于深度学习的语音识别的未来 8
1.5 本章小结 8
第2章 PyTorch 2.0深度学习环境搭建 9
2.1 环境搭建1:安装Python 9
2.1.1 Miniconda的下载与安装 9
2.1.2 PyCharm的下载与安装 12
2.1.3 Python代码小练习:计算softmax函数 15
2.2 环境搭建2:安装PyTorch 2.0 16
2.2.1 Nvidia 10/20/30/40系列显卡选择的GPU版本 16
2.2.2 PyTorch 2.0 GPU Nvidia运行库的安装 16
2.2.3 PyTorch 2.0小练习:Hello PyTorch 19
2.3 实战:基于特征词的语音唤醒 20
2.3.1 数据的准备 20
2.3.2 数据的处理 21
2.3.3 模型的设计 24
2.3.4 模型的数据输入方法 24
2.3.5 模型的训练 25
2.3.6 模型的结果和展示 26
2.4 本章小结 27
第3章 音频信号处理的理论与Python实战 28
3.1 音频信号的基本理论详解
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价