语音识别技术及应用(双色)(含微课)

收藏
简介 目录 样张 更多
  • ISBN:978-7-5165-3791-6
  • 作者:韩鸣飞、刘祥、冯本勇
  • 出版社:航空工业
  • 适用层次:通用
  • 出版/修订日期:2024-09-01

本书以Python语言为基础、以实战应用为导向,采用项目式的编写方法,全面系统地介绍了语音识别的基本概念、基本原理和核心技术,并对这些技术进行了编程实现。全书共7个项目,内容涵盖搭建语音识别开发环境、语音特征提取、构建传统声学模型、使用深度神经网络构建声学模型、训练语言模型、构建语音识别系统和中文普通话语音识别。

本书可作为各类院校计算机科学、人工智能、大数据技术等相关专业的教材,也可供相关科技人员参考使用。

基础篇

项目1  搭建语音识别开发环境

项目目标

项目描述

项目分析

项目准备

1.1  语音识别概述

1.1.1  语音识别的概念

1.1.2  语音识别的应用领域

1.1.3  语音识别的发展历程

1.2  语音识别的主流框架

1.2.1  语音前端处理

1.2.2  解码识别

1.3  语音识别常用语料库

1.4  常用的语音识别开发工具

1.4.1  语音识别开发常用工具包

1.4.2  语音识别开发常用Python库

1.4.3  深度学习主流框架TensorFlow

1.4.4  自然语言工具包NLTK

项目实施——搭建语音识别开发环境

项目实训

项目总结

项目考核

项目评价

 

项目2  语音特征提取

项目目标

项目描述

项目分析

项目准备

2.1  语音特征的提取流程

2.2  语音数据预处理

2.2.1  预加重

2.2.2  分帧与加窗

2.3  短时傅里叶变换

2.3.1  短时傅里叶变换的基本原理

2.3.2  短时傅里叶变换的编程实现

2.4  语音特征的提取

2.4.1  提取语谱图特征

2.4.2  提取Fbank特征

2.4.3  提取MFCC特征

项目实施——MFCC特征的提取与可视化

项目实训

项目总结

项目考核

项目评价

 

技术篇

项目3  构建传统声学模型

项目目标

项目描述

项目分析

项目准备

3.1  传统声学模型

3.1.1  隐马尔可夫模型

3.1.2  高斯混合模型—隐马尔可夫模型

3.2  传统声学模型的编程实现

3.2.1  HMMlearn库中的隐马尔可夫模块

3.2.2  隐马尔可夫模块的应用举例

项目实施——基于GMM-HMM的孤立词语音识别

项目实训

项目总结

项目考核

项目评价

 

项目4  使用深度神经网络构建声学模型

项目目标

项目描述

项目分析

项目准备

4.1  深度神经网络

4.1.1  深度神经网络的基本原理

4.1.2  深度神经网络的编程实现

4.2  深度神经网络—隐马尔可夫模型

4.2.1  深度神经网络—隐马尔可夫模型的工作原理

4.2.2  深度神经网络—隐马尔可夫模型的训练

4.2.3  深度神经网络—隐马尔可夫模型的编程实现

项目实施——数字命令语音识别

项目实训

项目总结

项目考核

项目评价

 

项目5  训练语言模型

项目目标

项目描述

项目分析

项目准备

5.1  语言模型概述

5.2  N-gram语言模型

5.2.1  N-gram语言模型的基本原理

5.2.2  平滑算法

5.2.3  语言模型的评价指标

5.2.4  N-gram语言模型的编程实现

5.3  循环神经网络语言模型

5.3.1  循环神经网络的基本原理

5.3.2  循环神经网络语言模型的基本原理

5.3.3  循环神经网络语言模型的编程实现

项目实施——使用循环神经网络构建歌词生成器

项目实训

项目总结

项目考核

项目评价

 

项目6  构建语音识别系统

项目目标

项目描述

项目分析

项目准备

6.1  传统语音识别系统

6.2  端到端语音识别系统

6.2.1  连接时序分类模型

6.2.2  注意力机制

项目实施——构建基于CTC的端到端语音识别系统

项目实训

项目总结

项目考核

项目评价

 

应用篇

项目7  中文普通话语音识别

项目目标

项目描述

项目分析

项目准备

项目实施——中文普通话语音识别

项目实训

项目总结

项目考核

项目评价

 

参考文献

微课 教材练习 资料下载 ....
立即下载
价格:¥59.80
加入购物车立即购买