让找料更便捷
电子元器件
采购信息平台
生意随身带
随时随地找货
一站式电子元器件
采购平台
半导体行业观察第一站
标签:
摘要: 摘 要: 小波神经网络算法(WNN)易陷入局部极小,收敛速度慢,全局搜索能力弱,而遗传算法(GA)具有高度并行、随机、自适应搜索性能和全局寻优的特点。因此,将遗传算法和小波神经网络结合起来形成一种训练神经网络的混合算法——GA-WNN算法。仿真实验结果表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。 关键词: 语音识别;小波神经网络;遗传算
摘 要: 小波神经网络算法(WNN)易陷入局部极小,收敛速度慢,全局搜索能力弱,而遗传算法(GA)具有高度并行、随机、自适应搜索性能和全局寻优的特点。因此,将遗传算法和小波神经网络结合起来形成一种训练神经网络的混合算法——GA-WNN算法。仿真实验结果表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。
关键词: 语音识别;小波神经网络;遗传算法;GA-WNN
语音识别是要让机器“听懂”人类的语音并做出正确的反应,其终极目标是实现人类与机器的自然交流。随着科学技术的发展,语音识别技术正逐步形成一套比较完整的理论体系,其实用产品也相继推出。
现代语音识别技术以人工神经网络(ANN)为主要发展趋势,自上世纪90年代,神经网络已经成为语音识别的一条重要途径[1]。目前具有代表性的神经网络主要有BP神经网络和RBF神经网络。为了提高网络训练速度和语音识别的识别率,神经网络模型不断地被优化。小波神经网络(WNN)是BP神经网络的一种优化模型,它采用小波函数作为激励函数,具有以下一些优点:(1)高度的并行性;(2)高度的非线性映射功能;(3)十分强的自适应功能;(4)良好的容错性和联想记忆功能;(5)小波函数具有时频局部特性和变焦特性[2]。目前神经网络方法对网络隐层节点数、连接权值(包括阈值)以及学习率的依赖性较大,容易导致陷入局部极小、收敛速度慢,甚至不收敛的状况。而遗传算法具有很强的宏观搜索能力,能以较大的概率找到全局最优解[3,4]。为了克服神经网络的不足,本文将两者结合在一起,提出了一种训练神经网络的混合算法——GA-WNN算法。
1 语音识别的基本原理
语音识别系统实质上是一种模式识别系统,与常规模式识别系统一样包括特征提取、模式匹配、参考模式库等三个基本单元。基于神经网络的语音识别系统识别功能要经过从特征参数提取到应用识别算法进行识别的过程,它的系统原理框图如图1所示。
由图1可知,要进行语音识别,首先要对输入的语音信号进行预处理。预处理主要包括预加重、加窗、分帧和端点检测等过程。
(1)预加重:预加重的主要目的是提升语音信号中的高频部分进而减小噪声(主要是50 Hz或60 Hz的工频干扰),提高信噪比。本文选择用预加重数字滤波器来实现对语言信号的预加重,若S(n)为预加重前语音信号,则经过预加重滤波器的信号R(n)为:
(2)加窗和分帧:语音信号随时间变化而变化,研究表明语音信号通常可以假定为短时平稳,通常认为在10 ms~30 ms时间长度内是相对平稳的。分帧可用窗函数乘以语音信号来形成加窗的语音信号。本文选用汉明窗(Hamming)作为加窗函数,用汉明窗将语音切割成长短一致的语音帧,每帧语音采样点数为256点,帧移为128点。
(3)端点检测:端点检测的目的是判断找到有用语音信号的起点和终点,然后根据语音段的起点和终点,分离出真正有用的语音信号,为后续的语音识别奠定可靠的基础。本文采用目前比较流行的双门限端点检测算法,通过语音信号的短时平均能量和短时过零率来判断语音信号的起点和终点。图2和图3分别是一个数字“0”的时域参数分析及其端点检测结果。语音信号是用多媒体声卡在比较安静的实验室环境下录制的,其信噪比较高,双门限端点检测算法可以较准确地判断出语音信号的起始位置,由图可知,实验结果与理论分析一致。
下一篇:2n5551参数封装以及管脚定义
型号 | 厂商 | 价格 |
---|---|---|
EPCOS | 爱普科斯 | / |
STM32F103RCT6 | ST | ¥461.23 |
STM32F103C8T6 | ST | ¥84 |
STM32F103VET6 | ST | ¥426.57 |
STM32F103RET6 | ST | ¥780.82 |
STM8S003F3P6 | ST | ¥10.62 |
STM32F103VCT6 | ST | ¥275.84 |
STM32F103CBT6 | ST | ¥130.66 |
STM32F030C8T6 | ST | ¥18.11 |
N76E003AT20 | NUVOTON | ¥9.67 |