本发明公开了一种基于长短时间记忆(LSTM)网络和卷积神经网络(N)的语音情感识别方法。该方法构建基于LSTM和N的语音情感识别系统,将语音序列作为系统的输入,采用反向传播算法对LSTM和N进行训练,优化网络的参数,得到优化后的网络模型;利用已经训练好的网络模型对新输入的语音序列进行情感分类,分为悲伤、高兴、厌恶、恐惧、惊吓、中性六种情感。该方法综合考虑了LSTM和N两种网络模型,避免了人工选择和提取特征的繁琐,提高了情感识别的准确率,为语音情感识别提供了一种新思路。
本发明公开了一种基于长短时间记忆(LSTM)网络和卷积神经网络(N)的语音情感识别方法。该方法构建基于LSTM和N的语音情感识别系统,将语音序列作为系统的输入,采用反向传播算法对LSTM和N进行训练,优化网络的参数,得到优化后的网络模型;利用已经训练好的网络模型对新输入的语音序列进行情感分类,分为悲伤、高兴、厌恶、恐惧、惊吓、中性六种情感。该方法综合考虑了LSTM和N两种网络模型,避免了人工选择和提取特征的繁琐,提高了情感识别的准确率,为语音情感识别提供了一种新思路。
商品类型 | 专利 | 申请号 | CN201611093447.3 | IPC分类号 | |
专利类型 | 发明 | 法律状态 | 有权 | 技术领域 | |
交易方式 | 技术转让 | 专利状态 | 已授权 | 专利权人 | |