共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
为提高智能语音情感识别系统的准确性,提出了一种基于卷积神经网络CNN(Convolution Neural Network)特征表征的语音情感识别模型,该卷积模型以 Lenet-5模型为基础,增加了一层卷积层和池化层,并将二维卷积核改为一维卷积核,将一维特征预处理后,输送进该模型中,对特征变换表征。最后利用SoftMax分类器实现情感分类,CASIA与 EMO-DB开数据库上的识别结果显示:与Lenet-5网络相比,所设计网络模型的准确率分别提升了1.3%与2%,与SoftMax分类器相比,准确率分别提升了3.8%与6.1%,仿真结果验证了网络模型的有效性。 相似文献
3.
优良的客户服务是各企业在竞争中制胜的法宝,随着用户需求的不断变化,传统的客户服务系统以不能适应日益增长的客户服务需要。由传统的被动应答式客户服务向主动、开放、智能服务的转变成为必然。本文就将语音识别技术应用于客户服务系统,助力客户服务系统向智能化转变的问题进行初步的探讨。 相似文献
4.
为了解决传统氦语音处理技术存在的处理速度慢、计算复杂、操作困难等问题,提出了一种采用机器学习的氦语音识别方法,通过深层网络学习高维信息、提取多种特征,不但解决了过拟合问题,同时也具备了字错率(Word Error Rate,WER)低、收敛速度快的优点。首先自建氦语音孤立词和连续氦语音数据库,对氦语音数据预处理,提取的语音特征主要包括共振峰特征、基音周期特征和FBank(Filter Bank)特征。之后将语音特征输入到由深度卷积神经网络(Deep Convolutional Neural Network,DCNN)和连接时序分类(Connectionist Temporal Classification,CTC)组成的声学模型进行语音到拼音的建模,最后应用Transformer语言模型得到汉字输出。提取共振峰特征、基音周期特征和FBank特征的氦语音孤立词识别模型相比于仅提取FBank特征的识别模型的WER降低了7.91%,连续氦语音识别模型的WER降低了14.95%。氦语音孤立词识别模型的最优WER为1.53%,连续氦语音识别模型的最优WER为36.89%。结果表明,所提方法可有效识别氦语音。 相似文献
5.
本研究对三种常用的语音隐写方法进行了隐写分析。在目前的网络环境中,VoIP中的隐写技术对通信监控是一个巨大的威胁。近年来,神经网络模型在许多课题中都取得了显著的性能。利用一种改进的神经网络对多种隐写方法实现隐写信号的检测。构建短时傅立叶变换的沿时间轴、频率轴的差分以构建三通道作为输入数据,然后利用一种改进的CNN网络结构进行深层次特征的捕获,这种网络结构引入了Inception结构在同一卷积层上提取各种不同尺度的特征,使用全局平均池化来代替全连接层,在降低参数的同时提升了网络的泛化能力。实验结果表明,该模型相较对比方法对于三种隐写方法均达到了较好的检测效果。 相似文献
6.
7.
目前,大部分家电设备操控均是选择单独的遥控设备,经过独立分开的微处理芯片帮助控制。然而智能家庭语音遥控系统属于一类嵌入类式集成系统,其也是一类非接触类型识别技术。这种遥控系统是通过使用者的声音来实现控制设备的开关操作。 相似文献
8.
实际语音分离时,混合语音的说话人性别组合相关信息往往是未知的。若直接在普适的模型上进行分离,语音分离效果欠佳。为了更好地进行语音分离,本文提出一种基于卷积神经网络-支持向量机(CNN-SVM)的性别组合判别模型,来确定混合语音的两个说话人是男-男、男-女还是女-女组合,以便选用相应性别组合的分离模型进行语音分离。为了弥补传统单一特征表征性别组合信息不足的问题,本文提出一种挖掘深度融合特征的策略,使分类特征包含更多性别组合类别的信息。本文的基于CNN-SVM性别组合分类的单通道语音分离方法,首先使用卷积神经网络挖掘梅尔频率倒谱系数和滤波器组特征的深度特征,融合这两种深度特征作为性别组合的分类特征,然后利用支持向量机对混合语音性别组合进行识别,最后选择对应性别组合的深度神经网络/卷积神经网络(DNN/CNN)模型进行语音分离。实验结果表明,与传统的单一特征相比,本文所提的深度融合特征可以有效提高混合语音性别组合的识别率;本文所提的语音分离方法在主观语音质量评估(PESQ)、短时客观可懂度(STOI)、信号失真比(SDR)指标上均优于普适的语音分离模型。 相似文献
9.
为了充分利用含噪语音特征来提高语音增强网络的性能,基于含噪语音在时间和频率两个维度上的相关性,本文结合卷积神经网络的局部特征提取能力和门控循环单元的长期依赖建模能力,设计了一种适用于语音增强的卷积门控循环网络.该网络采用卷积网络结构代替全连接网络结构来改进门控循环单元中的特征计算过程,从而能够更好地保留含噪语音特征中的时频结构信息.实验结果表明,与其它语音增强网络相比,本文网络在语音成分的保留和噪声成分的抑制上具有明显优势,增强后语音具有更好的语音质量和可懂度. 相似文献
10.
11.
智能文稿唱词实验系统,通过对电视节目字幕制作工艺流程进行创新,集成人工智能语音引擎,将传统电视字幕流程由5个步骤简化为3个步骤,压缩了节目字幕制作流程,提高了节目制作效率。本文概述其人工智能语音识别技术与电视字幕制作结合的特点及人工智能文稿唱词实验系统的设计与应用。 相似文献
12.
13.
通常采用具有前向连接权的连接网络便可实现静态输入输出模式对的联想,但是为了使网络记忆序列信息状态,必须考虑引入反馈连接权。本文构造一个具有动态神经元的多层网络结构,动态神经元带有多时延的局部反馈。此网络结构用于记忆时间序列信息,同时,相应地我们推导一种更有效、更便于实现的网络学习算法。最后,为了测试所提出网络学习动态时变数据的能力,选择几个不同参数的动态神经元模型,进行了一系列实验。 相似文献
14.
本语文介绍了一个可以脱离计算机的小词汇表语音识别系统,提出了一种新的神经网络结构并采用了模糊逻辑来实现该系统,使之 较大的实际环境中进行不定人的实时语音识别,识别率为90%。 相似文献
15.
16.
17.
本文根据加权倒变距离测度,提出了一种用于非特定人语音识别的函数链神经网络。此网络与多层感知器相比,不仅具有较高的识别别率,而且大大缩短了网络的学习时间。我们采用6人(3男,3女)的语音数据对汉语十个数字进行了实验,正确识别率为93.7%。 相似文献
18.
为了提高电网调度生产效率,需要研发电力系统智能调度助手,而智能调度助手实现的关键是调度控制命令的精准识别,因此,有必要开展适用于电力调度系统的语音识别模型研究。首先,利用深度神经网络的方法,研究适用于电力调度控制系统的语音识别模型。其次,提出了电网调度控制语言特征设计方法,能够有效包容多种方言特征,提高语音识别的准确性。最后,以实际电网为例进行验证,表明了所提方法的有效性。 相似文献
19.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。 相似文献
20.
为更有效地服务老年客户群体,帮助其体验信息时代线上业务的便捷,利用运营商电话语音通道优势,结合语音识别和声纹识别技术,创新性地为运营商的特服热线建立智能适老化语音系统,在客户授权前提下提供免服务密码的声纹鉴权及受理业务辅助解析功能。老年客户群体通过拨打运营商特服电话,在智能客服引导下按步骤进行业务受理退订、积分兑换、预约挂号等业务,对于授权进行声纹识别的客户,可通过通话过程中的客户语音进行身份识别鉴权,免除服务密码的输入,有效缓解老年客户群体容易遗忘服务密码带来的操作不便,大幅减轻了话务员反复确认与引导的工作量,良好地实现了为老年客户群体提供高效与便捷服务的目标。 相似文献