排序方式: 共有10条查询结果,搜索用时 46 毫秒
1
1.
提出两种基于非对称代价函数的耳语音增强算法,将语音增强过程中的放大失真和压缩失真区分对待。Modified ItakuraSaito(MIS)算法对放大失真给予更多的惩罚,而Kullback-Leibler(KL)算法则对压缩失真给予更多的惩罚。实验结果表明,在低于—6 dB的低信噪比情况中,经MIS算法增强后的耳语音的可懂度相比传统算法有显著提高;而KL算法则获得了同最小均方误差语音增强算法近似的可懂度提高效果,证实了耳语音中的放大失真和压缩失真对于耳语音可懂度的影响并不相同,低信噪比时较大的压缩失真有助于提高耳语音可懂度,而高信噪比时的压缩失真对耳语音可懂度影响较小。 相似文献
2.
3.
通过对高频语抗噪声通讯系统的研究,并经实验证明该系统的高频语通讯具有很强的抗环境噪声功能,较好地解决了噪声环境中的传递语音,高频语生成的数学表达。高频语通讯装置的研究设计;采用该装置在实验室内分别用语音声级85、90,95dB(A)在高于该声级的噪声环境下作或懂度实验研究;高频语声级90dB(A)在舰船主机舱室105dB(A)环境下载与不载耳塞的可懂度试验,该系统的形成,在语音,环境噪声比为-10至-15dB时语言可懂度可达90%以上,从理论上升到研制装置成功,突破了传统的语言传递遵循部位机理的信噪比必须为+5dB的论点。 相似文献
4.
对话音模拟保密通信而言,由于置乱技术的局限性和语音信号的多余度,至使置乱后的保密话音,仍具有一定程度的剩余可懂度。本文描述使用平衡数字串估价剩余可懂度的实验研究。结果表明,四位数字串集合是剩余可懂度测试估价的理想信息材之一,而且采用加权校正计分公式RI_(ds)=sum from i=1 to 4(W_i)(IR_i-P_(ri))来计算数字串剩余可懂度是可靠、实用的。 相似文献
5.
本文从理论上阐述了二阶谱法的基本原理,论证了噪声中的语言相位对合成语言的影响,在计算机上完成了本方法的试验.结果表明,对白噪声背景中的信噪比为-5dB-+5dB的语言信号,经本方法处理后,信噪比可提高6dB以上. 相似文献
6.
教材是教和学的依据,也是学生获得知识的主要来源.在物理教学中教师一方面要认真地研究教材,深入地分析教材的内容、特点和编写意图以充分发挥教材的作用,另一方面要指导学生正确阅读教材是培养学生自学能力的关键,如何提高教材的可懂度,促进学生对教材知识的理解,这对高职教育来说,又是一个新的课题. 相似文献
7.
本文研究了开放型办公室中平稳噪声掩蔽语音环境下噪声可懂度的客观评价指标与工作效率之间的关系。文章通过对三种客观评价指标:Speech Transmission Index(STI),Perceptually Evaluation of Speech Quality(PESQ)和modified Normalized Covariance Method(mNCM)与专门设计的主观实验结果相对比,得到了该条件下客观评价指标与主观烦扰度和工作效率之间的关系。结果显示,客观评价指标与主观实验结果均具有较高的相关性,说明利用客观评价指标来预测、评估工作效率具有可行性。实验结果还初步揭示了噪声的语言可懂度和工作效率之间的变化规律:在噪声的语言可懂度的中间区域,工作效率变化显著;但噪声的语言可懂度高于一定值以后,工作效率趋于稳定。 相似文献
8.
警报语音广播是紧急情况时提高建筑物内疏散效率的有效手段。通过实验室研究的方法,研究了语音特性及声场因素对老年群体警报语音可懂度和主观感受的影响。主观感受选取了听音容易程度和感知紧迫性两个维度。研究结果表明,老年人警报语音可懂度和听音容易程度评价主要受语速、信噪比和混响时间的影响,且呈现一致的变化趋势,即随着语速和混响时间降低以及信噪比的增加,老年人可懂度和听音容易程度得分均升高,而声压级(最低设置为60dB)、有无警铃和噪声类型没有显著影响。感知紧迫性随语速和声压级的增加而显著增加,信噪比、混响时间及有无警铃声对感知紧迫性并无显著影响。采用人声播报的警报语音其可懂度和感知紧迫性显著高于合成声。比较老年人和年轻人群体的结果发现,在语速、声压级和噪声类型对主观评价的影响上有显著差异。为建立老年人理想且安全的声环境,应采用人声播报并适当降低语速以保证可懂度,同时混响及信噪比条件两方面的改善都是必要的。 相似文献
9.
针对在基于深度学习语音增强的方法中因采用因果式的网络输入导致语音增强性能下降的问题,提出了一种基于轻量级卷积门控循环神经网络(LCGRU)的语音增强方法。门控循环神经网络能够建模语音信号的时间相关性,但是其全连接结构破坏了语音信号的时频结构特征,并且参数数量庞大,不利于网络的训练。对此,本文采用卷积核替代门控循环神经网络中的全连接结构,在对语音信号时间相关性建模的同时保留了语音信号的时频结构特征,同时降低了网络的参数数量。为充分利用先前帧的特征信息,该网络单元当前时刻的输入融合了上一时刻的输入与输出。针对网络训练过程中容易产生过拟合的问题,本文采用了线性门控机制来控制信息的传输,这缓解了网络训练过程中的过拟合问题,提高了网络的语音增强性能。实验结果表明,本文所提出的网络结构在增强后的语音感知质量(PESQ),语音短时客观可懂度(STOI),分段信噪比(SSNR)等指标上均优于传统的网络结构。 相似文献
10.
1