期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

程琳娟彭任华郑成诗李晓东《声学学报》2023,48(1):199-214

提出了一种两阶段复数谱卷积循环网络(CRN)的立体声回声消除(SAEC)算法,该算法无需对立体声信号进行去相关,因而能够在保证立体声音质和空间感的同时,解决自适应滤波SAEC算法非唯一解问题。所提算法采用两个阶段进行回声消除,第一阶段根据传声器接收信号和参考信号估计回声信号,第二阶段将估计回声信号作为先验信息,联合传声器接收信号作为输入特征,估计近端语音。相对于单阶段CRN算法,该方法能够提高网络对回声和近端语音的区分度,有助于近端语音的提取。另外,网络的输入特征和训练目标均采用复数谱,降低了近端语音的相位估计误差,因而可以进一步提升算法性能。实验表明,基于两阶段复数谱CRN的SAEC算法在单端讲话时的回声抑制量和双端讲话时的语音质量都明显优于传统算法以及单阶段CRN算法。相似文献

2.

基于F范数的信号子空间维度估计的多通道语音增强算法

李超刘文举《声学学报》2011,36(4)

尽管信号子空间方法在语音增强中的应用已经得到了广泛的研究,但是作为制约子空间方法性能的子空间维度估计却一直没有得到较好的解决.针对子空间维度估计问题,本文用多通道语音信号互功率谱矩阵的F范数的统计模型来描述语音信号的先验知识和变化规律,提出了一种基于最大化原则的子空间维度估计方法,在接受原假设的前提下最大化子空间维度.实验证明,在客观语音质量评估和主观测评中,所提算法都取得了更好的结果.与传统方法相比,采用本文方法的多通道语音增强算法可在房间回声、低信噪比等恶劣环境下获得更高的噪声消除和更低的语音畸变. 相似文献

3.

问题解答

《物理》1956,(4)

问:在普通房间里虽有六个反射面,但一般听不到回音,这种听不到回音的现象,应如何解释? 答:通常所说的回音,有两种不同的意义:一种是回声;一种是交混回响。回声是可以清晰地辨别出来的反射声音。根据实验估计,只有当反射声音到人耳的时间比别的直达声音晚十七分之一秒以上而强度又够大时,才能听到回声。因此由声速、传播时间与距离的关系可以算出,反射声经过的路程至少要比直接声经过的路程长20米以上才可以听到回声。所以在普通的小房间里,是听不到回声的,但在有显著反射面的大广场或大礼堂里就可以听到回声。相似文献

4.

第六届全国语音图象通讯信号处理学术会议在四川召开

下载免费PDF全文

齐士钤《应用声学》1994,12(1):47-48

由中国声学学会语言听觉和音乐声学分会、中国电子学会信号处理学会语音图象通信专业委员会与四川省电子学会联合主办、由电子工业部西南通信研究所承办的第六届全国语音图象通讯信号处理学术会议于今年九月分四日在四川省南坪县召开．首先由会议主席电子工业部西南通信研究所所长刘村友教授致开幕词，中国科学院声学研究所副所长侯朝焕研究员发表讲话．开幕式上最后由刘村友教授做题为“通信保护动向趋势”的大会报告，这个报告概括了当今国际上通信保护的主要问题，受到与会者的重视与欢迎，并进行了讨论，对通讯保护这一研究领域加深了认… 相似文献

5.

多声学场景下端到端语音识别声学编码器的自适应

刘育坤郑霖黎塔张鹏远《声学学报》2023,(6):1260-1268

提出了一种面向多样化声学场景自适应设计声学编码器的方法 (SAE)。该方法通过学习不同声学场景下语音中包含的声学特征的差异,适应性地为端到端语音识别任务设计出合适的声学编码器。通过引入神经网络结构搜索技术,提高了编码器设计的有效性,从而改善了下游识别任务的性能。在Aishell-1、HKUST和SWBD三个常用的中英文数据集上的实验表明,通过所提场景自适应设计方法得到的声学编码器相比已有的声学编码器可以获得平均5%以上的错误率改善。所提方法是一种深入分析特定场景下语音特征、针对性设计高性能声学编码器的有效方法。相似文献

6.

共振峰编辑法区别鼻化元音中口、鼻音共振峰的实证探究*

下载免费PDF全文

赵擎华杨俊杰《应用声学》2021,40(6):937-945

为解决司法话者识别中利用鼻化元音构建元音声学空间图时如何准确判别鼻化元音的口、鼻音共振峰的问题。本文通过计算机语音工作站对语音样本的共振峰进行编辑操作，利用生成的语音样本构建不同的对照组分别进行听辨。结果表明，口音、鼻音共振峰分别被衰减后的语音变化特点呈现一定规律，使用此方法可以准确区分鼻化元音的口、鼻共振峰的阶次。本文建立的“共振峰编辑”与“听觉感知”相结合的判别方法，可以为司法话者识别及语音感知、识别等相关领域通过构建元音声学空间图进行声学特征研究的模型提供口音、鼻音共振峰的判别依据。相似文献

7.

《汉语人机语音通信基础》介绍

下载免费PDF全文

张毅颖《应用声学》2010,29(3):240-240

2010年4月,中国科学院声学研究所研究员张家騄先生所著的《汉语人机语音通信基础》一书在上海科学技术出版社出版。张家騄先生是新中国从事语言声学研究的老一代科研工作者之一,长期从事语言通讯和语音学等领域的相似文献

8.

汉语耳语音孤立字识别研究 总被引：6，自引：0，他引：6

下载免费PDF全文

杨莉莉林玮徐柏龄《应用声学》2006,25(3):187-192

耳语音识别有着广泛的应用前景,是一个全新的课题.但是由于耳语音本身的特点,如声级低、没有基频等,给耳语音识别研究带来了困难.本文根据耳语音信号发音模型,结合耳语音的声学特性,建立了一个汉语耳语音孤立字识别系统.由于耳语音信噪比低,必须对其进行语音增强处理,同时在识别系统中应用声调信息提高了识别性能.实验结果说明了MFCC结合幅值包络可作为汉语耳语音自动识别的特征参数,在小字库内用HMM模型识别得出的识别率为90.4%. 相似文献

9.

汉语文语转换系统的语音规则和声学参数 总被引：2，自引：0，他引：2

张家騄《声学学报》1990,(2)

利用瑞典皇家理工学院(KTH)语言通讯和音乐声学系Carlson和Granstrom设计的多语种文语转换系统,进行了汉语文语转换研究。对汉语文语转换用的基本语音规则和声学参数做了分析、设计和调试,特别对轻声、儿化和变调进行了研究。相似文献

10.

基于发音特征的汉语普通话语音声学建模 总被引：3，自引：0，他引：3

张晴晴潘接林颜永红《声学学报》2010,35(2):254-260

将表征汉语普通话语音特点的发音特征引入汉语普通话语音识别的声学建模中,根据普通话发音特点,确定了用于区别普通话元音、辅音以及声调信息的9种发音特征,并以此为目标值训练神经网络得到语音信号属于各类发音特征的后验概率,将此概率作为语音识别的输入特征建立声学模型。在汉语普通话非特定人大词表自然口语对话识别系统中进行了实验验证,并与基于频谱特征的声学模型进行了比较,在相同解码速度下,由此方法建立的声学模型汉字错误率相对下降6.8%;将发音特征和频谱特征进行了融合实验,融合以后的识别系统相对基于频谱特征系统的汉字错误率相对下降10.1%。上述结果表明,基于发音特征的声学模型更加有效的实现了对语音特性的表征,通过利用发音特征和频谱特征的互补性,能够进一步实现对语音识别性能的提高。相似文献