期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张玉梅胡小俊吴晓军白树林路纲《物理学报》2015,64(20):200507-200507

对给定的英语音素、单词和语句进行了采集并完成预处理. 分别应用互信息法和Cao 氏法确定了实际采集的语音信号序列的延迟时间和嵌入维数, 以完成语音序列的相空间重构. 通过计算实际采集的语音信号序列的最大Lyapunov指数, 完成了语音信号的混沌特性识别, 判定其具有混沌特性. 引入Volterra级数, 提出了一种具有显式结构的语音信号非线性预测模型. 为克服最小均方误差算法在Volterra模型系数更新时固有的缺点, 在最小二乘法基础上, 应用基于后验误差假设的可变收敛因子技术, 构建了一种基于Davidon-Fletcher-Powell算法的二阶Volterra 模型(DFPSOVF), 并将其应用于具有混沌特性的语音信号序列预测. 仿真结果表明: DFPSOVF非线性预测模型对于单帧和多帧语音信号均具有更好的预测精度, 优于线性预测模型, 并且能够很好地反映语音序列变化的趋势和规律, 完全可以满足语音预测的要求; 可以根据语音信号序列的嵌入维数选取预测模型的记忆长度. 所提出模型可以为语音信号重构和压缩编码开辟一条新途径, 以改善语音信号处理方法的复杂度和处理效果. 相似文献

2.

基于话者状态检测的自适应语音分离方法的研究

陈锴卢晶徐柏龄《声学学报》2006,31(3):211-216

提出了一种基于话者状态检测的语音分离算法。该算法对话者状态进行自动检测,并根据相应的状态对自适应滤波过程加以控制,以此对各路的声场传递函数进行估计,进而使混合的语音信号得到分离。仿真实验结果表明:与传统的输出信号互为参考的信号的分离算法相比,该算法克服了参考信号不纯导致自适应语音分离结果恶化的缺陷;该算法不需要人为地降低自适应滤波器的收敛速度,所以具有较快的收敛和跟踪性能;此外,该算法还具有运算量较小,实时性好等特点。相似文献

3.

卷积噪声环境下语音信号鲁棒特征提取

吕钊吴小培张超李密《声学学报》2010,35(4):465-470

提出了一种基于独立分量分析(ICA)的语音信号鲁棒特征提取算法,用以解决在卷积噪声环境下语音信号的训练与识别特征不匹配的问题。该算法通过短时傅里叶变换将带噪语音信号从时域转换到频域后,采用复值ICA方法从带噪语音的短时谱中分离出语音信号的短时谱,然后根据所得到的语音信号短时谱计算美尔倒谱系数(MFCC)及其一阶差分作为特征参数。在仿真与真实环境下汉语数字语音识别实验中,所提算法相比较传统的MFCC其识别正确率分别提升了34.8%和32.6%。实验结果表明基于ICA方法的语音特征在卷积噪声环境下具有良好的鲁棒性。相似文献

4.

仿选择性注意机制的语音情感识别算法

梁瑞宇赵力陶华伟王青云邹采荣《声学学报》2016,41(4):537-544

有效特征的选取一直都是语音情感识别算法的关键。为此,针对语音情感特征选择与构建的问题,一种仿选择性注意机制的语音情感识别算法被提出。考虑到语音信号的时频特性,算法首先计算语音信号的语谱图;其次,模仿选择性注意机制,计算语谱图的颜色、方向和亮度特征图,归一化后形成特征矩阵;然后,将特征矩阵重排列并进行PCA降维,形成情感识别特征向量;最后,利用改进的支持向量机分类方法进行语音情感识别。对愤怒、恐惧、高兴、悲伤和惊奇5种情感的识别实验显示,基于选择性注意的方法能够获得较好的识别效果,平均识别率为85.44%。相比于韵律特征和音质特征,语音情感识别率至少提高10%;相比于其它语谱特征,识别率提高7%左右。相似文献

5.

一种基于模式识别的多路盲语音提取方法

下载免费PDF全文

徐舜刘郁林柏森《应用声学》2008,27(3):173-180

盲分离算法能在缺少混合系统参数的条件下仅由观测信号估计初始源,但分离信号存在固有的排列模糊性,这往往导致两次批处理过程中同一信号"对不准",因此很难获得连续的源信号。本文针对盲声源分离中存在的相同问题,根据语音和其他音频信号的特征差异,提出一种修正的自相关函数并以其值作为一个特征基元来表征声音信号的时序相关特性,同时用平均声门波形状参数作为另一个特征基元来表征语音产生的生理效应。以这两个参数作为识别不同音频信号的二维模式特征,采用一种模糊聚类算法提取多路盲分离语音。本方法有效克服了批处理盲声源分离中的信号排列顺序的不确定性,并通过选择合适的阈值提取多路连续语音。仿真给出了5路混合音频信号中盲提取两路连续语音的实验结果。相似文献

6.

实时识别中语音的时域─频域─能量表示

下载免费PDF全文

罗万伯张露李志蜀罗霄峰罗霄岚 Duanpei Wu 《应用声学》2001,(3)

本文提出了语音信号的一种时域─频域─能量表示,并给出了算法,可用于孤立词语音识别．这种时域─频域─能量表示有两个特点：基于短时能量梯度的非线性时间规正,可保留语音信号频域的过渡特性,丢掉其稳态特性;计算量小,适于实时应用．相似文献

7.

实时识别中语音的时域─频域─能量表示

下载免费PDF全文

罗万伯张露李志蜀罗霄峰罗霄岚 Duanpei Wu 《应用声学》2001,20(3):31-33,10

本文提出了语音信号的一种时域－频域－能量表示,并给出了算法,可用于孤立词语音识别,这种时域－频域－能量表示有两个特点,基于短时能量梯度的非线性时间规正,可保留语音信号频域的过滤特性,丢掉其稳态特性,计算量小,适于实时应用。相似文献

8.

语音识别预处理中的ICA噪声适应性分析

韩仲志周梅芳叶洪涛覃溪黄汉明《广西物理》2006,27(1):26-28,31

针对高噪环境下语音识别的困难,提出一种基于独立分量分析的盲分离(ICA/BSS)与小波联合的语音降噪预处理方法,针对不同种类和不同输入信噪比的噪声设计了试验,结果表明基于ICA的语音识别预处理方法对低输入信噪比情况下多种噪声具有很强的鲁棒性和优越性,此结论对现实世界高噪环境下的信号分析和语音识别具有重要意义。相似文献

9.

基于非线性时频掩蔽的语音盲分离方法

徐舜陈绍荣刘郁林《声学学报》2007,32(4):375-381

针对语音信号的欠定卷积混合模型,利用独立语音在时频域上的近似W-分离正交性(W-DO),提出了一种基于非线性时频掩蔽的盲分离方法。首先对多传声器观测信号在时频域上进行规范化处理,使混合信号在每个时频槽的表示与频率无关,然后采用动态聚类算法获取时频槽对应的活跃源信息,选择关于簇中心偏角的非线性函数进行时频掩蔽,从而实现语音信号的盲分离。该方法解决了经典频域盲分离算法中的频率置换问题,能有效抑制分离矩阵的空间方向扩散。仿真实验表明,与BLUES方法相比具有更优的分离性能,信噪比增益平均增加1．58 dB。相似文献

10.

小波包自适应阈值语音降噪新算法

下载免费PDF全文

田玉静左红伟董玉民王超《应用声学》2011,30(1):72-80

为了克服低信噪比输入下,语音增强造成语音清音中的弱分量损失,造成重构信号包络失真的问题。论文提出了一种新的语音增强方法。该方法根据语音感知模型,采用不完全小波包分解拟合语音临界频带,并对语音按子带能量进行清浊音区分处理,在阈值计算上,提出了一种清浊音分离,基于子带信号能量的小波包自适应阈值算法。通过仿真实验,客观评测和听音测试表明,该算法在低信噪比输入时较传统算法,能够更加有效地减少重构信号包络失真,在不损伤语音清晰度和自然度的前提下,使输出信噪比明显提高。将该算法与能量谱减法结合,进行二次增强能进一步提高降噪输出的语音质量。相似文献

11.

自适应降噪系统的语音分离研究 总被引：2，自引：1，他引：1

丁慧徐柏龄《声学学报》2004,(1)

对抑制干扰语音的自适应降噪系统(CTRANC)进行了语音分离算法的研究。利用CTRANC抑制干扰信号的特性及语音信号的短时稳定性,借助最优控制相关理论,得到了新的语音分离方法及其自适应滤波迭代步长的计算公式。实验结果表明在双话者的情况下,这种语音分离算法能够保证自适应语音分离系统具有良好的稳定性,较好的实时跟踪能力和收敛性能,且分离出来的语音具有令人满意的清晰度。相似文献

12.

基于字典学习和稀疏表示的单通道语音增强算法综述* 总被引：1，自引：0，他引：1

下载免费PDF全文

叶中付朱媛媛贾翔宇《应用声学》2019,38(4):645-652

如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。本文首先介绍了单通道情况下语音增强的信号模型,然后对4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。相似文献

13.

改进LVAMDF及综合多因素基音检测算法

薛帅强陈波陈菲 《应用声学》2016,24(4):253-256

在对语音信号静音、清音、浊音划分的基础上,针对语音信号周期特征明显段分布随机性问题,提出改进的变长度平均幅度差函数LVAMDF及综合多因素基音检测算法,该算法对语音信号进行周期特征明显段和周期特征不明显段的聚类划分,同时,获取周期特征明显语音段的基音周期,针对少数基音周期划分倍频或半频问题,提出识别、修正方法,其识别、修正率极高。在对大量真实语音处理中,能够精确的检测出语音特征明显段的基音周期端点,基本没有倍频和半频划分,并且和AMDF、ACF算法作了对比。相似文献

14.

基于离散余弦变换的语音压缩采样和编码算法

下载免费PDF全文

武朋辉杨百龙时磊《应用声学》2015,34(1):17-23

针对语音无线通信中带宽资源受限的问题,提出基于压缩采样的低速率语音编码算法。以基尼系数为指标,比较不同稀疏变换域下语音信号的稀疏性,分析常见重构算法对语音信号压缩采样观测信号的重构特性。对标准耳蜗滤波器——伽马啁啾滤波器组的参数进行研究,并以梯度投影稀疏重建(GPSR)算法重构语音信号。利用语音质量感知评估(PESQ)、信噪比和主观听觉测试,对编解码后的合成语音信号进行了质量评估。实验表明,基于压缩感知的语音编码器以4 kbps的低速率对语音进行编码时,PESQ得分可达到3.16,计算复杂度相对较低,可以用于实际的语音编码环境。相似文献

15.

激光大足印多目标距离信息提取与验证技术

《光学学报》2015,(7)

针对星载对地观测激光高度计大足印回波信号中多目标相对高程信息提取的问题,采用基于最小二乘的高斯分解算法对波形数据进行多目标分离,设计了全波形采集系统,并开展了地面多目标分离的算法验证实验。实验结果表明,该算法可有效分离回波信号中的多个目标,目标间相对距离偏差小于0.03m,验证了激光大足印全波形采集系统进行多目标相对距离信息提取的可行性,对星载对地观测激光高度计的系统设计及数据处理算法的研究具有重要借鉴意义。相似文献

16.

基于双耳模型的倒谱系数在声目标识别中的应用

下载免费PDF全文

管鲁阳鲍明李晓东《应用声学》2008,27(5):351-357

在声目标识别中,基于单路信号的特征提取算法难以保证特征在低信噪比条件下的鲁棒性。针对该问题,本文使用由两个传声器组成的小孔径阵列采集信号,采用Stereausis双耳听觉模型对两路信号进行综合处理,在此基础上设计了基于双耳模型的倒谱系数,并将其作为识别特征应用于多类地面目标识别。试验表明该特征可有效提高识别系统的识别性能和抗噪声能力。相似文献

17.

基于帧特征、段特征联合建模的语音识别模型

韩疆尹宝林《声学学报》2000,(2)

提出了基于帧特征、段特征联合建模的语音识别模型。该模型采用描述谱参数轨迹的段特征,在段尺度上实现了对语音信号帧间相关性的显式建模;采用段特征依赖的非平稳时间序列产生模型,实现了段特征与帧特征间的相关性建模,并在帧尺度上通过参数化的均值轨迹函数,实现了对语音信号帧间相关性的隐式建模。本文给出了基于帧特征、段特征联合统计距离优化的分段算法以及内嵌ＥＭ迭代的模型参数估计算法。对非特定人汉语孤立韵母以及多话者汉语基本音节的识别实验表明,该模型的识别性能优于标准ＨＭＭ及趋势ＨＭＭ。相似文献

18.

基于线性调频Z变换和短波语音通话的飞机类型识别研究

下载免费PDF全文

聂东虎章佳荣于洋李雪耀《声学学报》2013,38(3):389-396

研究用短波语音通话携带的飞机舱室噪声对飞机类型进行识别的方法。分析了飞机舱室内噪声在短波信道和语音通话干扰下的物理特性,定义了估计语音段的飞机噪声信噪比的公式,提出了自适应的抑制语音增强飞机噪声的模型,通过CZT变换分别提取目标信号不同频段的功率谱密度级特征,并设计了用支持向量机进行分类识别的二叉分类树。对8类现场实测数据进行实验:增强后语音段的平均信噪比提高约22 dB,分类树对语音应答间隔噪声、语音段信号和增强后的信号的平均识别率分别为82.79%,15.25%,50.18%。实验表明:应答间隔噪声可用于飞机类型识别;语音抑制算法带来较大的信噪比和识别率增益,证明语音段蕴含有助于飞机类型识别的重要信息,可为后续的研究奠定基础。相似文献

19.

基于谐波和噪声能量改进的语音截止频率轮廓估计

汤一彬张索非吴镇扬《声学学报》2010,35(3):375-384

为了对语音谐波/噪声模型中的语音截止频率轮廓进行更好的描述,本文提出了一种基于谐波和噪声能量改进的语音截止频率轮廓估计算法。改进算法对累积谐波和噪声能量函数进行对应谐波处的功率谱加权,并且在语音截止频率轨迹的平滑部分采用形态滤波的手段。实验表明,与原算法相比,通过改进算法得到的截止频率轮廓在语谱图上标注得更为准确,在主观评分测试中改进算法也获得了优于原算法的测试评分。改进算法比原算法能够更加准确的对语音截止频率轮廓进行估计,从而使得语音谐波/噪声模型在语音编码、语音合成及识别方面具有更为有效的应用。相似文献

20.

临界频带子波变换用于混叠语音分离的研究 总被引：4，自引：1，他引：3

赵鹤鸣朱祺陈雪勤俞一彪《声学学报》2004,(2)

以反映听觉特性的临界频带子波变换为工具,对混叠语音进行了分析,提出了一种基于临界频带子波变换的混叠语音源信号基音分离和检测方法,在此基础上利用数字多谐振荡器的选频特性,有效地获取构成混叠语音的每个语音信号的各谐波分量,以此实现从混叠语音中分离出各源信号。实验结果表明混叠语音分离方法是可行有效的。相似文献