共查询到20条相似文献,搜索用时 31 毫秒
1.
基于最大似然多项式回归的鲁棒语音识别 总被引:2,自引:0,他引:2
本文针对最大似然线性回归算法线性假设的缺点,将多项式回归方法用于模型自适应,构建了基于最大似然多项式回归的非线性模型自适应算法。该算法在对数谱域用多项式回归方法,逼近每个Mel子带上识别环境模型均值与训练环境模型均值之间的非线性关系。多项式系数通过EM算法和最大似然准则从识别环境下的少量自适应数据中估计。实验结果表明,二阶多项式就可以较好地逼近模型均值的非线性环境变换关系。在噪声补偿和说话人自适应实验中,最大似然多项式回归算法的误识率都明显低于最大似然线性回归算法。本文算法较好地克服了线性模型自适应算法线性假设的缺陷,可同时减小噪声,和说话人的改变或其它因素对语音识别系统的影响,尤其适合说话人和噪声的联合自适应。 相似文献
2.
变尺度概率净化法是一种混沌时间序列非线性动力学降噪方法,该方法需对整个相空间点列做联合处理,因此算法的计算量和所需内存量会随着每个轨道点的修正参考点数和嵌入维数的增加而呈指数增长.根据变尺度概率净化法的特点,对前向概率和转移概率的估计方法作了一些改进,使算法的运算量减小到了原来的0.27左右,而降噪性能并没有下降,并提出了数据较长情况下的算法实现结构,大大降低了算法运行所需内存.
关键词:
混沌
非线性动力学
降噪
最大后验概率估计
变尺度概率净化 相似文献
3.
波束域变换将阵元域数据投影到一个低维的波束域空间, 不仅能够减小信号处理算法的运算时间, 提高算法性能, 还能够抑制干扰. 本文针对常规自适应波束域变换方法需要在线调整波束变换矩阵、更新波束域导向矢量由此导致实时实现困难的问题, 提出一种高效的自适应波束域变换方法. 该方法将波束域协方差矩阵与导向矢量均表示成不依赖自适应波束变换矩阵的闭合形式, 省去在线调整与更新过程, 使运算效率得到了显著提高. 最后将该方法应用到波达方向(DOA)的估计之中, 仿真研究表明, 本文方法获得了比常规自适应方法更好的DOA估计性能. 此外, 本文方法还具有另一个非常突出的优点, 即它可以有效抑制运动强干扰. 这是因为本文方法无需训练波束变换矩阵, 其当前运算结果与历史快拍数据无关, 这样可以有效避免常规自适应方法中因目标运动所导致的训练数据与应用数据失配的问题. 相似文献
4.
采用归一化补偿变换的与文本无关的说话人识别 总被引:10,自引:0,他引:10
在噪声环境下,特别是当说话人识别最常用的模型——高斯混合模型(GMM)失配的情况下,需要对其输出帧似然概率的统计特性进行补偿。文章根据说话人识别的声学特性,提出了一种非线性变换方法——归一化补偿变换。理论分析和实验结果表明:与常用的最大似然(ML)变换相比,该变换能够提高系统识别率,最大可达3.7%,同时可降低误识率,最大可达45.1%。结果说明归一化补偿变换方法基本克服了在与文本无关说话人识别系统中,当说话人的个性特征不断变化、语音与噪声不能很好地分离或者降噪算法对语音有损伤、模型不能很好地匹配时,需要对模型输出的似然概率(得分)进行补偿的局限。这也说明对模型输出的似然概率进行处理是降低噪声和干扰的影响、提高说话人识别率的有效方法。 相似文献
5.
矢量泰勒级数特征补偿的说话人识别 总被引:2,自引:0,他引:2
将矢量泰勒级数(Vector Taylor Series,VTS)特征补偿算法应用于说话人识别,给出了卷积噪声方差的近似闭式解,构建了联合快速估计卷积噪声和加性噪声均值和方差的框架。该算法可在无需失配环境先验信息的前提下,直接从失配语音中估计出卷积噪声和加性噪声的均值和方差,实现对环境失配的补偿。实验结果表明,在信道变化较大的无线信道下,卷积噪声方差的补偿最高可降低误识率3.24%.提升了系统的识别性能。在存在加性噪声的无线信道下,与基于线性失真模型的特征映射算法和倒谱均值减算法相比,本文算法可分别最大降低49.65%和68.06%的误识率,适合于信道变化较大的失配环境补偿。 相似文献
6.
针对协方差矩阵含有期望信号成分以及波束指向角失配时,传统自适应波束形成器性能严重下降的问题,提出了协方差矩阵重构的稳健自适应波束形成算法。该算法将全空域划分成若干互不重叠的区域,分别对应干扰区域与信号区域,先利用Capon波束形成器对干扰区域积分,由此构造出干扰协方差矩阵。然后,利用标准Capon波束形成器的波束域MUSIC谱估计法对信号区域积分,重构出信号协方差矩阵,以其主特征向量作为期望信号导引向量估计。由于算法重构了干扰加噪声协方差矩阵并对导引向量进行了修正,保证了自适应波束形成器的性能。理论分析和仿真实验结果表明,算法在训练数据含有期望信号成分和波束指向角度失配情况下具有良好的性能。 相似文献
7.
基于后验概率度量的粒子滤波跟踪算法研究 总被引:1,自引:1,他引:0
针对遮挡、光照变化、尺度变化等复杂环境中的视觉跟踪问题,提出一种基于后验概率度量的粒子滤波跟踪算法。由于后验概率指标与Bhattacharyya系数指标相比具有更强的峰值特性,采用后验概率指标作为相似性度量函数,通过粒子的更新、推广、观测、估计等步骤实现跟踪算法。通过对实际视频图像序列进行目标跟踪实验,实验结果表明:传统算法只有约50%的图像能够实现尺度自适应,而本文算法采用传统算法25%的粒子就能够收敛逼近目标的真实轨迹,达到更强的抗遮挡能力,90%以上的图像序列都能够实现良好的尺度自适应效果。 相似文献
8.
9.
10.
基于小波概率估计的图像融合方法研究 总被引:6,自引:4,他引:2
在研究了已有的图像融合方法后,提出基于小波变换和最大似然概率估计(MLE)相综合的融合方法,利用概率估计融合模型,首先对不同的传感器图像进行小波分解,然后对相应的子带求解仿射变换参数,根据Bayes规则进行最大后验概率似然估计,得到估计子带系数,最后通过小波反变换得到融合图像.在仿射变换的假设条件下定义融合规则,更适合传感器图像具有局部相反对比度的情况,采用此方法对航空可见光图像和红外图像进行融合实验,其结果与采用其它方法进行了对比,表明该方法的有效性. 相似文献
11.
12.
13.
以提高室内混响环境下自动语音识别(ASR)性能为目标,讨论了一种小尺寸传声器阵处理方法.该方法采用基于旋转不变技术的信号参数估计算法(ESPRIT)计算宽带语音信号到达方向角,进行时延补偿;同时联合考虑阵列滤波与隐马尔可夫模型(HMM)识别过程,将识别输出结果反馈到前端的传声器阵处理,优化阵列滤波系数.与常规阵处理方法改善信号波形质量不同,本文通过调节阵列滤波系数降低待识别特征与训练模型之间的失配,直接提高识别过程中正确假设的概率.实验结果表明,上述方案能够有效降低会议室环境下孤立词有限词库ASR的错误概率,表现优于常规波束形成方法;采用全局优化进行阵列滤波设计,与局部优化算法相比,进一步改善了处理性能. 相似文献
14.
15.
为提高连续语音识别中的音素识别率,提出一种基于改进并行回火训练的受限波尔兹曼机的音素识别算法。首先,利用经过等能量划分后的改进并行回火算法来训练受限玻尔兹曼机,接着将受限玻尔兹曼机堆叠组成一个深信度网络,从而作为深度神经网络预训练的基础模型,然后通过softmax层输出,得到用于音素状态后验概率检测的深度神经网络。接着,利用少量的标签数据,根据反向传播算法对网络权重进行微调。最后,将所得后验概率作为隐马尔科夫的发射概率,然后利用Viterbi解码器实现音素识别。在TIMIT语料库上的实验表明,识别率相比于传统的对比散度类算法提高了约4.5%,在不增加计算量的情况下比原始并行回火算法提高约1%。 相似文献
16.
基于扇区特征向量约束的稳健自适应匹配场处理器 总被引:3,自引:3,他引:3
自适应匹配场处理可以获得较高的定位精度和旁瓣抑制性能,但需要精确计算的拷贝场向量和参数搜索空间内的精细采样,这为自适应匹配场在实际复杂海洋环境中的实时应用造成了困难。本文提出了一种新的稳健自适应匹配场处理算法,用以同时克服环境参数失配和实时搜索计算量大这两个问题。新算法集成了邻点位置约束、环境扰动约束和扇区聚焦约束等三种自适应匹配场处理器的优点,采用扇区与环境扰动双重约束,不仅对环境参数失配更具宽容性,而且可确保目标位于扇区内的任何点时,主瓣增益损失较小。典型浅海环境下的数值仿真和实测数据分析表明,该算法在一定的环境失配条件下不仅能有效地检测定位目标,还能实现距离/深度平面内的大扇区目标搜索,可大大减小实时运算量。 相似文献
17.
自适应波束形成方法在存在协方差矩阵误差和导向向量误差的失配条件中性能严重下降。最差情况性能最优。(Worst-Case Performance Optimization,WCPO)方法可以显著增强失配条件下自适应波束形成的鲁棒性,但该方法存在系统性的信号功率过估计问题,并且限定协方差矩阵不确定集与导向向量不确定集的两个关键参数需要人为指定,缺乏具备明确物理意义的求解方法和数据自适应性.本文以WCPO方法为基础,给出了信号功率过估计的理论分析以及相应的改进方法,提出了基于矩阵重构的协方差矩阵不确定集参数的自适应估计方法,最终得到一种可变不确定集约束的鲁棒自适应波束形成方法(WCPO-PCVC).相比WCPO方法,该方法消除了信号功率估计的系统性偏差,且关键参数无需人为指定。数值仿真和海试数据处理结果表明,该方法在失配条件下具有良好的干扰与旁瓣抑制能力,与常规波束形成方法相比具有更好的信号到达角分辨能力,与自适应波束形成方法相比估计的信号功率更为精准。 相似文献
18.
语音存在概率的估计是语音增强的核心技术之一,针对传统的存在概率估计方法是启发式的,没有把存在概率的估计统一到一个理论框架之中,不能保证估计最优,提出了一种基于序贯隐马尔可夫模型(SHMM)的存在概率估计方法,在每一子带上构建一个SHMM模型描述对数功率谱包络的时间序列,把谱包络序列看作一个在语音和噪声状态之间转移的动态一阶马尔可夫链,采用单高斯函数构建每一状态的概率模型,语音状态的后验概率即为语音信号的存在概率。为了满足算法实时性要求,SHMM参数估计简化为一阶回归过程,根据极大似然准则逐帧更新模型参数。实验表明:SHMM所描述的时序相关性对存在概率的估计起到关键作用,它优于一般的启发式估计方法;SHMM算法的语音增强分段信噪比(SegSNR)和对数谱失真(LSD)性能优于经典的改进型最小统计量控制递归平均(IMCRA)算法。 相似文献
19.
针对传统的Gamma分布下最大后验概率降斑算法不能有效保留均匀区域的点目标, 不能有效保留弱边缘以及不能有效滤除强边缘区域的斑点等问题, 提出了基于第二类统计量的先验参数估计的高分辨率合成孔径雷达图像Gamma 分布下最大后验概率降斑算法. 使用Mellin卷积和斑点的乘性模型, Gamma先验分布的参数可由观察图像的前两阶对数累积量精确估计.所提算法具有解析的滤波输出, 便于实现.农田和城区的高分辨率合成孔径雷达图像的降斑实验表明, 与传统的Gamma分布下最大后验概率降斑算法相比, 所提算法既能有效保留均匀区域的点目标, 又能有效保留弱边缘, 还能有效滤除强边缘区域的斑点.
关键词:
高分辨率合成孔径雷达图像
Gamma分布下最大后验概率降斑算法
第二类统计量
对数累积量 相似文献
20.
基于环境扰动的线性匹配场处理方法 总被引:5,自引:1,他引:5
匹配场处理面临的挑战主要是拷贝场失配。常规线性匹配场处理方法虽然对失配较宽容,但旁瓣较高,定位正确率依赖于失配的程度,且很容易受到强干扰的影响而失效。自适应匹配场处理可以获得较高的定位精度和旁瓣抑制性能,但环境参数失配、距离/深度空间欠采样、基阵及环境的波动所造成的误差等因素,均会导致其性能严重下降。环境扰动约束可提高自适应匹配场处理器的稳健性,基于这种思想,提出了基于环境扰动的线性匹配场处理方法,它不仅在环境失配的条件下比常规线性方法的定位正确率更高,而且在阵列采样数据存在幅度与相位随机误差的条件下,比自适应匹配场方法的稳健性更强.针对环境失配条件下的强干扰问题,还提出了一种线性匹配场干扰抑制算法,可有效地抑制水面干扰。典型浅海环境下的数值仿真和实测数据分析验证了方法的有效性. 相似文献