共查询到20条相似文献,搜索用时 78 毫秒
1.
针对遮挡、光照变化、尺度变化等复杂环境中的视觉跟踪问题,提出一种基于后验概率度量的粒子滤波跟踪算法。由于后验概率指标与Bhattacharyya系数指标相比具有更强的峰值特性,采用后验概率指标作为相似性度量函数,通过粒子的更新、推广、观测、估计等步骤实现跟踪算法。通过对实际视频图像序列进行目标跟踪实验,实验结果表明:传统算法只有约50%的图像能够实现尺度自适应,而本文算法采用传统算法25%的粒子就能够收敛逼近目标的真实轨迹,达到更强的抗遮挡能力,90%以上的图像序列都能够实现良好的尺度自适应效果。 相似文献
2.
在Poisson和Markov随机场分布假设基础上,改进了存在噪声时多通道互限制原则,提出了一种基于最大后验概率判据的多通道图像盲复原算法,可在无需已知通道内离散点扩散函数性质、类型和具体分布等先验知识的情况下,在图像幅度限制约束空间和离散点扩散函数能量恒定约束空间内,通过对图像和离散点扩散函数的交替迭代,使两者收敛到全局最优解,最终复原出超分辨率图像.对计算机模拟和实际存在微平移、微离焦情况的图像处理表明:算法在不同信噪比水平和非命中PSF尺寸下具有良好的图像复原效果和稳定性.
关键词:
泊松-马尔科夫分布
最大后验概率
多通道
盲复原 相似文献
3.
针对传统的Gamma分布下最大后验概率降斑算法不能有效保留均匀区域的点目标, 不能有效保留弱边缘以及不能有效滤除强边缘区域的斑点等问题, 提出了基于第二类统计量的先验参数估计的高分辨率合成孔径雷达图像Gamma 分布下最大后验概率降斑算法. 使用Mellin卷积和斑点的乘性模型, Gamma先验分布的参数可由观察图像的前两阶对数累积量精确估计.所提算法具有解析的滤波输出, 便于实现.农田和城区的高分辨率合成孔径雷达图像的降斑实验表明, 与传统的Gamma分布下最大后验概率降斑算法相比, 所提算法既能有效保留均匀区域的点目标, 又能有效保留弱边缘, 还能有效滤除强边缘区域的斑点.
关键词:
高分辨率合成孔径雷达图像
Gamma分布下最大后验概率降斑算法
第二类统计量
对数累积量 相似文献
4.
深入分析了BP(Back-Propagation)算法的缺陷,在BP算法的基础上,提出逐层训练多层网络的快速算法,主要精神是:a)逐层地训练多层网络而不是一起训练;b)对隐单元层给以具体指导;c)根据具体问题给予合适的权重分配规则即合适的"能量函数";d)保持BP算法的优点。对一些问题的训练速度与BP算法比较有几个数量级的提高。这一算法还可对多层网络的运行机制作一些研究. 相似文献
5.
6.
为了反映合成孔径雷达图像中斑点噪声尖峰厚尾的统计特征,使用拖尾Rayleigh分布来描述斑点噪声.基于Gamma先验分布和斑点噪声的拖尾Rayleigh分布,推导出了合成孔径雷达图像的最大后验概率滤波方程,并给出了它在特定特征参数时的解析形式.使用Mellin变换从观察图像估计拖尾Rayleigh分布的未知参数.给出了在斑点噪声的拖尾Rayleigh分布下的最大后验概率降噪试验和量化指标.为了消除滑动窗大小和噪声强度对降噪结果的影响,给出了降噪能力随滑动窗大小和噪声方差的动态变化关系.结果表明,拖尾Ray
关键词:
斑点噪声
拖尾Rayleigh分布
最大后验概率降噪
Mellin变换 相似文献
7.
8.
多光谱/全色影像融合可以得到高空间分辨率的多光谱影像,在影像解译和分类等方面具有十分重要的意义。提出一种基于梯度一致性约束的遥感影像融合方法。该方法在最大后验概率框架下,通过梯度一致性约束建立理想高空间分辨率多光谱影像和全色影像之间的关系,并结合多光谱影像观测模型和Huber-Markov影像先验,构建融合目标函数,最后采用梯度下降法求解得到融合影像。本文方法在目标函数中引入了梯度一致性约束,克服了现有的同类方法受限于波段数量的缺陷,同时在求解中自适应确定每个波段的迭代步长,充分顾及了各波段的光谱特性,从而既确保了融合影像的光谱信息保真度,也提高了融合影像的空间信息融入度。通过IKONOS和WorldView-2影像对该方法进行了验证,并和GS,AIHS和AMBF等融合方法从定性和定量两方面进行了比较分析。实验结果表明,相比于其他方法,该方法可以在更好保持光谱信息的同时增强影像的空间分辨率,具有更广泛的适用范围和更佳的融合效果。 相似文献
9.
10.
提出一种基于梯度定义和蚁群算法的边缘提取算法.根据梯度在边缘处的直观响应,提出自适应的边缘特征定义,并结合蚁群算法的特性,令蚂蚁遗留不同等级的信息素.根据搜索权值矩阵得到尽量平滑的边缘,最终的边缘通过自动阈值进行提取.实验表明:该算法的性能在同样的智能算法和经典的边缘检测算子中表现良好,并对噪音不敏感. 相似文献
11.
针对深度神经网络与隐马尔可夫模型(DNN-HMM)结合的声学模型在语音识别过程中建模能力有限等问题,提出了一种改进的DNN-HMM模型语音识别算法。首先根据深度置信网络(DBN)结合深度玻尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC)和对数域的Mel滤波器组系数(Fbank)作为声学特征参数,通过TIMIT语音数据集进行实验。实验结果表明:结合了DBM的DNN-HMM模型相比DNN-HMM模型更具优势,其中,使用MFCC声学特征在词错误率与句错误率方面分别下降了1.26%和0.20%。此外,使用默认滤波器组的Fbank特征在词错误率与句错误率方面分别下降了0.48%和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到21.06%和3.12%的好成绩。 相似文献
12.
当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。 相似文献
13.
14.
盲分离算法能在缺少混合系统参数的条件下仅由观测信号估计初始源,但分离信号存在固有的排列模糊性,这往往导致两次批处理过程中同一信号"对不准",因此很难获得连续的源信号。本文针对盲声源分离中存在的相同问题,根据语音和其他音频信号的特征差异,提出一种修正的自相关函数并以其值作为一个特征基元来表征声音信号的时序相关特性,同时用平均声门波形状参数作为另一个特征基元来表征语音产生的生理效应。以这两个参数作为识别不同音频信号的二维模式特征,采用一种模糊聚类算法提取多路盲分离语音。本方法有效克服了批处理盲声源分离中的信号排列顺序的不确定性,并通过选择合适的阈值提取多路连续语音。仿真给出了5路混合音频信号中盲提取两路连续语音的实验结果。 相似文献
15.
本文提出了语音信号的一种时域-频域-能量表示,并给出了算法,可用于孤立词语音识别,这种时域-频域-能量表示有两个特点,基于短时能量梯度的非线性时间规正,可保留语音信号频域的过滤特性,丢掉其稳态特性,计算量小,适于实时应用。 相似文献
16.
OU Guiwen 《声学学报:英文版》1994,(1)
I.Intr0ductionNowadays,thereismuchadvancemcntinthcrcsearchintospeechrecognition.Manyresearchershavebecninterestedintheimplementationofareliab1crealtimerec-ognitionsystemofunlimitedv0cabu1ary.Thercareafewproductsconversingsyl1ablesintoChinesecharactersinthemarket.However,theimp1ementationofarobustrealtAnerecognitionsystemofunlimitcdvocabularyisvcrydifficu1t,anditisthcgreataimofourresearch.WehaveaTMS32O-C25signa1processingboardattachedtoacomputerofthM-PC/AT80386.Wehopcthatourspeechrecognit… 相似文献
17.
语声情感识别对人机交互和情感计算研究领域具有重要作用,各类研究方法层出不穷。近期研究学者应用卷积神经网络和长短期记忆网络方法提取对数Mel谱图空间特征和时间特征,取得了一定的成果。然而不论是卷积神经网络还是长短期记忆网络提取特征时,都会产生特征冗余,导致语声情感识别效果下降。针对这一问题,该文提出了一种基于时空注意力机制的卷积-递归神经网络模型,采用对数Mel谱图和其一阶差分、二阶差分作为特征输入,在使用卷积神经网络提取空间特征和长短期记忆网络提取时间特征时,加入空间注意力和时间注意力机制,从而使上述网络能够更好地提取到对数Mel谱图中有效表征情感的空间特征和时间特征。该模型在Emo-DB和IEMOCAP语声数据集上的加权准确率分别达到86.8%、69.4%,未加权准确率分别达到84.7%、65.5%,优于当前大多数先进方法。 相似文献
18.
真实环境中存在的噪声和混响会降低语音识别系统的性能。封闭空间中的混响包括直达声、早期反射和后期混响3部分,它们对语音识别系统具有不同的影响.我们研究了早期反射和后期混响的不同划分方法,以其中的早期反射为目标语音,计算出了不同的理想比值掩蔽并研究了它们对语音识别系统性能的影响;在此基础上,利用双向长短时记忆网络(BLSTM)估计理想比值掩蔽,测试它们对语音识别系统性能的影响.实验结果表明,基于Abel早期反射和后期混响的划分方法,理想比值掩蔽能够降低词错误率约2.8%;基于BLSTM的估计方法过低估计了理想比值掩蔽,未能有效提高语音识别系统的性能。 相似文献
19.
20.
I.TntroductionStatisticalandneuralnetworkmcthodsforpatternclassiflcationusesignificantlydifTerentapproachesintrainingaclassificr.Inthestatistica1approach,thcformationofaclassifier1arge1ydependsonthestatisticsofthetrainingpatternsand,insomecases,theassumptionsaboutthedistributionofthepopulation.Theneuralnetworkmethodisnon-parametricandcanbeadaptivcinthetrainingprocessl'l.Becauseofitssimplicityandflexibility,theneuralnetworkhasbecnincreasing1yusedforpatternclassiflcation.Itisnowwe11knownthatan… 相似文献