期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李向军李良福《应用光学》2011,32(4):646-651

针对遮挡、光照变化、尺度变化等复杂环境中的视觉跟踪问题,提出一种基于后验概率度量的粒子滤波跟踪算法。由于后验概率指标与Bhattacharyya系数指标相比具有更强的峰值特性,采用后验概率指标作为相似性度量函数,通过粒子的更新、推广、观测、估计等步骤实现跟踪算法。通过对实际视频图像序列进行目标跟踪实验,实验结果表明:传统算法只有约50%的图像能够实现尺度自适应,而本文算法采用传统算法25%的粒子就能够收敛逼近目标的真实轨迹,达到更强的抗遮挡能力,90%以上的图像序列都能够实现良好的尺度自适应效果。相似文献

2.

基于Poisson-Markov分布最大后验概率的多通道超分辨率盲复原算法

下载免费PDF全文

陈翼男金伟其赵磊赵琳《物理学报》2009,58(1):264-271

在Poisson和Markov随机场分布假设基础上,改进了存在噪声时多通道互限制原则,提出了一种基于最大后验概率判据的多通道图像盲复原算法,可在无需已知通道内离散点扩散函数性质、类型和具体分布等先验知识的情况下,在图像幅度限制约束空间和离散点扩散函数能量恒定约束空间内,通过对图像和离散点扩散函数的交替迭代,使两者收敛到全局最优解,最终复原出超分辨率图像.对计算机模拟和实际存在微平移、微离焦情况的图像处理表明：算法在不同信噪比水平和非命中PSF尺寸下具有良好的图像复原效果和稳定性. 关键词：泊松-马尔科夫分布最大后验概率多通道盲复原相似文献

3.

高分辨率合成孔径雷达图像的Gamma分布下最大后验概率降斑算法 总被引：1，自引：0，他引：1

下载免费PDF全文

孙增国《物理学报》2013,62(18):180701-180701

针对传统的Gamma分布下最大后验概率降斑算法不能有效保留均匀区域的点目标, 不能有效保留弱边缘以及不能有效滤除强边缘区域的斑点等问题, 提出了基于第二类统计量的先验参数估计的高分辨率合成孔径雷达图像Gamma 分布下最大后验概率降斑算法. 使用Mellin卷积和斑点的乘性模型, Gamma先验分布的参数可由观察图像的前两阶对数累积量精确估计.所提算法具有解析的滤波输出, 便于实现.农田和城区的高分辨率合成孔径雷达图像的降斑实验表明, 与传统的Gamma分布下最大后验概率降斑算法相比, 所提算法既能有效保留均匀区域的点目标, 又能有效保留弱边缘, 还能有效滤除强边缘区域的斑点. 关键词：高分辨率合成孔径雷达图像 Gamma分布下最大后验概率降斑算法第二类统计量对数累积量相似文献

4.

一种快速分类的神经元网络算法

陈国新张承福《计算物理》1995,12(2):203-206

深入分析了BP(Back-Propagation)算法的缺陷,在BP算法的基础上,提出逐层训练多层网络的快速算法,主要精神是:a)逐层地训练多层网络而不是一起训练;b)对隐单元层给以具体指导;c)根据具体问题给予合适的权重分配规则即合适的"能量函数";d)保持BP算法的优点。对一些问题的训练速度与BP算法比较有几个数量级的提高。这一算法还可对多层网络的运行机制作一些研究. 相似文献

5.

基于最大后验概率的人脸平移与旋转跟踪方法研究

李良福陈卫东郑宝忠《应用光学》2011,32(1)

针对目前大多数视觉跟踪算法只能够跟踪平移运动人脸目标,而不能跟踪旋转运动人脸目标这一问题,提出一种基于最大后验概率的人脸目标平移与旋转跟踪方法。在基于最大后验概率的视觉跟踪算法基础上,采用了自适应角度模板进行人脸目标旋转跟踪,与传统的视觉跟踪方法相比,当人脸发生倾斜时,该方法能更精确地得到人脸的位置和方向。实验结果表明,该方法能够有效地跟踪具有平移与旋转运动的人脸目标。相似文献

6.

基于斑点噪声的拖尾Rayleigh分布的合成孔径雷达图像最大后验概率降噪

下载免费PDF全文

孙增国韩崇昭《物理学报》2007,56(8):4565-4570

为了反映合成孔径雷达图像中斑点噪声尖峰厚尾的统计特征，使用拖尾Rayleigh分布来描述斑点噪声.基于Gamma先验分布和斑点噪声的拖尾Rayleigh分布，推导出了合成孔径雷达图像的最大后验概率滤波方程，并给出了它在特定特征参数时的解析形式.使用Mellin变换从观察图像估计拖尾Rayleigh分布的未知参数.给出了在斑点噪声的拖尾Rayleigh分布下的最大后验概率降噪试验和量化指标.为了消除滑动窗大小和噪声强度对降噪结果的影响，给出了降噪能力随滑动窗大小和噪声方差的动态变化关系.结果表明，拖尾Ray 关键词：斑点噪声拖尾Rayleigh分布最大后验概率降噪 Mellin变换相似文献

7.

基于Markov约束的泊松最大后验概率超分辨率图象复原法 总被引：15，自引：3，他引：12

苏秉华金伟其牛丽红刘广荣刘明奇《光子学报》2002,31(4):492-496

提出了基于Markov约束的泊松最大后验概率(Poisson-MAP)超分辨率图象复原方法(MPMAP),该方法把Poisson-MAP法和Markov随机场先验分布有机地结合在一起.实验表明,该方法能有效地减少和去除复原图象中的噪音和振荡条纹,提高图象复原质量,具有很好的超分辨率复原能力. 相似文献

8.

基于梯度一致性约束的多光谱/全色影像最大后验融合方法

孟祥超沈焕锋张洪艳张良培李慧芳《光谱学与光谱分析》2014,34(5):1332-1337

多光谱/全色影像融合可以得到高空间分辨率的多光谱影像,在影像解译和分类等方面具有十分重要的意义。提出一种基于梯度一致性约束的遥感影像融合方法。该方法在最大后验概率框架下,通过梯度一致性约束建立理想高空间分辨率多光谱影像和全色影像之间的关系,并结合多光谱影像观测模型和Huber-Markov影像先验,构建融合目标函数,最后采用梯度下降法求解得到融合影像。本文方法在目标函数中引入了梯度一致性约束,克服了现有的同类方法受限于波段数量的缺陷,同时在求解中自适应确定每个波段的迭代步长,充分顾及了各波段的光谱特性,从而既确保了融合影像的光谱信息保真度,也提高了融合影像的空间信息融入度。通过IKONOS和WorldView-2影像对该方法进行了验证,并和GS,AIHS和AMBF等融合方法从定性和定量两方面进行了比较分析。实验结果表明,相比于其他方法,该方法可以在更好保持光谱信息的同时增强影像的空间分辨率,具有更广泛的适用范围和更佳的融合效果。相似文献

9.

一种基于谱相关性的概率松弛匹配算法

《光学学报》2010,30(3)

为了可靠实现点模式匹配,提出了一种基于谱相关性的概率松弛匹配算法。先根据待匹配点集的形状上下文计算初始匹配概率,然后由待匹配点集构造亲近矩阵并进行奇异值分解,将得到的谱的相关性作为初始支持度。最后利用概率松弛迭代方法实现两个点集之间的匹配。实验结果表明该算法匹配精度较高。相似文献

10.

一种基于蚁群算法的边缘提取算法

陈亮郭雷《光子学报》2014,39(4):759-763

提出一种基于梯度定义和蚁群算法的边缘提取算法.根据梯度在边缘处的直观响应,提出自适应的边缘特征定义,并结合蚁群算法的特性,令蚂蚁遗留不同等级的信息素.根据搜索权值矩阵得到尽量平滑的边缘,最终的边缘通过自动阈值进行提取.实验表明：该算法的性能在同样的智能算法和经典的边缘检测算子中表现良好,并对噪音不敏感. 相似文献

11.

一种改进的DNN-HMM的语音识别方法* 总被引：1，自引：1，他引：1

下载免费PDF全文

李云红梁思程贾凯莉张秋铭宋鹏何琛王刚毅李禹萱《应用声学》2019,38(3):371-377

针对深度神经网络与隐马尔可夫模型(DNN-HMM)结合的声学模型在语音识别过程中建模能力有限等问题,提出了一种改进的DNN-HMM模型语音识别算法。首先根据深度置信网络(DBN)结合深度玻尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC)和对数域的Mel滤波器组系数(Fbank)作为声学特征参数,通过TIMIT语音数据集进行实验。实验结果表明:结合了DBM的DNN-HMM模型相比DNN-HMM模型更具优势,其中,使用MFCC声学特征在词错误率与句错误率方面分别下降了1.26%和0.20%。此外,使用默认滤波器组的Fbank特征在词错误率与句错误率方面分别下降了0.48%和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到21.06%和3.12%的好成绩。相似文献

12.

基于双向循环神经网络的汉语语音识别*

下载免费PDF全文

李鹏杨元维杜李慧高贤君周意蒋梦月张净波《应用声学》2020,39(3):464-471

当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。相似文献

13.

汉语耳语音孤立字识别研究 总被引：6，自引：0，他引：6

下载免费PDF全文

杨莉莉林玮徐柏龄《应用声学》2006,25(3):187-192

耳语音识别有着广泛的应用前景,是一个全新的课题.但是由于耳语音本身的特点,如声级低、没有基频等,给耳语音识别研究带来了困难.本文根据耳语音信号发音模型,结合耳语音的声学特性,建立了一个汉语耳语音孤立字识别系统.由于耳语音信噪比低,必须对其进行语音增强处理,同时在识别系统中应用声调信息提高了识别性能.实验结果说明了MFCC结合幅值包络可作为汉语耳语音自动识别的特征参数,在小字库内用HMM模型识别得出的识别率为90.4%. 相似文献

14.

一种基于模式识别的多路盲语音提取方法

下载免费PDF全文

徐舜刘郁林柏森《应用声学》2008,27(3):173-180

盲分离算法能在缺少混合系统参数的条件下仅由观测信号估计初始源,但分离信号存在固有的排列模糊性,这往往导致两次批处理过程中同一信号"对不准",因此很难获得连续的源信号。本文针对盲声源分离中存在的相同问题,根据语音和其他音频信号的特征差异,提出一种修正的自相关函数并以其值作为一个特征基元来表征声音信号的时序相关特性,同时用平均声门波形状参数作为另一个特征基元来表征语音产生的生理效应。以这两个参数作为识别不同音频信号的二维模式特征,采用一种模糊聚类算法提取多路盲分离语音。本方法有效克服了批处理盲声源分离中的信号排列顺序的不确定性,并通过选择合适的阈值提取多路连续语音。仿真给出了5路混合音频信号中盲提取两路连续语音的实验结果。相似文献

15.

实时识别中语音的时域─频域─能量表示

下载免费PDF全文

罗万伯张露李志蜀罗霄峰罗霄岚 Duanpei Wu 《应用声学》2001,20(3):31-33,10

本文提出了语音信号的一种时域－频域－能量表示,并给出了算法,可用于孤立词语音识别,这种时域－频域－能量表示有两个特点,基于短时能量梯度的非线性时间规正,可保留语音信号频域的过滤特性,丢掉其稳态特性,计算量小,适于实时应用。相似文献

16.

Recognition of Putonghua voiceless stop like initials based on speech main periods

OU Guiwen 《声学学报：英文版》1994,(1)

I.Intr0ductionNowadays,thereismuchadvancemcntinthcrcsearchintospeechrecognition.Manyresearchershavebecninterestedintheimplementationofareliab1crealtimerec-ognitionsystemofunlimitedv0cabu1ary.Thercareafewproductsconversingsyl1ablesintoChinesecharactersinthemarket.However,theimp1ementationofarobustrealtAnerecognitionsystemofunlimitcdvocabularyisvcrydifficu1t,anditisthcgreataimofourresearch.WehaveaTMS32O-C25signa1processingboardattachedtoacomputerofthM-PC/AT80386.Wehopcthatourspeechrecognit… 相似文献

17.

基于STA-CRNN模型的语声情感识别*

下载免费PDF全文

张志浩王坤侠《应用声学》2022,41(5):843-850

语声情感识别对人机交互和情感计算研究领域具有重要作用,各类研究方法层出不穷。近期研究学者应用卷积神经网络和长短期记忆网络方法提取对数Mel谱图空间特征和时间特征,取得了一定的成果。然而不论是卷积神经网络还是长短期记忆网络提取特征时,都会产生特征冗余,导致语声情感识别效果下降。针对这一问题,该文提出了一种基于时空注意力机制的卷积-递归神经网络模型,采用对数Mel谱图和其一阶差分、二阶差分作为特征输入,在使用卷积神经网络提取空间特征和长短期记忆网络提取时间特征时,加入空间注意力和时间注意力机制,从而使上述网络能够更好地提取到对数Mel谱图中有效表征情感的空间特征和时间特征。该模型在Emo-DB和IEMOCAP语声数据集上的加权准确率分别达到86.8%、69.4%,未加权准确率分别达到84.7%、65.5%,优于当前大多数先进方法。相似文献

18.

早晚期混响划分对理想比值掩蔽在语音识别性能上的影响 总被引：2，自引：0，他引：2

下载免费PDF全文

高飞黄哲莹王子腾李军锋颜永红《声学学报》2019,44(4):788-795

真实环境中存在的噪声和混响会降低语音识别系统的性能。封闭空间中的混响包括直达声、早期反射和后期混响3部分,它们对语音识别系统具有不同的影响.我们研究了早期反射和后期混响的不同划分方法,以其中的早期反射为目标语音,计算出了不同的理想比值掩蔽并研究了它们对语音识别系统性能的影响;在此基础上,利用双向长短时记忆网络(BLSTM)估计理想比值掩蔽,测试它们对语音识别系统性能的影响.实验结果表明,基于Abel早期反射和后期混响的划分方法,理想比值掩蔽能够降低词错误率约2.8%;基于BLSTM的估计方法过低估计了理想比值掩蔽,未能有效提高语音识别系统的性能。相似文献

19.

基于RL特征的光学公式识别方法

田学东田大增哈明虎《光学技术》2007,33(1):79-82

提出了一种光学公式识别与分析的新方法,在公式符号提取与识别中采用RL(Run_length)特征以提高识别率。采用二层连通区域搜索算法提取公式符号的图像,其中第一层为基于RL特征的符号提取,得到复合符号的整体连通区域;第二层为传统搜索方法,进一步确定这些复合符号中包含的单一符号。设计了专门的公式符号识别器,对公式符号进行识别;根据符号间的语义信息和几何关系得到公式的逻辑结构;最终表达为公式结构树。在对印刷文献中所含公式的识别实验中取得了较好的效果,表明该方法具有良好的应用前景。相似文献

20.

A multi-target approach for isolated word recognition using artificial neural network

QI Yingyong BI Ning 《声学学报：英文版》1994,(2)

I.TntroductionStatisticalandneuralnetworkmcthodsforpatternclassiflcationusesignificantlydifTerentapproachesintrainingaclassificr.Inthestatistica1approach,thcformationofaclassifier1arge1ydependsonthestatisticsofthetrainingpatternsand,insomecases,theassumptionsaboutthedistributionofthepopulation.Theneuralnetworkmethodisnon-parametricandcanbeadaptivcinthetrainingprocessl'l.Becauseofitssimplicityandflexibility,theneuralnetworkhasbecnincreasing1yusedforpatternclassiflcation.Itisnowwe11knownthatan… 相似文献