首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对目前有监督语音增强忽略了纯净语音、噪声与带噪语音之间的幅度谱相似性对增强效果影响等问题,提出了一种联合精确比值掩蔽(ARM)与深度神经网络(DNN)的语音增强方法。该方法利用纯净语音与带噪语音、噪声与带噪语音的幅度谱归一化互相关系数,设计了一种基于时频域理想比值掩蔽的精确比值掩蔽作为目标掩蔽;然后以纯净语音和噪声幅度谱为训练目标的DNN为基线,通过该DNN的输出来估计目标掩蔽,并对基线DNN和目标掩蔽进行联合优化,增强语音由目标掩蔽从带噪语音中估计得到;此外,考虑到纯净语音与噪声的区分性信息,采用一种区分性训练函数代替均方误差(MSE)函数作为基线DNN的目标函数,以使网络输出更加准确。实验表明,区分性训练函数提升了基线DNN以及整个联合优化网络的增强效果;在匹配噪声和不匹配噪声下,相比于其它常见DNN方法,本文方法取得了更高的平均客观语音质量评估(PESQ)和短时客观可懂度(STOI),增强后的语音保留了更多语音成分,同时对噪声的抑制效果更加明显。   相似文献   

2.
黄浩  朱杰 《声学学报》2008,33(1):1-8
提出一种区分性方法,将声调信息加入大词汇量连续语音识别系统中.该方法根据最小音子错误准则,区分性地训练模型相关的概率权重.利用这些权重对传统基于传统谱特征的隐马尔可夫模型概率以及声调模型概率进行加权,通过调整模型之间的作用程度提高系统识别率.推导了利用扩展Baum-Welch算法的权重更新公式.对不同模型权重组合策略进行了评估,并利用权重之间的平滑方法来克服权重训练过拟合的问题.分别通过大词汇连续语音的带调音节输出和汉字输出两种识别任务来验证区分性模型权重训练的性能.实验结果表明在两种识别任务上,区分性的模型权重较使用全局模型权重分别获得9.5%以及4.7%的相对误识率降低.这表明了区分性模型权重对提高声调集成性能的有效性.  相似文献   

3.
四元量化的综合鉴别函数滤波器实现比例不变相关识别   总被引:2,自引:2,他引:0  
赵昱  申铉国 《光子学报》2005,34(8):1156-1159
设计一种基于综合鉴别函数(SDF)的比例不变相关识别滤波器,将频域中被SDF调制的相关输出函数进行复数形式的四元量化(QFCQ),并采用叠代算法调整SDF的系数,使输出的相关峰尖锐,区分能力强,同时满足不同比例图像等相关峰输出的准则,从而达到了比例不变识别的要求.计算机仿真实验对属于训练图像系列的目标图像进行了识别,并与基本的SDF及二元化纯相位SDF做了比较,结果表明该方法具有较好的识别效果.  相似文献   

4.
陈斌  陈琦  张连海  屈丹  李弼程 《声学学报》2016,41(1):125-134
在区分性训练的框架下,提出了一种基于混淆信息加权的互补系统构造方法。首先通过统计音素对的混淆信息,利用混淆信息给音素对加以不同的惩罚权重,分别以基线系统中的3个最优识别结果作为参考,计算混淆信息加权后的音素准确率,同时以正确的标注为参考计算标准的音素准确率。然后通过同时最大化混淆信息加权后的音素准确率和最小化标准音素准确率,构建模型层互补系统,并进一步通过结合RDLT (region-dependent linear transform)特征变换过程构造特征层的互补系统。实验结果表明,与互补最小音素错误准则相比,融合模型层互补系统后识别率提高了0.76%,同时融合特征层和模型层的互补系统识别率提高了1.35%。本方法可以增大互补系统间的差异性,提高系统融合后的识别性能。   相似文献   

5.
摘要为了提高计算机辅助语言学习中自动发音错误检测系统的性能,提出一种声学模型的区分性训练方法。该方法将经过正确度标注的非母语语音数据库上的发音错误检测的F1值的最大化作为模型参数的训练准则。采用Sigmoid 函数对F1值函数进行平滑构造目标函数,并利用构造弱意义辅助函数的方法以及扩展Baum-Welch 形式的参数更新公式进行优化。提出在模型参数更新与音素门限同时优化的策略保证目标函数增长的单调性。发音错误检测实验表明该方法能够有效地增大训练和测试数据检错的F1值。同时训练数据和测试数据上的精确度、召回率以及检测正确度都有明显改进。   相似文献   

6.
张天骐  熊梅  张婷  杨强 《声学学报》2019,44(3):393-400
针对音乐信号中的歌声与伴奏相互关联难以分离的问题,提出了一种区分性训练深度神经网络(Deep Neural Network,DNN)的音乐分离方法。首先,在DNN模型的基础上同时考虑歌声与伴奏间的重建误差和区分性信息,提出了一种改进的目标函数进行区分性训练;其次,在DNN模型上额外添加一层,引入时频掩蔽对估计出的歌声伴奏进行联合优化,相应的时域信号由傅里叶逆变换获得;最后,验证不同参数设置对分离性能的影响,并与现有的音乐分离方法进行对比.实验结果表明,改进的目标函数和时频掩蔽的引入明显提高了DNN的分离性能,且与现有的音乐分离方法相比分离性能最高提高了4 dB从而证实所提方法是一种有效的音乐分离方法。   相似文献   

7.
殷明  刘卫 《光子学报》2014,(6):751-756
提出了一种基于非下采样Contourlet变换(NSCT)域图像去噪算法.首先根据尺度间与尺度内的NSCT系数之间的相关性,用非高斯分布模型对NSCT系数与其邻域系数及父系数进行建模,给出分类准则,把系数分为重要系数和非重要系数,再采用广义高斯分布来模拟重要系数的概率分布,根据贝叶斯理论得到自适应阈值,并求出最佳参量范围.为了克服软、硬阈值函数的缺点,提出一种自适应的新阈值函数,利用新阈值函数估计出不含噪音的变换系数,并通过非下采样Contourlet逆变换得到去噪后的图像.仿真实验表明,本文方法在峰值信噪比、结构相似性与视觉效果上均优于目前许多优秀的去噪算法.  相似文献   

8.
孟静  王加俊  黄贤武  司广涛 《光学学报》2006,26(9):340-1344
光学层析成像是一个病态重建问题,为克服重建过程的病态性,提出将多准则优化理论引入到图像重建中。利用了三个用于光学层析图像重建的准则:平方误差函数、图像熵函数和局部平滑函数。采用向量优化方法将多准则优化问题转化为单准则优化问题求解。为了确定各个目标函数间的权重系数,提出一种动态权重系数求解方法。重建过程目标函数关于光学参量的梯度计算是关键,因此提出一种基于梯度树的计算方法。实验过程中对多准则重建结果和基于平方误差函数的单准则重建结果做了比较,证明该方法能够克服传统的偏重单一目标的单准则重建的不足,有效地重建光学层析图像,提高图像重建质量。  相似文献   

9.
针对无源声呐目标定位问题,提出了一种基于广义Radon变换的目标参数估计方法。首先,基于深海直达声区推导了直达声与海底第一次反射声的到达时间差与目标运动参数的数学模型;其次,通过求解自相关函数得到目标的多途时延历程(MTDTR);在此基础上引入广义Radon变换的思想,联合两个水听器实现了水面匀速直航目标的航向角、速度、目标相对于水听器的初距和初始方位角估计。利用仿真数据和实验数据验证了该方法具有良好的参数估计性能。三亚东南部海域实验结果表明,通过两个锚系在深海海底附近的声压水听器对水面目标进行定位,可以实现在12.71 km范围内,测距误差小于0.29 km,相对误差小于3%的定位精度。  相似文献   

10.
为了对工业管道排放的污染气体的流速进行连续监测,设计了一种双路平行对射式烟气流速测量系统,并对基于光闪烁法测量烟气流速的相关理论进行了研究.利用相位屏技术对湍流介质中的光闪烁现象进行了理论分析,得到了用于工业管道烟气流速反演的光闪烁互相关的表达式.对烟气流速反演过程中平均流速的路径加权问题进行了探讨,给出了路径加权函数,数值模拟表明路径加权函数具有近似高斯线型的轴对称分布特性,反映出管道中心流速对于平均流速的较大贡献.在此基础上,分析了光源光谱对路径权重函数的影响,实验证明由于光源光谱具有一定的带宽,使得路径加权函数值有一定的变化,但加权函数的分布形状保持不变.对于平均流速的路径加权函数的分析为计算工业管道中烟气流速的空间分布提供了依据.  相似文献   

11.
为了对工业管道排放的污染气体的流速进行连续监测,设计了一种双路平行对射式烟气流速测量系统,并对基于光闪烁法测量烟气流速的相关理论进行了研究.利用相位屏技术对湍流介质中的光闪烁现象进行了理论分析,得到了用于工业管道烟气流速反演的光闪烁互相关的表达式.对烟气流速反演过程中平均流速的路径加权问题进行了探讨,给出了路径加权函数,数值模拟表明路径加权函数具有近似高斯线型的轴对称分布特性,反映出管道中心流速对于平均流速的较大贡献.在此基础上,分析了光源光谱对路径权重函数的影响,实验证明由于光源光谱具有一定的带宽,使得路径加权函数值有一定的变化,但加权函数的分布形状保持不变.对于平均流速的路径加权函数的分析为计算工业管道中烟气流速的空间分布提供了依据.  相似文献   

12.
郑驰超  成娟  彭虎 《声学学报》2017,42(1):109-114
利用相位相干系数(PCF)和广义相干系数(GCF)对波束形成后的结果进行加权,能有效提高超声成像的质量,但存在背景组织亮度降低,对比度不高,以及远处目标成像强度降低等问题。本文提出一种基于次方样本熵的合成孔径成像算法,将单个孔径发射时的低质量成像结果作为元素,根据孔径位置排列,构成空间向量。根据不同成像点对应的空间向量的随机性不同,计算每个点的空间向量的次方样本熵,并将该熵值作为权系数进行加权成像。采用FieldⅡ仿真数据成像结果表明,相比于传统的DAS算法,次方样本熵方法能够提高成像的分辨率和对比度;相比于PCF和GCF算法,次方样本熵方法能够在不损失组织背景强度的情况下,进一步改善了成像质量。   相似文献   

13.
潘强  印鉴 《光学技术》2018,(2):164-170
针对当前动作识别技术中正确识别率不高,易受到环境变化的影响等问题,提出了一种基于受限玻尔兹曼机与密集采样特征迭代加权融合的动作识别算法。避免单个特征对图像序列的表达力不强,引入了受限玻尔兹曼机(RBM)特征与密集采样(DT)特征分别对行为动作进行特征提取,得到RBM特征和DT特征;定义一种迭代加权函数,将RBM特征与DT特征进行加权融合,形成描述能力更强的RBM-DT特征;基于K-近邻(KNN)算法,对RBM-DT特征进行分类学习,完成动作识别的决策判断。通过在KTH、Hollywood数据集上实验表明:与当前动作识别技术比较,提出的新算法能够有效识别各种行为动作,对各类型动作均具有更高的正确识别率与鲁棒性。  相似文献   

14.
用于畸变目标相关识别的匹配滤波器设计   总被引:2,自引:0,他引:2  
针对尺度缩放和角度旋转变化目标相关识别率低的问题,采用优化折中综合鉴别函数方法设计了具有较大畸变容限的匹配滤波器。在匹配滤波器设计时,通过调整相关输出噪声、训练样本平均功率谱密度和训练样本相似度对训练样本平均值的贡献,得到具有带通性质的匹配滤波器。利用单个匹配滤波器对角度旋转0°~30°、尺度变化0~20%的目标进行了相关识别仿真实验。结果表明:这种匹配滤波器相关输出峰尖锐、鉴别力强、畸变容限大,可用于畸变目标的光学相关识别。  相似文献   

15.
介绍了前向声散射目标探测的基本原理,并提出了基于自适应滤波的直达波抑制(DBS-AF)方法。将DBS-AF方法扩展到线性调频(LFM)信号中,把信号的包络视为一种广义"波形"并输入自适应滤波器。利用该方法分析了湖试数据,并得到了随观测时间变化的检测输出曲线。在曲线上直达波对应了曲线的背景输出而目标引起的接收声场畸变则对应了曲线的峰值起伏。单个通道的直达波抑制效果可以达到-5 dB左右;引入去均值化预处理能够增强直达波抑制效果,再利用多通道的接收信息,直达波被抑制到-10 dB以下。影响算法性能的主要因素是训练权值时段内接收信号的起伏和信直比。   相似文献   

16.
提出一种采用子带二值加权累积的海洋环境噪声互相关函数(NCF)提取经验格林函数(EGF)方法.首先将每一快拍NCF在频域划分为多个子带,每个子带内根据"累积后提取的EGF信噪比增加"的准则,确定各快拍NCF的加权系数为0或1,将各子带的加权累积结果谱白化后在频域拼接,再反傅里叶变换得到时域EGF.子带二值加权累积方法实...  相似文献   

17.
郑驰超  彭虎  韩志会 《声学学报》2012,37(6):637-641
为解决广义相干系数用于合成孔径成像中所存在的运算量大,图像对比度改善有限等问题,提出空间广义相干系数加权成像方法。该算法根据单个孔径成像结果之间的相干性来计算相干系数,通过加权空间合成进行成像。采用对FieldⅡ仿真点目标和吸声斑目标的数据进行成像表明,算法不仅使运算量减少N(N为阵元数)倍,而且相对于传统的广义相干系数算法,算法对散射点成像可提高信噪比7 dB,对于吸声斑成像可提高对比度3.2 dB。可见算法可以有效地提高成像速度和成像质量。   相似文献   

18.
高光谱成像凭借高的光谱分辨率、图谱合一、波段多的特点,能够为待分类目标提供多维的参考信息,从而提高分类精度。爆炸破片的识别回收能够为爆炸威力的评估和防爆措施的设计提供参考。针对当前破片检测中多采用可见光波段或红外波段等单个波段进行检测,忽略了破片目标与背景对不同波长的光有着不同的吸收程度,没有将多波段破片特征充分利用,为此结合高光谱检测手段,提出了一种空间分割结合光谱信息的爆炸破片识别方法。在实验室环境下,首先采集铁质破片、石头、树叶的高光谱图像,对采集的样本图像数据做预处理,包括去噪声以及黑白校正反演反射率信息等,感兴趣区域随机提取三类样本像素点共750个,随机选取600个点作为训练集其余作为测试集,通过训练后得到预测准确度分别为88%、 88%、 94%的决策树模型。其次模拟了铁质破片散落在含有石头树叶的沙土中的场景并采集其高光谱数据,通过前后级联的空谱融合方法,在空域经过图像增强和去噪等预处理之后,采用边缘检测结合区域生长以及形态学处理的方法对空间图像进行分割,得到沙土上有形态的目标,空间分割的交并比(IOU)达到93.5%,真阳率(TPR)达到97.4%;然后结合光谱域训练得到...  相似文献   

19.
刘强  方锦清  李永 《物理学报》2010,59(6):3704-3714
构建了三类确定性加权广义Farey组织的网络金字塔.理论推导并数值计算了网络金字塔的拓扑性质(度分布、平均最短路径、平均聚类系数和相称性系数等),进而将Farey序列作为网络节点的确定、随机和混合的三种权重值,以此为基础计算并拟合了三类网络金字塔的点的强度分布和边的权重分布.计算结果初步揭示了加权广义Farey组织的网络金字塔的复杂性特征,有助于了解一些实际网络的复杂性和多样性.  相似文献   

20.
基于视频信息的人体行为识别得到了越来越多的关注。针对人体行为的局部表达,提出了一种新的局部轮廓特征来描述人体的外观姿势,可以同时利用水平和竖直方向上的轮廓变化信息。该特征能有效区分不同动作,与轮廓起始点无关,具有平移、尺度和旋转不变性。针对该特征,提出了一种基于随机森林的两阶段分类方法,使用随机森林分类器对行为视频的局部轮廓进行初分类,并根据每个局部轮廓对应决策类的分类树数目占总分类树数目的比例,提出了一种基于袋外(OOB)数据误差加权投票准则的行为视频分类算法。在测试数据集上的实验结果证实了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号