首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 687 毫秒
1.
针对以往语音增强算法在非平稳噪声环境下性能急剧下降的问题,基于时频字典学习方法提出了一种新的单通道语音增强算法。首先,提出采用时频字典学习方法对噪声的频谱结构的先验信息进行建模,并将其融入到卷积非负矩阵分解的框架下;然后,在固定噪声时频字典情况下,推导了时变增益和语音时频字典的乘性迭代求解公式;最后,利用该迭代公式更新语音和噪声的时变增益系数以及语音的时频字典,通过语音时频字典和时变增益的卷积运算重构出语音的幅度谱并用二值时频掩蔽方法消除噪声干扰。实验结果表明,在多项语音质量评价指标上,本文算法都取得了更好的结果。在非平稳噪声和低信噪比环境下,相比于多带谱减法和非负稀疏编码去噪算法,本文算法更有效地消除了噪声,增强后的语音具有更好的质量。  相似文献   

2.
席志红  曾继琴  李爽 《应用声学》2017,25(3):197-200
在医学影像图像处理过程中,由于成像技术和成像时间的限制,还无法获取满足诊断需求的清晰图像,这使得在现有技术和极短时间内所获取的医学病理图像需要进行超分辨率的重建处理;基于学习的图像超分辨率思想是从已建立的先验模型中重建出高频细节;在文章中,将要估计的高频信息认为是由主要高频和冗余高频两部分组成,提出了一种基于双字典学习和稀疏表示的医学图像超分辨率重建算法,由主要字典学习和冗余字典学习组成,分别渐近地恢复出主要高频细节和冗余高频细节;实验结果的数据分析和视觉效果显示,所提出双层递进方法能够恢复更多的图像细节且在性能指标上比现有的其他几种方法均有所提高。  相似文献   

3.
针对稀疏表示高光谱检测算法性能受背景字典影响较大的问题,充分利用高光谱图像空间信息和光谱主成分信息,提出了一种基于字典学习的稀疏表示异常检测算法。首先利用主成分分析提取高光谱数据的主特征,建立目标主成分空间,并证明了在主成分空间进行字典学习稀疏重构的可行性;然后在主成分空间内构造基于K-SVD算法的训练字典,改善了背景字典性能;采用正交匹配算法重构主成分分量,利用主成分分析反变换得到待检测像元重构光谱,增强了高光谱图像的局部异常特性;最后,基于重构误差异常特性实现高光谱图像异常检测。仿真结果证明了该方法的有效性。  相似文献   

4.
结合幅度谱和功率谱字典的语音增强方法   总被引:1,自引:0,他引:1       下载免费PDF全文
从双路字典学习、噪声功率谱估计、语音幅度谱重构角度提出了一种改进的谱特征稀疏表示语音增强方法。在字典学习阶段,融合功率谱与幅度谱特征,采用区分性字典降低语音字典和噪声字典的相干性;在语音增强阶段,提出一种噪声功率谱估计方法对非平稳噪声进行跟踪估计;考虑到幅度谱和功率谱特征对不同噪声的适应程度不同,设计了语音重构权值表。对分别由幅度谱和功率谱恢复而来的两路信号进行自适应加权重构,结合相位补偿函数得到增强后的语音信号。实验结果表明,该方法在平稳、非平稳噪声环境下相比于单一谱特征的语音增强方法平均提高31.6%,改善了语音增强方法的性能。  相似文献   

5.
本文针对语音信号稀疏表示及压缩感知问题,将听觉感知引入稀疏系数筛选过程,用掩蔽阈值筛选重要系数,以得到更符合听觉感受的语音稀疏表示。通过对一帧浊音信号分别采用掩蔽阈值和能量阈值方法进行系数筛选对比实验,结果表明掩蔽阈值法具有更好的稀疏表示效果。为验证听觉感知对语音压缩感知性能的影响,与能量阈值法对照对测试语音进行压缩感知观测和重构,通过压缩比、信噪比、主观平均意见分等主客观指标评价其性能,结果表明,掩蔽阈值法可有效地提高压缩比且保证重构语音具有较高的主观听觉质量。  相似文献   

6.
根据图像的几何结构特性,从人类视觉系统特性出发,建立了Gabor感知多成份字典,进而模拟人类视觉通路的层次处理机制,构建了稀疏编码网络,能够有效去除图像中的高阶冗余,形成更为稀疏的表示。对稀疏表示系数重组后进行比特平面量化,实现了低比特率的可伸缩编码。实验结果表明,在低比特率下,本文算法压缩后重构图像的感知质量要明显优于JPEG2000,峰值信噪比也与其相当,并且对于图像中的边缘和纹理等细节保持效果更佳。  相似文献   

7.
徐健  常志国 《光子学报》2011,40(2):316-320
提出了一种针对一类图像进行稀疏表示的字典训练方法,并证明了该算法的收敛性.该算法的几何解释是,以最少的超平面来逼近样本所在的一小块球冠.算法流程为聚类每一步迭代所产生的余项,将聚类中心作为新的字典原子,令字典能够更适应于样本的稀疏表示.该算法与传统的字典训练方法相比具有适应性强,对训练样本规模和字典规模要求低,收敛速度...  相似文献   

8.
光声成像兼具光学成像的高对比度和超声成像对深层组织的高分辨率等优点,在生物医学成像领域具有巨大的潜力,而且发展十分迅速;光声成像通过在多个角度进行光声信号的采集,可以获得生物组织的二维或三维光学吸收分布图像;但实际的光声成像往往因硬件条件和成像时间的制约而难以采集角度足够多的光声信号;在信号采样不足的情况下,光声图像的重建质量会严重下降,出现大量伪迹。针对该问题,提出了一种基于字典学习与稀疏表示的恢复重建算法,采用该算法对光声信号进行预处理,并进行仿真实验。结果表明:与不经过光声信号超分辨率重建的时间反演法图像重建结果相比,经所提算法处理后的光声重建图像的伪迹显著减少,细节更加清晰,峰值信噪比提高了8 dB左右;不同信噪比下的仿真实验验证了所提出算法具有良好的稳健性。  相似文献   

9.
稀疏表示广泛用于高光谱图像分类任务中。针对字典原子空间信息和光谱信息未得到充分利用的问题,提出了基于空谱字典的加权联合稀疏表示高光谱图像分类算法。计算测试像元与字典原子的空谱联合距离,选择相似度最高的K个字典原子,并将被选择字典原子的超像素邻域扩充到新的字典中,形成空谱字典。在联合稀疏模型中,对测试像元的超像素邻域像元使用不同的权重,在空谱字典上构建加权稀疏表示模型。基于所选的两个高光谱数据集的实验证明所提算法能够有效地提高分类精度。  相似文献   

10.
基于字典学习的稠密光场重建算法   总被引:1,自引:0,他引:1       下载免费PDF全文
相机阵列是获取空间中目标光场信息的重要手段,采用大规模密集相机阵列获取高角度分辨率光场的方法增加了采样难度和设备成本,同时产生的大量数据的同步和传输需求也限制了光场采样规模.为了实现稀疏光场采样的稠密重建,本文基于稀疏光场数据,分析同一场景多视角图像的空间、角度信息的关联性和冗余性,建立有效的光场字典学习和稀疏编码数学...  相似文献   

11.
    
Data representation has been one of the core topics in 3D graphics and pattern recognition in high-dimensional data. Although the high-resolution geometrical information of a physical object can be well preserved in the form of metrical data, e.g., point clouds/triangular meshes, from a regular data (e.g., image/audio) processing perspective, they also bring excessive noise in the course of feature abstraction and regression. For 3D face recognition, preceding attempts focus on treating the scan samples as signals laying on an underlying discrete surface (mesh) or morphable (statistic) models and by embedding auxiliary information, e.g., texture onto the regularized local planar structure to obtain a superior expressive performance to registration-based methods, but environmental variations such as posture/illumination will dissatisfy the integrity or uniform sampling condition, which holistic models generally rely on. In this paper, a geometric deep learning framework for face recognition is proposed, which merely requires the consumption of raw spatial coordinates. The non-uniformity and non-grid geometric transformations in the course of point cloud face scanning are mitigated by modeling each identity as a stochastic process. Individual face scans are considered realizations, yielding underlying inherent distributions under the appropriate assumption of ergodicity. To accomplish 3D facial recognition, we propose a windowed solid harmonic scattering transform on point cloud face scans to extract the invariant coefficients so that unrelated variations can be encoded into certain components of the scattering domain. With these constructions, a sparse learning network as the semi-supervised classification backbone network can work on reducing intraclass variability. Our framework obtained superior performance to current competing methods; without excluding any fragmentary or severely deformed samples, the rank-1 recognition rate (RR1) achieved was 99.84% on the Face Recognition Grand Challenge (FRGC) v2.0 dataset and 99.90% on the Bosphorus dataset.  相似文献   

12.
谢宗伯  冯久超 《中国物理 B》2010,19(5):50510-050510
The denoising problem of impure chaotic signals is addressed in this paper. A method based on sparse representation is proposed, in which the random frame dictionary is generated by a chaotic random search algorithm. The numerical simulation shows the proposed algorithm outperforms those recently reported alternative denoising methods.  相似文献   

13.
邓承志  田伟  陈盼  汪胜前  朱华生  胡赛凤 《物理学报》2014,63(4):44202-044202
针对红外图像分辨率低、视觉质量差等问题,提出基于局部约束群稀疏模型的红外图像超分辨率重建方法.考虑到红外图像的纹理自相似性和原子系数的群结构稀疏性,首先建立了基于局部约束的群稀疏表示模型.然后,在假定低分辨率图像空间和高分辨率图像空间具有相似流形的前提下,联合局部约束群稀疏表示模型和K-SVD(K奇异值分解)方法,训练得到高低分辨率图像对应的群结构字典对.最后,通过高分辨字典和对应的红外图像群稀疏表示系数重建得到高分辨率的红外图像.实验结果表明,本文方法具有更好的超分辨率效果,无论是在客观评价指标还是主观视觉效果方面都有明显的提高.  相似文献   

14.
评估每个粒子的重要性是确保粒子滤波法跟踪目标准确性的重要因素。针对背景杂波和噪声干扰形成的大量虚警导致小弱目标跟踪识别的随机性和不确定性问题, 提出了一种基于粒子区别性稀疏表征的小弱目标跟踪方法。该方法根据红外图像信号自适应构建分类超完备字典, 即反映目标信号特征的目标字典和表示背景杂波的背景字典, 有利于突出目标粒子和背景粒子在联合分类字典的稀疏表征差异程度;建立基于目标粒子和背景粒子稀疏重构残差差异性的粒子滤波观测模型, 采用随机估计法对字典子空间进行在线更新, 实现对目标状态估计与跟踪。理论分析和试验结果表明, 该方法增强了随机粒子的状态估计能力, 提升了粒子稀疏表征对小弱运动目标的适应能力和跟踪识别准确度。  相似文献   

15.
均方误差函数是深度学习单通道语声增强算法最常用的一种代价函数。然而,均方误差值的大小与语声质量好坏并非完全相关。为了提高算法性能,该文在深度神经网络训练中引入了两类与人耳听觉相关的代价函数。第一类是加权欧氏距离代价函数,考虑了人耳听觉掩蔽效应;第二类是Itakura-Satio代价函数、COSH代价函数和加权似然比代价函数,强调语声谱峰的重要性,侧重于恢复干净语声谱峰信息。基于长短期记忆网络结构分析比较了两类代价函数在深度学习单通道语声增强算法中的性能,并与均方误差代价函数进行对比。实验结果表明,基于加权欧式距离代价函数的深度神经网络单通道语声增强算法能够获得更好的语声质量和更低的噪声残留。  相似文献   

16.
    
With the rapid growth of the demand for location services in the indoor environment, fingerprint-based indoor positioning has attracted widespread attention due to its high-precision characteristics. This paper proposes a double-layer dictionary learning algorithm based on channel state information (DDLC). The DDLC system includes two stages. In the offline training stage, a two-layer dictionary learning architecture is constructed for the complex conditions of indoor scenes. In the first layer, for the input training data of different regions, multiple sub-dictionaries are generated corresponding to learning, and non-coherent promotion items are added to emphasize the discrimination between sparse coding in different regions. The second-level dictionary learning introduces support vector discriminant items for the fingerprint points inside each region, and uses Max-margin to distinguish different fingerprint points. In the online positioning stage, we first determine the area of the test point based on the reconstruction error, and then use the support vector discriminator to complete the fingerprint matching work. In this experiment, we selected two representative indoor positioning environments, and compared the DDLC with several existing indoor positioning methods. The results show that DDLC can effectively reduce positioning errors, and because the dictionary itself is easy to maintain and update, the characteristic of strong anti-noise ability can be better used in CSI indoor positioning work.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号