首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
分段匹配追踪式Karhunen-Loeve非相干字典语音压缩感知   总被引:1,自引:0,他引:1  
压缩感知(Compressed Sensing,CS)理论突破了经典采样定理的理论边界,为信号压缩提供了另一种途径。基于CS理论框架,做了两方面工作:为提高语音字典对信号的匹配性,设计了一种基于K-L展开的非相干语音字典;针对现有匹配追踪(MP,OMP)算法的不足,提出分段匹配追踪(Segment MP,SegMP)算法。首先对语音自相关函数进行建模并估计模型参数,构造语音自适应非相干字典,然后采用SegMP对语音稀疏向量分段观测,获得多个低维矢量,最后结合模型参数重建字典并重构信号,实现了语音压缩感知。语音测试结果表明:相比现有方案,本文方案对信号的稀疏表示更为精准,具有更好的重构质量,且降低了计算复杂度。   相似文献   

2.
肖东  莫福源  陈庚  郭圣明  马力 《声学学报》2013,38(5):589-596
中远距离(>10 km)水声语音通信时,由于可利用带宽窄、复杂多变等不利因素对信息传输率的制约,语音编码速率应降到尽可能的低。利用水声信道传播时延大的特点,结合人耳听觉感知的特性,在深入研究混合激励线性预测编码(MELP)标准之后,提出一种语音编码速率可调节的变比特率语音编码算法。其平均码速率约600 bps,主观语音质量评估平均得分(PESQ MOS)约2.8分。对该编码算法性能进行了计算机仿真和海上实验验证。实验及仿真表明,在误码率不高于10-3时,本算法表现良好且稳定,合成语音清晰可懂,易于辨认说话人。   相似文献   

3.
本文针对语音信号稀疏表示及压缩感知问题,将听觉感知引入稀疏系数筛选过程,用掩蔽阈值筛选重要系数,以得到更符合听觉感受的语音稀疏表示。通过对一帧浊音信号分别采用掩蔽阈值和能量阈值方法进行系数筛选对比实验,结果表明掩蔽阈值法具有更好的稀疏表示效果。为验证听觉感知对语音压缩感知性能的影响,与能量阈值法对照对测试语音进行压缩感知观测和重构,通过压缩比、信噪比、主观平均意见分等主客观指标评价其性能,结果表明,掩蔽阈值法可有效地提高压缩比且保证重构语音具有较高的主观听觉质量。  相似文献   

4.
马原  吕群波  刘扬阳  钱路路  裴琳琳 《物理学报》2013,62(20):204202-204202
压缩感知理论基于信号的稀疏性和可压缩性, 突破传统Nyquist采样频率的限制, 以较低的数据量对信号进行采样和高概率重构. 在压缩感知理论中, 信号的稀疏度确定了稀疏采样的最低数据量, 是验证采样方法及重构方法优劣的重要参数. 在实际研究过程中, 图像稀疏度通常未知, 这就可能导致过采样或欠采样的情况, 从而无法验证采样方法及重构方法的优劣. 因此, 快速而客观地估计图像的稀疏度对于压缩感知理论研究来说意义重大. 本文分析了基于小波变换的图像稀疏化表示方法, 通过遍历采样和重构得到基于小波变换方法的图像稀疏度, 但过程复杂, 而且结果的准确性依赖于小波基和变换尺度的选择. 本文通过压缩感知理论对主成分变换进行阐述, 在基于主成分变换系数近似为正态函数的假设下, 建立了图像稀疏度与系数函数方差间的线性关系, 并通过多组图像数据进行仿真验证, 结果表明线性关系的正确性. 通过分析和仿真可以看出, 基于主成分变换的稀疏度估计方法比小波变换简单、快速、客观, 对压缩感知理论研究有重要的应用价值. 关键词: 压缩感知 稀疏度 小波变换 主成分变换  相似文献   

5.
光谱反射率描述物体的表面颜色特征,为了能够获取物体自身更加精确的颜色信息,在图像处理领域光谱反射率重构成为了关注的话题。反射光谱重构算法是对实验物体表面在可见光范围内每一波长处的光谱反射率进行重构,以达到提高物体自身颜色准确复制的精度,最后建立相应的反射光谱。尝试将压缩感知(CS)理论应用到光谱实验中,对光谱反射率进行重构。首先是介绍了压缩感知理论知识,然后把压缩感知理论与光谱反射率原理相结合,根据基于压缩感知的光谱反射率重构的理论框架,选取合适的采样值,压缩感知的采样值即压缩值,小波基作为正交矩阵,高斯随机矩阵作为测量矩阵,正交矩阵与测量矩阵需要保证具有不相关性,将原始光谱反射率从高维到低维进行线性投影,得到低维的观测信号,运行简单的正交匹配追踪算法(OMP)对低维的观测信号进行由低维到高维的高精度重构,重构得到的光谱反射率与原始光谱反射率具有相同的维度,最后将压缩感知重构算法与传统的光谱反射率重构算法伪逆法与多项式回归法进行比较。经过压缩感知重构算法得到的色差值与均方根误差值都小于伪逆法和多项式回归法重构的结果,经压缩感知的重构精度明显提高;经压缩感知重构的光谱曲线可以达到或者更接近原始光谱曲线的峰值,整体效果更接近原始光谱曲线;经多项式回归法和伪逆法重构的光谱曲线达不到原始峰值,整体上存在偏差。可以认为压缩感知用低采样的数据达到了全采样的效果,提高了光谱反射率重构的精度。基于压缩感知的光谱反射率重构算法效果明显优于传统的多项式回归法和伪逆法,可以将压缩感知理论应用到实际的多光谱成像系统中。  相似文献   

6.
郑仕链  杨小牛  赵知劲  Zhao Zhi-Jin 《物理学报》2014,63(22):228401-228401
提出了一种随机解调器压缩采样重构成败的判定方法. 该方法利用两次连续重构所得稀疏信号支撑之间的相关性来判断重构是否成功,其计算复杂度低,易于实现. 仿真结果表明,该方法能准确判断随机解调器压缩采样重构成败,用于宽带频谱感知中能够显著降低信号不稀疏时对主用户的干扰概率. 关键词: 认知无线电 频谱感知 随机解调器 压缩采样  相似文献   

7.
周晏  王璐 《应用声学》2014,22(7):2164-2166,2181
为了克服经典正交匹配算法获取原子集时遍历冗余字典具有较大时间开销的缺点,提出了一种基于压缩感知理论和禁忌优化算法的的稀疏故障信号特征提取方法;首先引入了压缩感知模型并描述了基于信号稀疏表示的故障诊断原理,设计了满足RIP准则以最小化l1范数为目标的稀疏信号解的求解方法,然后定义了一种基于正交匹配算法的稀疏信号重构算法,并以最小化余量为目标函数,采用改进的禁忌搜索算法在原子空间中搜索满足目标函数的最优原子集,最后,给出了基于稀疏编码和禁忌优化混合模型的故障信号提取算法;在Matlab仿真环境下对滚动轴承故障信号进行试验,仿真结果表明:文章方法能有效地对具有强噪声的故障信号进行稀疏重构,不仅具有较高的信噪比,而且具有较小的余量误差和仿真时间,与其它方法相比,具有较大的优越性。   相似文献   

8.
文方青  张弓  贲德 《物理学报》2015,64(7):70201-070201
本文提出一种基于块稀疏贝叶斯学习的多任务压缩感知重构算法, 利用块稀疏的单测量矢量模型求解多任务重构问题. 通过对信号统的计特性和稀疏块内的结构特性进行联合数学建模, 将稀疏重构问题转贝叶斯框架下的特征参数的迭代更新问题. 本文算法不需要信号稀疏度和噪声强度的先验信息, 是一种高效的盲重构算法. 仿真实验表明, 本文算法能有效利用信号的统计特性和结构信息, 在重构精度和收敛速率方面能够很好地折衷.  相似文献   

9.
压缩感知理论在光学成像中的应用   总被引:2,自引:0,他引:2  
压缩感知以信号的稀疏性或可压缩性为条件,以远低于耐奎斯特采样频率对信号数据进行采样和编码。简要概括了压缩感知的基本理论,它采用非自适应线性投影来保持信号的原始结构, 能通过数值最优化问题精确或高概率地重构原始信号。详细介绍了其在光学成像系统中的应用,主要包括单像素相机、超薄成像、编码孔径成像、多路技术智能成像、多光谱成像和CMOS成像等成像系统。最后对该理论的应用前景进行了阐述。  相似文献   

10.
张宗福 《应用声学》2014,22(5):1568-1571
针对传统香农-奈奎斯特采样定理指出在保证原始信号重构精度的前提下,采样频率必须为原始信号频率的2倍,提出了一种基于压缩感知理论和改进的自适应正交匹配追踪算法的稀疏信号重构方法;首先引入了压缩感知模型和信号重构目标函数,然后在对经典正交匹配追踪类算法进行分析和总结的基础上,为克服其不足,设计了一种二次筛选支配原子集的方法,即通过计算信号的QR分解并计算具有最大势能的原子从而得到能量候选原子集,通过计算余量与原子的相关性选出相关性最大的原子从而得到相关候选原子集,并将能量候选原子集和相关候选原子集的交集作为最终支配原子集;最后定义了具体的采用自适应正交匹配算法实现信号重构的算法;在Matlab仿真环境下试验,结果表明:文章方法能有效地进行稀疏信号重构,具有较小的重构误差,且与其它方法相比,具有收敛速度快和重构效果好的优点。  相似文献   

11.
为了从带噪信号中得到纯净的语音信号,提出了一种采用性别相关模型的单通道语音增强算法。具体而言,在训练阶段,分别训练了与性别相关的深度神经网络-非负矩阵分解模型用于估计非负矩阵分解中的权重参数;在测试阶段,提出了一种基于非负矩阵分解和组稀疏惩罚的算法用于判断测试语音中说话人的性别信息,然后再采用对应的模型估计权重,并结合已训练好的字典进行语音增强。实验结果表明所提算法在噪声抑制量及语音质量上,均优于一些基于非负矩阵分解的算法和基于深度神经网络的算法。   相似文献   

12.
麦克风阵列已被广泛应用于音/视频会议等人机交互领域中时,多声源应用场景对声源方位估计性能提出了更高的要求。压缩感知(CS)声源定位算法将声源定位问题转化为信号的稀疏重构问题,相比传统的定位算法如相位变换加权(SRP-PHAT)和时延累加定位(DS)能够获得较高的定位性能,但多声源的存在一定程度上降低了稀疏程度,影响了CS重构性能。考虑到传统的CS定位算法并未利用多个连续语音帧之间声源空间向量的共同稀疏性,提出采用分布式压缩感知(DCS)理论以改善多声源的稀疏恢复估计的性能。仿真和实验结果表明,相比于传统定位算法和CS-OMP算法,DCS-SOMP算法在不同信噪比和不同声源强度的环境中,对多声源的方位估计都具有更好的定位性能和定位稳健性。  相似文献   

13.
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。本文首先介绍了单通道情况下语音增强的信号模型,然后对4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。  相似文献   

14.
An adaptive rate Compressive Sensing (CS) method for video signals is proposed. The Blocked Compressive Sensing (BCS) scheme is adopted in this method. Firstly, each video frame is blocked and measured by the BCS scheme, and then the mean and variance of each image block are estimated by observing the CS measurement results. Using the mean and variance of each image block, the sparsity of the block is estimated and then the block can be classified. Adaptive rate sampling is realized by assigning different sampling rates to different classes. At the same time, in order to make better use of the correlation between video frames, a reference block subtraction method is also designed in this paper, which uses the estimates of the sparsity of image blocks as the basis for the reference block update. All operations of the proposed method only depend on the CS measurement results of image blocks and all calculations are simple. Thus, the proposed method is suitable for implementation in CS sampling devices with limited computational performance. Experiment results show that, compared with the actual values, the sparsity estimates and block classification results of the proposed method are accurate. Compared with the latest adaptive Compressive Video Sensing methods, the reconstructed image quality of the proposed method is better.  相似文献   

15.
Exploiting the wavelet structure in compressed sensing MRI   总被引:1,自引:0,他引:1  
Sparsity has been widely utilized in magnetic resonance imaging (MRI) to reduce k-space sampling. According to structured sparsity theories, fewer measurements are required for tree sparse data than the data only with standard sparsity. Intuitively, more accurate image reconstruction can be achieved with the same number of measurements by exploiting the wavelet tree structure in MRI. A novel algorithm is proposed in this article to reconstruct MR images from undersampled k-space data. In contrast to conventional compressed sensing MRI (CS-MRI) that only relies on the sparsity of MR images in wavelet or gradient domain, we exploit the wavelet tree structure to improve CS-MRI. This tree-based CS-MRI problem is decomposed into three simpler subproblems then each of the subproblems can be efficiently solved by an iterative scheme. Simulations and in vivo experiments demonstrate the significant improvement of the proposed method compared to conventional CS-MRI algorithms, and the feasibleness on MR data compared to existing tree-based imaging algorithms.  相似文献   

16.
The setting of the measurement number for each block is very important for a block-based compressed sensing system. However, in practical applications, we only have the initial measurement results of the original signal on the sampling side instead of the original signal itself, therefore, we cannot directly allocate the appropriate measurement number for each block without the sparsity of the original signal. To solve this problem, we propose an adaptive block-based compressed video sensing scheme based on saliency detection and side information. According to the Johnson–Lindenstrauss lemma, we can use the initial measurement results to perform saliency detection and then obtain the saliency value for each block. Meanwhile, a side information frame which is an estimate of the current frame is generated on the reconstruction side by the proposed probability fusion model, and the significant coefficient proportion of each block is estimated through the side information frame. Both the saliency value and significant coefficient proportion can reflect the sparsity of the block. Finally, these two estimates of block sparsity are fused, so that we can simultaneously use intra-frame and inter-frame correlation for block sparsity estimation. Then the measurement number of each block can be allocated according to the fusion sparsity. Besides, we propose a global recovery model based on weighting, which can reduce the block effect of reconstructed frames. The experimental results show that, compared with existing schemes, the proposed scheme can achieve a significant improvement in peak signal-to-noise ratio (PSNR) at the same sampling rate.  相似文献   

17.
在压缩感知-磁共振成像(CS-MRI)中,随机欠采样矩阵与重建图像质量密切相关.而选取随机欠采样矩阵一般是通过计算点扩散函数(PSF),以可能产生的伪影的最大值为评价参数,评估欠采样对图像重建的影响,然而最大值只反应了伪影的最坏情况.该文引入了两种新的统计学评价参数平均值(MV)和标准差(SD),其中平均值评估了伪影的平均大小,标准差可以反映伪影的波动情况.该文分别使用这3种参数对小鼠和人体脑部MRI数据以不同的采样比率进行CS图像重建,实验结果表明,当采样比率不低于4倍稀疏度时,使用平均值获得了质量更优的重建图像.因此,通过稀疏度先验知识指导合理选取采样比率,并以平均值为评价参数选取随机欠采样矩阵,能够获得更优的CS-MRI重建图像.
  相似文献   

18.
19.
A voice conversion algorithm,which makes use of the information between continuous frames of speech by compressed sensing,is proposed in this paper.According to the sparsity property of the concatenated vector of several continuous Linear Spectrum Pairs(LSP)in the discrete cosine transformation domain,this paper utilizes compressed sensing to extract the compressed vector from the concatenated LSPs and uses it as the feature vector to train the conversion function.The results of evaluations demonstrate that the performance of this approach can averagely improve 3.21%with the conventional algorithm based on weighted frequency warping when choosing the appropriate numbers of speech frame.The experimental results also illustrate that the performance of voice conversion system can be improved by taking full advantage of the inter-frame information,because those information can make the converted speech remain the more stable acoustic properties which is inherent in inter-frames.  相似文献   

20.
简志华  王向文 《声学学报》2014,39(3):400-406
提出了一种基于压缩感知的考虑语音帧间信息的语音转换算法。根据连续多帧语音的线谱对参数所构成的矢量在离散余弦变换域具有稀疏性,利用压缩感知技术对该矢量压缩成短矢量,并将该压缩后的短矢量作为特征参数训练语音转换函数。实验测试结果表明,选择合适的语音帧数时,该算法的性能要比传统的采用加权频率卷绕的转换算法提高3.21%。这说明,充分有效地利用语音帧间的相关信息会使转换语音保持更稳定的帧间声学特性,有利于提高语音转换系统的性能,   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号