首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
肖东  莫福源  陈庚  马力 《应用声学》2012,31(2):109-117
线谱频率(Line Spectral Frequency,LSF)是线性预测频谱系数(Linear Predication Coefficient,LPC)有效的编码形式。语音线性预测模型中,LPC反映了声道调制的模型,是影响语音听觉感知重要的参数之一。在混合激励线性预测语音编码(Mixed Excitation Linear Prediction,MELP)标准中,对LSF采用4级码本进行分级式矢量量化。首先,为减少其量化冗余度以降低编码速率,本文提出了一种改进的选择算法,生成了一个2级码本替换之。其次,为提高合成语音质量,依据LSF矢量量化的精度与合成语音质量的关系的实验结果,提出根据人耳听觉感知特性进行LSF量化和评价的方法,并予以实验证明。  相似文献   

2.
在波形网络中融合相位信息的骨导语音增强   总被引:3,自引:0,他引:3       下载免费PDF全文
已有骨导语音增强算法重点关注语音幅度谱增强,在波形合成时会因为相位不匹配导致语音质量下降。为解决该问题,提出了一种融合相位信息的波形网络(WaveNet)模型实现骨导语音增强波形生成。该方法以频带扩展WaveNet为基础,融合骨导语音相位谱信息与增强的语音幅度谱作为模型的条件特征,根据融合特征生成增强语音波形,实现了相位信息的有效利用。仿真实验综合对比了群时延谱和瞬时频率偏差谱相位特征,主客观结果表明,不论是采用串联融合还是卷积融合方式,骨导语音相位信息均有效补充了原有幅度谱条件特征,改善了语音增强效果。利用串联方式融合群时延谱特征可得到最佳结果,相比于原始骨导语音,平均意见得分(MOS)提升了约54.3%。   相似文献   

3.
提出了一种利用多带激励(MBE)模型改进的低速率线性预测(LPC)语音编码算法.文中介绍了该算法的参数提取、量化编码及语音合成的具体方案,并用C语言构造了一个基于该算法的速率为1,6 kb/s的语音编码/解码系统.主观测听表明,该系统性能与 2.4 kb/s的 MELP算法接近或相当。  相似文献   

4.
针对语音无线通信中带宽资源受限的问题,提出基于压缩采样的低速率语音编码算法。以基尼系数为指标,比较不同稀疏变换域下语音信号的稀疏性,分析常见重构算法对语音信号压缩采样观测信号的重构特性。对标准耳蜗滤波器——伽马啁啾滤波器组的参数进行研究,并以梯度投影稀疏重建(GPSR)算法重构语音信号。利用语音质量感知评估(PESQ)、信噪比和主观听觉测试,对编解码后的合成语音信号进行了质量评估。实验表明,基于压缩感知的语音编码器以4 kbps的低速率对语音进行编码时,PESQ得分可达到3.16,计算复杂度相对较低,可以用于实际的语音编码环境。  相似文献   

5.
基于小波变换和矢量量化的语音压缩编码方案   总被引:3,自引:1,他引:2  
对于一种新的语音压缩编码方法——基于小波变换和矢量量化的语音压缩编码方案进行了开发和研究。该方法先对语音进行小波变换和小波包变换,然后使用矢量量化来压缩数据.我们还研究了使用摘编码方法进一步降低比特率的算法,实验结果表明对于采样频率为8kHz,每样本量化为8bit的64kbit/s语音信号压缩到6kbit/s~8kbit/s时,具有良好的语音质量.同时该算法还具有低延迟的优点,其算法延迟只有8ms。  相似文献   

6.
肖东  莫福源  陈庚  郭圣明  马力 《声学学报》2013,38(5):589-596
中远距离(>10 km)水声语音通信时,由于可利用带宽窄、复杂多变等不利因素对信息传输率的制约,语音编码速率应降到尽可能的低。利用水声信道传播时延大的特点,结合人耳听觉感知的特性,在深入研究混合激励线性预测编码(MELP)标准之后,提出一种语音编码速率可调节的变比特率语音编码算法。其平均码速率约600 bps,主观语音质量评估平均得分(PESQ MOS)约2.8分。对该编码算法性能进行了计算机仿真和海上实验验证。实验及仿真表明,在误码率不高于10-3时,本算法表现良好且稳定,合成语音清晰可懂,易于辨认说话人。   相似文献   

7.
一种高质量短时延的4kb/s的语音编码算法   总被引:1,自引:0,他引:1  
4kb/s低速率语音编码是近年来语音信号处理研究的重要课题,也是国际电信联盟电信委员会(ITU_T)下一步标准化的目标。本文提出一种混合激励的编码算法,它对浊音采用谐波激励,对清音采用码激励,该编码能在短时延(分析帧长为10ms,采样率为8kHz)的情况下获得很好的合成语音质量。本文分析了该算法的原理,并给出了模拟结果。  相似文献   

8.
孙兴伟  李军锋  颜永红 《声学学报》2021,46(6):1234-1241
提出一种结合卷积神经网络的编解码器模型和混响时间注意力机制的混响抑制算法,该算法通过编解码器模型实现混响抑制,并利用混响时间注意力机制克服混响环境变化对混响抑制效果的影响。该算法在编码器中使用具有不同大小的卷积核来处理混响语音幅度谱,从而获得包含多尺度上下文信息的编码特征;通过引入注意力模块,实现在不同的混响时间环境中选择性地使用不同权重的编码特征生成加权特征;最后,在解码器中使用加权特征来重建混响抑制后的语音信号幅度谱。在模拟和真实的混响环境下,该算法相对于基线系统在语音混响调制能量比上分别取得了0.36 dB和0.66 dB的提升。实验结果表明,该算法可以适应不同混响环境的变化,相对基线系统在真实混响环境下具有更高的鲁棒性。   相似文献   

9.
马震  吴殿红 《应用声学》2016,35(2):137-143
在多脉冲线性预测编码的基础上,本文提出了位置无关脉冲搜索算法。该算法不需要搜索脉冲位置,而是根据给定的脉冲位置一次性解出脉冲幅度矢量。这就保证了得到的脉冲组合在最小二乘意义下是最优的,为改进合成语音质量提供了理论基础。进而在激励脉冲与位置无关的理论基础上,提出了定点脉冲线性预测编码方法。对所提出的算法在MATLAB下进行了仿真,仿真结果发现位置无关脉冲搜索算法得到的合成语音质量优于序贯法,编码时间也要比序贯法短。定点脉冲线性预测编码方法可以在2.7 kbps的编码速率下获得与G.729相近的合成语音。  相似文献   

10.
基于网格维数的汉语语音分形特征研究   总被引:4,自引:1,他引:3  
应用分形理论来研究汉语语音信号的分形特征。木文首先在传统盘维数基础上提出了一种等差尺度网格维数算法来快速计算语音信号的分维数;在此基础上,对汉语男女声的21种声母和38种韵母语音信号的分维数进行了计算和统计分析,得到了汉语语音分维数的统计分布规律。本文实验结果表明,汉语语音信号具有分形标度不变性,网格维数能够反映语音信号波形的复杂程度。  相似文献   

11.
压缩编码技术是无线语音通信的关键技术之一。介绍了语音编码技术的基本概念及分类,并选用AMBE多带激励压缩编码算法,通过单片机控制专用语音压缩DSP芯片,提出了一种适合低速无线语音、数据实时通信的系统解决方案,完成了硬件、软件设计,实现了低速率下的语音、数据的同步大气传输。测试结果显示,在语音编码速率为2.4kbps以下时,仍然可以得到音质较好的语音输出。  相似文献   

12.
吴颖谦  方涛  施鹏飞 《光学学报》2004,24(12):633-1637
提出了一个基于小波网格编码量化的超光谱图像压缩方法。谱间和空间冗余处理构成了超光谱图像压缩算法的主要内容,该算法使用一个谱间差分预测步骤来去除谱间冗余,而后对预测残差图像进行小波变换并利用均匀阈值网格编码量化(trellis-coded quantization)方法来量化各小波子带,最后使用自适应算术编码对量化码字进行熵编码。为使编码器能为所有子带获取率-失真意义上最优的量化阈值,设计了一个基于子带统计特性和网格编码量化器率-失真特性的比特分配算法。在实验中,该算法表现出优良的压缩性能,对于实验的超光谱图像,该方法在压缩比为32时可得到37.1dB的峰值信噪比,这表明本算法能有效压缩超光谱图像,适于超光谱图像压缩应用。  相似文献   

13.
为了提高传统正交匹配追踪(Orthogonal Matching Pursuit,OMP )算法的语音增强性能和运算速度,本研究基于稀疏编码理论,提出了一种改进的OMP算法的语音增强算法。其一,将K-奇异值分解(K-singular value decomposition,K-SVD)算法与OMP算法相结合,通过设置能量阈值的方法,提高OMP算法的语音增强性能;其二,通过改进传统OMP算法中信号稀疏逼近的计算方法,提高算法的运算速度。改进的OMP算法的语音增强算法与传统K-SVD语音增强算法相比,采用PESQ评价增强语音的质量,NCM评价语音的可懂度。在NCM的值基本保持不变的情况下,PESQ的值平均提高约12.47%,取得了更好的增强效果。取得了更好的增强效果。改进的OMP算法的运算速度与传统OMP算法相比提高近一倍。  相似文献   

14.
产生正弦光栅的二值化面积编码新方法   总被引:2,自引:0,他引:2  
基于面积编码的二值化算法,提出了一定改进,即在对二值化模板进行填充时,用分散的、尽可能等间距的填充方法代替分块的、非等间隔的填充方法,并将此光栅制作出来用于三维形貌测量.利用二元编码光栅的频谱分布特征和光学系统固有的低通滤波特征,可以将二元分布的模板转化为测量区域的正弦分布,同时又滤去了量化噪声,得到质量较好的正弦光场...  相似文献   

15.
赵嵩  冯湘 《应用光学》2016,37(5):706-711
图像分类技术是近年来计算机视觉领域中的研究热点,在移动互联网领域中取得了成功应用。提出了一种基于稀疏编码空间金字塔匹配的图像分类算法。该方法首先对图像的SIFT特征进行稀疏编码,替代了传统的矢量量化方法,可以有效降低量化误差,构建更为准确的图像表征方式,然后结合空间金字塔匹配算法采用线性分类器对图像进行分类识别。在标准测试图像数据库上的实验结果表明,相比BOF和SPM方法,该算法可以将图像分类准确率提高4%~12%。  相似文献   

16.
针对以往语音增强算法在非平稳噪声环境下性能急剧下降的问题,基于时频字典学习方法提出了一种新的单通道语音增强算法。首先,提出采用时频字典学习方法对噪声的频谱结构的先验信息进行建模,并将其融入到卷积非负矩阵分解的框架下;然后,在固定噪声时频字典情况下,推导了时变增益和语音时频字典的乘性迭代求解公式;最后,利用该迭代公式更新语音和噪声的时变增益系数以及语音的时频字典,通过语音时频字典和时变增益的卷积运算重构出语音的幅度谱并用二值时频掩蔽方法消除噪声干扰。实验结果表明,在多项语音质量评价指标上,本文算法都取得了更好的结果。在非平稳噪声和低信噪比环境下,相比于多带谱减法和非负稀疏编码去噪算法,本文算法更有效地消除了噪声,增强后的语音具有更好的质量。   相似文献   

17.
杜述松  袁艳  相里斌  陶然  张文喜 《光子学报》2007,36(9):1672-1676
基于均匀值量化压缩算法和AR模型算法,对干涉型超光谱成像仪直接产生的实际干涉图像序列进行了近无损压缩仿真实验.AR模型算法对残差采用Lloyd-Max量化器进行量化,对量化输出结果用Huffman编码器进行编码.分析了AR模型阶数对压缩性能的影响.结果指出,均匀值量化和AR模型算法均能满足干涉光谱图像序列压缩的要求.  相似文献   

18.
语音质量的客观评价可以代替昂贵的人工评分,但是目前客观指标的计算通常需要纯净的参考语音,这在许多实际声学系统中很难获得。为此提出了一种融合辅助目标学习和卷积循环网络(CRN)的非侵入式语音质量评价算法。为降低算法的复杂度,算法采用基于仿人耳听觉特性滤波器的Bark频率倒谱系数(BFCCs)作为CRN的输入。算法首先构建一个卷积神经网络(CNN)从BFCCs中提取帧级特征。然后,构建双向的长短记忆网络,在帧级特征中建模长期的时间依赖性和序列特征。最后,利用自注意力机制自适应地从帧级特征中筛选出有用信息,将其整合至话语层面的特征中,并将这些话语级特征映射为客观得分。为改善质量评测的有效性,算法采用多任务训练策略,引入语音激活检测(VAD)作为辅助学习目标。基于开源数据库的实验显示,与其他非侵入式算法相比,提出的算法和平均主观意见分(MOS)具有更好的相关性。而且,算法参数规模较小且对ITU-T P.808发布的带有主观MOS的失真语音数据库具有良好的泛化能力,接近语音质量感知评估(PESQ)指标的精度。   相似文献   

19.
孙文军  郝志航 《光学技术》2003,29(3):323-326
提出了一种矢量量化编码的快速匹配算法。利用码书的拓扑结构和柯西 施瓦兹不等式的性质推导出了消除不必要匹配操作的条件,并根据这个条件提出了快速搜索算法。实验结果表明,该算法不仅明显降低了矢量编码过程的复杂程度,同时也保证了与全搜索编码相同的图像编码质量。与其它搜索方法的操作次数和存储空间进行了比较。  相似文献   

20.
详细研究了小波变换传递误差、尺度、快速Mallat算法加权量化对分层树剖分(SPIHT)编码图象压缩质量的影响,并给出了基于VC++的仿真结果,结果表明,小波变换尺度对图象压缩编码效果有明显的影响,通常要在大于4的尺度上作图象压缩编码才可以得到较好的压缩效果,不同的边界延拓,不同尺度的取整重构、加权量化对图象压缩效果的影响是不同的,恰当选取加权量化步长能达到更好的图象压缩效果,一般而言,同一尺度下随加权量化步长的增加,压缩效果变差.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号