首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 78 毫秒
1.
把一种基于语音的正弦模型的音高和时长修正算法应用于汉语普通话语音的韵律调整,可调范围比较大,而且保证了合成语音的清晰度与自然度,非正式测听结果表明:该算法是一种很符合汉语语音的韵律调整的 算法。  相似文献   

2.
利用正弦模型设计一个音乐合成系统 .由于正弦模型具有高效性和灵活性 ,它能够修改合成单元的基音频率、时长等 ,因此本合成系统利用波型拼接的方法来合成音乐 .合成系统中的合成单元由专业歌手发音来形成  相似文献   

3.
基于PSOLA技术的汉语语音规则合成系统   总被引:1,自引:0,他引:1  
研究了使用基音同步叠加算法(PSOLA),来改变汉语语音的音高、音强和音长,进行汉语语音合成的方法。同时对于其中的主要参数:基音同步标志,则利用了改进的自相关算法、HILBERT变换原理和搜索算法,建立了精确自动确定标志的软件。另外提出了汉语词调的优化统计方法,得出了词调的定量描述规则。最后运用PSOLA算法原理,加上汉语全音节音库和较为完善的韵律规则库,设计了一个较为清晰、自然的汉语语音规则实时合成系统。  相似文献   

4.
介绍了语音变换的相关技术,分析了利用正弦谐波模型实现语音变换的算法及流程。利用正弦谐波模型对语音进行建模和分解,提取语音的基音频率,利用高斯建模和变换实现语音韵律特征的变换;提取出正弦谐波幅度的后10阶系数,作为语音的频谱特征参数,利用矢量量化和码书映射的方法实现语音频谱特征的变换。提出了一种逐词对应的训练参数对齐方法,给出了具体实现的算法流程。对录制的2段语音利用该算法进行了仿真实验,利用ABX测试对实验结果进行了评估。测试结果显示,该算法得到的变换语音在听觉上有89.3%的概率更接近目标说话人语音。  相似文献   

5.
本文采用语音信号的正弦表示方法并利用耳蜗模型提取了语音信号的基本物征参数,建立了一个语音分析/合成系统。  相似文献   

6.
TD-PSOLA技术在汉语语音波形编码合成中的应用   总被引:1,自引:0,他引:1  
以时域基音同步叠加(PSOLA)技术和一个全汉语单音节库为合成单元进行汉语语音波形编码合成,针对汉语语音的音高、时长、音强以及音节之间的协同发音效应等影响合成语音质量的主要因素,建立相应音节的声调曲线、时长规则和音节之间协同发音规则等韵律规则,并利用时域基间同步叠加法原理调整合成语音的音高和时长,从而使合成的语音比较清晰自然。  相似文献   

7.
提出了一种多描述正弦编码器(MDSC).该编码器基于正弦和等效矩形带宽(ERB)噪声模型,正弦参数按照奇数位和偶数位交织的方法分解到两个描述中, 而噪声参数经过分裂矢量量化后,索引分配到两个描述中.仿真结果表明,该编码器能够提供较高的传输稳定性和压缩效率.因为该编码器为无状态编码器,所以分组的丢失不会影响编码器状态的恢复,适合在互联网等不可靠且带宽受限的信道上传输语音信号.  相似文献   

8.
语音相位听觉特性在正弦模型语音编码中的运用   总被引:1,自引:0,他引:1  
通过分析语音相位的听觉特性,把这种听觉特性运用到基于正弦模型语音编码合成元音的相位处理中,只通过幅频信息和少量的原始相位信息来合成重建语音信号,仿真实验结果表明这种方法能改善合成信号中帧与帧之间的不连续性,使帧与帧之间能平滑过渡,能增加语音自然度,提高语音的合成质量。  相似文献   

9.
在基于包方式传输的网络中进行高频信号的实时传输时,利用信号模型对信号进行压缩有强大的生命力。基于帧结构的匹配跟踪原理,提出了一种有效而灵活的正弦模型分解方法。利用匹配跟踪算法,通过迭代抽取每帧信号的一组正弦成分,把这些成分通过帧重叠相加就可以重构原来的信号。使用高频域的快速傅氏变换算法(FFT)能有效快速地实现整个模型。本文提出的方法可用于信号压缩和调整,由于抽取的正弦成分是以人耳感觉的好坏排序的,因此该方法特别适合于音频信号的逐级压缩。  相似文献   

10.
针对PSOL气算法会引起频域上的不连续的不足,提出一种汉语韵律调整的新方法。该方法基于语音的正弦模型理论,把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量,然后进行语速和音高的调整,实验结果证明,合成的语音信号保持了原有语音的清晰度和自然度。将该方法应用于汉语文语转换系统中,得到较好的效果。  相似文献   

11.
为改善语音识别系统的性能,采用时频分布参数来描述语音特征。由于时频分布参数考虑到语音信号内在的非平稳特性,因此能够更准确地描述语音信号的时频特性。对基于正弦模型的多种时频参数(能量谱和幅度加权瞬时频谱)进行了比较,并在基于隐马尔可夫模型的连接词语音识别系统中进行了实验仿真。结果表明,单独采用时频分布参数作为ASR的前端特征并不能改善识别率;而采用标准ASR特征和能量谱时频特征的联合前端特征,可以有效地改善语音识别系统的识别效果。  相似文献   

12.
4kb/s低速率语音编码的一种新算法   总被引:1,自引:0,他引:1       下载免费PDF全文
4kb/s低速率语音编码是近年来语音信号处理研究的重要课题,也是ITU-T下步要标准化的重点,介绍了目前4kb/s低速率语音编码的最新进展,关重分析了基音位置同步码激励线性预测编码(PPS-CELP)的原理和结构,并与G.729、G.723.1等算法进行了性能比较。  相似文献   

13.
提出一种多描述分层语音编码器. 该编码器基于正弦和等效矩形带宽(ERB)模型,将正弦和噪声模型参数根据能量大小进行适当分配以得到不同的描述和感知层,两个描述中任一描述内包含一个基本层和两个增强层. 该编码器结合了多描述编码(MDC)和分层编码的优点,能够提供稳定的传输质量和速率的自适应. 在有记忆和无记忆信道下对编码器性能的仿真和实验结果表明,在存在分组丢失的情况下,该编码器的性能优于相同速率下的其他编码器.  相似文献   

14.
Automatic speech recognition under conditions of a noisy environment remains a challenging problem. Traditionally, methods focused on noise structure, such as spectral subtraction, have been employed to address this problem, and thus the performance of such methods depends on the accuracy in noise estimation. In this paper, an alternative method, using a harmonic-based spectral reconstruction algorithm, is proposed for the enhancement of robust automatic speech recognition. Neither noise estimation nor noise-model training are required in the proposed approach. A spectral subtraction integrated autocorrelation function is proposed to determine the pitch for the harmonic model. Recognition results show that the harmonic-based spectral reconstruction approach outperforms spectral subtraction in the middle- and lowsignal noise ratio (SNR) ranges. The advantage of the proposed method is more manifest for non-stationary noise, as the algorithm does not require an assumption of stationary noise.  相似文献   

15.
设计了一种用于MEMS传感器电容读出的频率可调的正弦波振荡器。振荡器采用OTA-C结构,通过调节工作于线性区的MOS管的漏源电压来改变OTA的gm,从而实现对频率的调节。振荡器可输出四路相位分别为90°,180°,270°和360°的振荡信号。芯片在0.5μm 2P3M CMOS工艺下设计并流片,测试表明在5V电源电压下振荡频率在180KHz~1.2MHz之间线性可调,振荡频率对于电源电压变化的灵敏度为8.1%/V。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号