首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
汉语文-语转换系统的研究与实现   总被引:4,自引:0,他引:4       下载免费PDF全文
本文重点介绍一种基于语音学的分词算法和语音韵律规律的研究.同时还介绍了我们研制的无限词汇的文字到语音的转换系统,该系统可把计算机内的文本转换成语音输出.  相似文献   

2.
齐士钤 《应用声学》1994,12(1):47-48
由中国声学学会语言听觉和音乐声学分会、中国电子学会信号处理学会语音图象通信专业委员会与四川省电子学会联合主办、由电子工业部西南通信研究所承办的第六届全国语音图象通讯信号处理学术会议于今年九月分四日在四川省南坪县召开.首先由会议主席电子工业部西南通信研究所所长刘村友教授致开幕词,中国科学院声学研究所副所长侯朝焕研究员发表讲话.开幕式上最后由刘村友教授做题为“通信保护动向趋势”的大会报告,这个报告概括了当今国际上通信保护的主要问题,受到与会者的重视与欢迎,并进行了讨论,对通讯保护这一研究领域加深了认…  相似文献   

3.
正弦语音模型是一种新的语音信号处理模型。为考察这一模型的效果,我们在微机上实现了一个基于该模型的语音分析/合成系统。本文介绍该系统的基本原理,并通过比较输入、输出系统的语音波形形状及对音节/sα/的非正式辨听,对这种分析/合成方法进行非正式评价。结果表明,该方法失真较小。  相似文献   

4.
本文介绍了一种实用的汉语语音合成系统,本系统采用线性预测方法对语音信号进行分析与合成,并对码本进行矢量量化,码率压缩到1200bit/s,大幅度降低了语音的存储能量,合成出的语音仍具有较高的清晰度.这种以数字信号处理专用芯片TMS320C10为处理器的便携式语音合成器,合成语音数量大,成本低,功耗较小,既可联机使用,也可用电池供电,自成系统.实际应用证明,汉语多功能语音合成器实用性强,用途广泛,适于推广.  相似文献   

5.
刘淑媛 《应用声学》1988,7(2):17-20
本文介绍了一种在IBM-XT机上绘制语音信号(自然语音或合成语音)波形图的方法。这一方法可以使语音波形在屏幕上连续卷动或稳定显示某一特定帧,并给出波形上任意一点的X、y坐标,使语音工作者可以形象、直观地了解一段语音的全貌或某一局部的细节,对深入研究语音有很大帮助。文章给出了一些语音信号的波形图。  相似文献   

6.
如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。本文首先介绍了单通道情况下语音增强的信号模型,然后对4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。  相似文献   

7.
戎月莉 《应用声学》1994,12(5):37-41
将模糊逻辑应用于语音识别系统,具有减少数据量和计算量,提高语音识别率的优点.本文阐述了二值化时频图型模糊匹配法(BTSP)的原理,并对它目前的一些应用产品作了简单介绍.  相似文献   

8.
压缩编码技术是无线语音通信的关键技术之一。介绍了语音编码技术的基本概念及分类,并选用AMBE多带激励压缩编码算法,通过单片机控制专用语音压缩DSP芯片,提出了一种适合低速无线语音、数据实时通信的系统解决方案,完成了硬件、软件设计,实现了低速率下的语音、数据的同步大气传输。测试结果显示,在语音编码速率为2.4kbps以下时,仍然可以得到音质较好的语音输出。  相似文献   

9.
张家騄 《应用声学》1991,10(3):30-30
中国声学学会语言、听觉和音乐声学分科学会及北京声学学会和中国电子学会、中国仪器仪表学会、信号处理学会语音图像通信专业委员会,联合主办第五届全国语音、图像、通信、信号处理学术会议,定于1991年第四季度在湖南大庸市举行。  相似文献   

10.
俞铁成 《物理》1998,27(2):125-125
适用于自动语音识别的声道参数¥中国科学院声学研究所@俞铁城适用于自动语音识别的声道参数我们听到的语音是由舌、唇、喉等发音器官连续移动而产生的.这些发音器官调制嘴腔道中的气流形成语音而后到达我们的耳朵.可以自问一下,在我们感知语音时是否把这些发音器官的移动亦...  相似文献   

11.
张玉梅  胡小俊  吴晓军  白树林  路纲 《物理学报》2015,64(20):200507-200507
对给定的英语音素、单词和语句进行了采集并完成预处理. 分别应用互信息法和Cao 氏法确定了实际采集的语音信号序列的延迟时间和嵌入维数, 以完成语音序列的相空间重构. 通过计算实际采集的语音信号序列的最大Lyapunov指数, 完成了语音信号的混沌特性识别, 判定其具有混沌特性. 引入Volterra级数, 提出了一种具有显式结构的语音信号非线性预测模型. 为克服最小均方误差算法在Volterra模型系数更新时固有的缺点, 在最小二乘法基础上, 应用基于后验误差假设的可变收敛因子技术, 构建了一种基于Davidon-Fletcher-Powell算法的二阶Volterra 模型(DFPSOVF), 并将其应用于具有混沌特性的语音信号序列预测. 仿真结果表明: DFPSOVF非线性预测模型对于单帧和多帧语音信号均具有更好的预测精度, 优于线性预测模型, 并且能够很好地反映语音序列变化的趋势和规律, 完全可以满足语音预测的要求; 可以根据语音信号序列的嵌入维数选取预测模型的记忆长度. 所提出模型可以为语音信号重构和压缩编码开辟一条新途径, 以改善语音信号处理方法的复杂度和处理效果.  相似文献   

12.
基于听觉模型的耳语音的声韵切分   总被引:5,自引:0,他引:5       下载免费PDF全文
丁慧  栗学丽  徐柏龄 《应用声学》2004,23(2):20-25,44
本文分析了耳语音的特点,并根据生理声学及心理声学的基本理论与实验资料,提出了一种利用听觉模型来进行耳语音声韵切分的方法。这种适用于耳语音声韵切分的听觉感知模型主要分为四个层次:耳蜗对声音频率的分解机理;听觉系统的时域和频域非线性变化;中枢神经系统的侧抑制机理。这种模型能反映在噪声环境下人对低能量语音的听觉感知特性,因而适于耳语音识别,在耳语音声韵母切分实验中得到了满意的结果。  相似文献   

13.
基于主成分分析的汉语连续语音切分算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张永锋  杨影  肖莹莹 《应用声学》2011,30(5):366-369
连续语音切分是汉语连续语音识别中的一项重要技术。本文将通常用于图像处理的主成分分析(PCA)方法引入汉语连续语音切分领域,目的是通过PCA,降低语音帧之间的频谱相关性。再利用相邻语音帧特征构成的三维子空间的大小,实现连续语音切分,取得了不错的切分效果。  相似文献   

14.
张天骐  李伟  林孝康  刘林 《应用声学》2005,24(3):157-163
本文提出了一种基于数字谱分析的嗓音控制开关(VOX,Voice—Operated Transmit)的新算法,该算法简单、实用,在某种程度上克服了传统VOX算法的结构复杂、参数难调等局限,对噪声的鲁棒性也较好,而且易于用数字信号处理实现。首先利用信号功率谱二次处理,提取出语音的平均幅度包络,然后对所得包络进行阈值处理、限幅放大,最后就得到VOX函数。理论分析和计算机模拟结果表明,该算法不仅能较为准确地提取出语音波形的平均幅度包络,而且能工作在较低的信噪比条件下。  相似文献   

15.
The Study of Full Light Speech Signal Collection System   总被引:2,自引:0,他引:2  
1 Introduction  Opticfibercouplershavebeenwidelyusedintheopticalcommunicationandopticalsensors.Besidestheirpowerdistributionfunctions,thecouplers′coherentdemodulationcharacterwhichhasbeenusedinthefieldofopticinterferometer[1 ,2 ] isalsoimportant,butthatwas…  相似文献   

16.
The Volume- Unit (VU) meter, used in speech research prior to the advent of computers and modern signal processing methods, is described in signal processing terms. There are no known software implementations of this meter, which meet the 1954 ASA standard and provide the instantaneous needle level. Important speech applications will be explored, such as making comparisons of speech levels to earlier classic works, and measuring speech levels using traditional methods on modern computers. It is our intention to make this venerable method of measuring speech levels available once again. The VU meter is simulated and its properties are studied. A 1950s vintage and a recent vintage VU meter are studied by comparing the transient responses to tones and measurement of speech levels. Based on these measurements, a software VU meter (henceforth referred to as VUSOFT) is simulated, and verified. The method for reading the meter is explained, and simulated in software. The VU level for speech is shown to depend on the reading duration. The relationship between the root-mean-squared (rms) level of a signal and the VU level of a signal is determined, as a function of the meter-reading time.  相似文献   

17.
为了解决含噪语句分割问题,也为了解决某些低信噪比环境下传统气导语句分割算法分割效果差、分割准确度低且算法自适应性弱等问题,提出一种基于骨导语音自适应的分段双门限语音分割方法。将骨导语音和气导语音同步采集,获取抗噪性能更好的骨导语音,然后在融合过零率与短时能量中引入随机动态阈值的自适应方法进行端点检测,最后利用分段双门限和语音聚类等手段实现语音分割,提高语音分割算法的鲁棒性。通过实验验证了所提算法的有效性和可行性,同时与其他语音分割算法进行了对比,证明该文所提分割算法精度更高,效果更好。  相似文献   

18.
An algorithm is described for restoring the speech of a diver distorted while working at considerable depths. Conversion results in generation of the full speech spectrum via digital signal processing methods. The technique of choosing the key conversion parameters is suggested. A device for converting speech using digital signal processors is implemented. Results of articulation tests are shown.  相似文献   

19.
In this paper, a fundamental frequency (F(0)) tracking algorithm is presented that is extremely robust for both high quality and telephone speech, at signal to noise ratios ranging from clean speech to very noisy speech. The algorithm is named "YAAPT," for "yet another algorithm for pitch tracking." The algorithm is based on a combination of time domain processing, using the normalized cross correlation, and frequency domain processing. Major steps include processing of the original acoustic signal and a nonlinearly processed version of the signal, the use of a new method for computing a modified autocorrelation function that incorporates information from multiple spectral harmonic peaks, peak picking to select multiple F(0) candidates and associated figures of merit, and extensive use of dynamic programming to find the "best" track among the multiple F(0) candidates. The algorithm was evaluated by using three databases and compared to three other published F(0) tracking algorithms by using both high quality and telephone speech for various noise conditions. For clean speech, the error rates obtained are comparable to those obtained with the best results reported for any other algorithm; for noisy telephone speech, the error rates obtained are lower than those obtained with other methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号