首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汉语连续语音数据库的语料设计   总被引:10,自引:0,他引:10  
质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持.在目前阶段,汉语语音数据库应限制在朗读言语(readspeech)的音段方面。为了描写语流中的音变现象,考虑如下语音单元:(1)不计声调的音节(401个)。(2)音节间的双音子415个。(3)音节间的三音子3035个,这是根据37个基本音子,利用音节间共振峰过渡的研究结果,按规则规纳的结果.(4)所有音节间过渡段的韵母一声母结构,采用和同三音子相同的归并方法,共781个.为了增加不同的韵律结构,并考虑语音识别系统的后处理,语料还包括汉语的17类基本句型.选用1993、1994两年的“人民日报”、“百家报刊精选”及若干电视剧本、词典词库作为语料库的原始语料,从中选出2185个句子和388个短语作为朗读语料,它们覆盖了99.8%个无调音节,100%的双音子,99.6%的三音子,以及17类句型。  相似文献   

2.
袁卫文 《应用声学》2015,23(3):60-60
提出了一种基于可见光通信技术的新型室内无线视频语音通信系统。本文介绍了相关的系统架构,全双工的实现技术及TCP/IP的组网方案等,并对室内可见光通信中提高系统整体性能的若干关键技术进行了讨论。  相似文献   

3.
水下数字语音通信系统的研究和实现   总被引:8,自引:0,他引:8  
将相干水声通信技术和混合码激励线形预测语音编码技术相结合进行了研究,设计并实现了一个可应用于浅海水声信道的实时数字语音通信系统.系统针对语音编码数据的特点,根据语音数据对恢复话音重要程度的不同,采用分层的信道编码以减少总体冗余度提高系统传输效率,采用鲁棒的语音帧同步机制、引入缓存机制保证语音数据流的连续性以提高系统整体性能;采用基于信道估计的内嵌二阶锁相环分数间隔判决反馈均衡器以对抗水声信道多径的影响.对该系统进行的海试在6 km和11 km距离上成功地实现了较高质量(可分辨出不同说话人)的实时水下语音通信,海试结果表明该系统可以应用于半双工实时水下数字语音通信.  相似文献   

4.
李子殷  陆明 《应用声学》1984,3(2):27-29,18
本文介绍了在微计算机Cromemco System Ⅲ上模拟电话授时台的方法及实验结果.其特点是通过语音编码压缩数据量,并利用微计算机的内部时钟,在微计算机上做到实时语音输出.实验结果表明,当用户有报时要求时,输出的语音质量是好的.由于经语音编码后压缩了数据量,所以电话授时台的工作可以利用单板机来实现.对于其它需要有限语音输出的自动化系统,本方法也有参考价值.  相似文献   

5.
双关不仅是一种文字游戏,还是一种有效的修辞方式,广泛应用于各种文体之中。本文主要就汉英双关的分类及修辞作用进行了对比,并举例探讨了双关的翻译。  相似文献   

6.
语音识别赋予了计算机能够识别出语音内容的功能,是人机交互技术领域的重要研究内容。随着计算机技术的发展,语音识别已经得到了成熟的发展。但是关于方言的语音识别还有很大的发展空间。中国是一个幅员辽阔、人口众多的国家,因此方言种类繁多,其中有3000多万人交流使用的重庆方言就是其中之一。采集了重庆方言的部分词语的文本文件和对应的语音文件建立语料库,根据重庆方言的发音特点,选取重庆方言的声韵母作为声学建模基元,选取隐马尔可夫模型(Hidden Markov Model, HMM)为声学模型设计了一个基于HMM的重庆方言语音识别系统。在训练过程利用语料库中训练集语料对声学模型进行训练,形成HMM模型库;在识别过程利用语料库中的测试集语料进行识别测试。实验结果表明,该系统能够实现重庆方言的语音识别,并且识别的正确率为100%。  相似文献   

7.
汉语连续语音识别中语音处理和语言处理统合方法的研究   总被引:5,自引:1,他引:4  
提出了一种语音处理和语言处理按帧同步统合的汉语连续语音识别方法。该方法把基于 CFG语言模型和 Top Down型句法分析器的语言处理过程结合进基于有限状态自动机控制的 One Pass Viterbi语音识别算法中,实现了帧同步的语音语言处理的统合。为完成帧同步句法分析的单词预测和语音识别过程的结合,本文提出了一种类似于Earley法的 TopDown型句法分析方法以及 One Pass Viterbi算法中的有限状态自动机动态展开建立法. 60个音素单位和 8个声调单位的 HMM作为识别用基元模型被用于识别实验,识别结果表明,对于一个识别困难度(Perplexity)为27.3的任务(Task)的识别系统,利用本文提出的方法,10名话者发音的 1070句子的平均识别率达到 94.4%,比利用传统的基于单词确认(Word Spotting)以及从单词串(列)(lattice)进行句法分析的阶层性语音·语言统合方式的识别率提高约8%.  相似文献   

8.
立体视觉临场感系统的设计和实现   总被引:1,自引:0,他引:1  
首先分析了立体视觉原理,并设计了全局立体视觉反馈及其平台系统。结合机器人遥操作任务和临场感要求,设计和实现了分路式和分时式两种立体视觉显示系统。利用立体视觉临场感进行了机器人遥操作试验,验证了其在遥操作试验中的作用。  相似文献   

9.
正弦语音模型是一种新的语音信号处理模型。为考察这一模型的效果,我们在微机上实现了一个基于该模型的语音分析/合成系统。本文介绍该系统的基本原理,并通过比较输入、输出系统的语音波形形状及对音节/sα/的非正式辨听,对这种分析/合成方法进行非正式评价。结果表明,该方法失真较小。  相似文献   

10.
基于语音识别技术,设计了一套语音远程控制四旋翼飞行器的系统。使用LD3320语音处理芯片和STM32微处理器实现语音识别功能,采用NRF24L01将识别结果传输到飞行器。选用STM32作为四旋翼飞行器的主控芯片,采用六轴运动组件MPU6050、三轴数字罗盘HMC5583L等传感器对飞行器的姿态进行实时测量,再利用数字滤波器对姿态信息进行处理,然后采用四元数进行姿态解算,最后运用双闭环PID控制算法实现姿态控制的要求。测试结果表明,通过语音可以控制四旋翼的正常飞行及姿态变化,系统稳定可靠。  相似文献   

11.
以单片机为核心,通过AGC电路收集语音模拟信号,转换为数字信号后存入单片机当中,再通过单片机程序实现对信号的回放.数字化语音存储及回放系统实现了对语音录音与放音的数字化控制,增加语音的存储量,对采集的语音采用了非失真压缩算法,压缩后再进行存储处理,确保了语音回放的可靠质量.  相似文献   

12.
语音识别控制系统需要对语音进行录制与播放处理,利用单片机实现该功能可克服传统语音录制与播放系统需外接语音处理模块、体积大且使用较复杂的缺点。因此选用SPR4096存储器作为语音的数字化信号存储器件,利用凌阳16位单片机设计与实现语音录制与播放硬件系统。结果表明,该硬件系统降低了电路复杂度和制作成本,简单易行,具有有较高的实用价值。  相似文献   

13.
根据汉语语音特点,为汉语人机对话系统设计了反映汉语语音主要特征、现象的语音试验材料集,作为汉语人机对话系统语音知识库的素材,用于研究语音合成规则、训练语音识别模板等.语音材料的选择以全面、典型、适量为原则,以反映汉语语音的韵律特征和音色特征的变化规律为目的,分别以声调及其组合、声韵组合为基础选择语音材料.全部材料已用数字录音机录制完毕。  相似文献   

14.
探讨了连续隐马尔可夫模型的基本原理及其在汉语数码语音识别中的应用,实现了一个汉语数码语音识别系统,其正确识别率达到99%以上。  相似文献   

15.
16.
汉语连续语音识别的语速自适应算法   总被引:4,自引:3,他引:1  
王作英  李健 《声学学报》2003,28(3):229-234
在连续语音中,不同的说话者在不同语境下说话的速度差异是很大的。偏离正常语速往往会造成识别错误,使识别性能下降。考虑到语速对于语音单元段长的影响是同步增长或同步下降的,相邻语音单元的段长之间存在很强的相关性,本文从利用段长的相关信息出发,在基于段长分布的隐含马尔可夫模型(DDBHMM:Duration Distribution Based HMM)的框架上,提出了一种语速自适应算法。对数字串和大词汇量连续语音识别的试验表明这个算法是有效的。  相似文献   

17.
在机电设备、精密器件等研发工作和电路校准、传感器应用等日常实验中,数字多用表常被用于微弱信号的测量,但数字多用表只能实时显示采集到的信号,不能存储信号,在实验和应用中无法将检测到的波形、数据和实验状态实时对应,只能通过人工肉眼估计读取,给实验和应用带来了一定的困扰。为了解决该问题,开发了一个基于LabVIEW的电流信号采集系统,该系统可以将采集到的波形实时显示在面板上,同时将检测到的准确电流数据和读取时间存储到PC机。实验结果表明,该系统可以更好地显示电流信号,同时可以进行信号的存储,避免了肉眼读取数字多用表的误差,增强了读取数据的准确性。  相似文献   

18.
多点流场压力实时测量系统的研制是为了测量某设备内部的各种液体或气体等参数的流动情况,实时地监测设备内部的流动参数的变化情况,准确得到压力测量值,并对所测的压力分布数据进行分析、判断,找出流场参数对设备性能的影响。  相似文献   

19.
为研究计算机辅助驾驶系统中交警手势的识别,搭建了一个虚拟驾驶场景的实验室研究仿真系统。采用了微软公司的Kinect设备采集人体骨骼数据,经由经验模型提取特征并使用模式识别对交警手势信号进行信号分类,使用unity公司的unity3D软件实现虚拟驾驶场景的三维重建。系统测试表明,使用kinect进行手势识别响应快,准确率高,使用unity作为虚拟驾驶场景的开发平台方便快捷,两者组合非常适宜搭建基于视觉的辅助驾驶系统的仿真环境。  相似文献   

20.
高噪声背景下的孤立词语音识别方法研究及系统实现   总被引:2,自引:0,他引:2  
对高噪声背景下的语音特点进行了分析,提出了适应于高噪声背景下孤立词语音识别的全套方法,进行了系统实现。对本方法和系统进行了详细的实验比较和测试,证明系统在80dB左右接近同类无噪声识别系统的精度,最高可以抵抗100dB的噪声。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号