排序方式: 共有13条查询结果,搜索用时 15 毫秒
1.
纳西语语音合成的初步研究 总被引:1,自引:0,他引:1
杨鉴 《云南大学学报(自然科学版)》1995,17(1):105-109
本文初步建立了一个纳西语按规则语音合成系统,该系统采用共振峰语音合成技术,以350个左右的无调单音节和4种声调模式为合成基元,该系统不仅适用于纳西语文-语转换系统,而且也是一个研究纳西语语音的有力工具。 相似文献
2.
3.
针对传统的显著性检测算法存在区域亮度不够、显著区域不准确、有背景噪声等问题,提出一种基于凸包计算和颜色特征的显著性检测算法.考虑到图像在不同的颜色空间中颜色取值范围不同,首先,在多种颜色空间经过超像素分割得到区域对比图;然后,在CIELAB颜色空间中得到平滑的通道差值图;其次,利用颜色增强的Harris形成凸包得到中心先验图以及凸包结构图;最后,将4种显著图特征融合并优化得到最终显著图.新算法更加接近人工标注图的结果,不仅能够从背景中分离出显著物体、抑制背景干扰和凸出显著区域,而且获得全分辨率的显著图.在公开的图像数据集上将新算法与其他现有8种显著性检测算法进行对比,实验结果表明,新算法优于其他算法. 相似文献
4.
5.
6.
说话人辨认是语音信号研究中的一个重要组成部分。本文根据掌上电脑录音的语音数据库进行说话人辨认的实验。当高斯混合模型(GMM)用于说话人辨认,而特征矢量的协方差矩阵取不同形式时,比较用EM算法对模型参数进行估计的收敛性以及对说话人辨认的影响。实验表明,当特征矢量参数协方差矩阵为满矩阵时,EM算法能更有效估计GMM参数,有效提高识别率。 相似文献
7.
基于矢量量化的组合参数法说话人识别 总被引:5,自引:0,他引:5
说话人识别的方法很多,提出的基于矢量量化(VQ)的算法,在语音特征表征上利用几种特征参数的组合使用来提高识别率,在VQ过程中,经典的K均值算法收敛速度快,但极易收敛于局部最佳点,为了使聚类算法收敛于全局最优点,同时提高识别率,采用模拟退火算法来改善聚类码本质量.讨论了具体的算法实现,并给出了一些实验数据,实验结果表明该处理方法是有效的. 相似文献
8.
基于云南境内说话人母语为纳西语、僳僳语的汉语普通话语音,采用隐马尔可夫模型(HMM),由标准普通话语音库训练得到基线系统的声学模型(HMMSTD).然后以基线系统的声学模型为初始模型,分别用母语为纳西语、傈僳语的汉语普通话语音训练得到各自的声学模型(HMMNX和HMMLS),对于未知语音,根据各识别系统的概率得分。采用最大概率准则进行口音的分类判决.实验表明,基于HMM的口音识别系统,其正确识别率达93%。 相似文献
9.
针对当前显著性检测算法普遍存在的背景噪声较多,目标区域检测不够完整等问题,提出了一种空间域的显著性算法.首先将输入图像进行超像素分割,以边缘信息作为背景先验区域集,通过计算超像素与背景先验区域集内超像素在颜色、亮度方面的差异,得到背景差异显著图;然后确定前景先验区域集,计算各超像素与前景先验区域集内超像素的差异性,得到前景差异显著图.最后融合两部分显著图;最后在此基础上构建视觉中心,围绕视觉中心确定各超像素空间权重信息,得到最终显著图.采用MSRA-1000数据库进行对照实验,结果表明本文算法的准确性更高,整体效果更好. 相似文献