首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 50 毫秒
1.
基于客观特征对民族乐器的音色进行了研究与分析.首先通过对音色描述词的主观打分,进行了描述词的分析与聚类选择,将16个音色描述词进一步分为具有区分度的4个音色类别.然后基于同种类乐器具有相似音色的前提,构建了民族乐器音色的分类模型,其中支持向量机模型表现最好,准确率达到78.38%.针对实验现象,本文进一步分析了音色的影响因素,除与乐器种类有关以外,音色还与乐器类别、音高等多重因素相关.  相似文献   

2.
音色是乐器识别的依据,考虑到乐音信号的谐波对音色的物理意义,本文提出具有良好稀疏性的离散谐波变换(Discrete Harmonic Transform,DHT)用于乐音信号谐波结构提取,并通过DHT构建了描述乐器音色的DHT特征.通过将本文提出的特征应用于不同复杂度的乐器音频数据集,验证了本文所提出的DHT方法的有效性,在此基础上构建的DHT特征能很好地反应乐器音色的特征,为乐音信号的特征提取提供了新思路.进一步,将本文提出的DHT特征与线性倒谱预测系数(Linear Prediction Cepstrum Coefficient,LPCC)和Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)构成的组合特征分别应用于乐器演奏的单音和乐曲片段数据集的乐器识别中,与现有算法相比,新算法在较低特征维数下达到了更高的乐器识别的准确率.  相似文献   

3.
利用特征线集总化将双曲型偏微分方程组变换为在一定方向上的常微分方程组。在此基础上,用较简单的数值计算方法,如预报—校正数值积分算法,就可得稳定、精确的仿真结果。推广到处理类似回旋窑的复杂分布参数系统,也同样有效。  相似文献   

4.
本文主要研究音乐声的音色感知特征与情感的关联关系.首先通过多维尺度分析方法确定了一个5维的情感空间;然后针对72种音色的音阶素材和48种音色的旋律素材进行情感标注主观评价实验,得到音色素材的情感数据;按照演奏内容、时域特性以及乐器类型这3种因素进行分类,分别研究了音色感知特征和情感的相关关系;采用多维偏好分析方法和单因...  相似文献   

5.
分析了加工过程对零件特征的需求;探讨了特征工程变换的基本原理.提出了特征分段、特征族化和特征序列等理论与方法;研究了求解工程变换三要素的基本计算公式.  相似文献   

6.
本文提出一种新的语音波形的帧间差分编码算法,文中对帧间差分编码所遇到的帧匹配、过渡帧处理和量化器设计等问题进行了讨论,文末给出了汉语普通话几个常见单元音量化信噪比的测试结果。实验表明:采用四比特帧间差分编码,当信号采样频率为8kHz时,其短时量化信噪比的平均值超过29dB,利用归一化新波形的对称性、半周期取零技术和基音重复,预测误差用4比特量化时,可在数码率2k~4kbps情况下得到优质重建语音。  相似文献   

7.
归一化方差用来表示图像分解后各级子图受退化处理影响的程度,而且归一化方差越小其抵抗外来攻击的能力越强.用归一化方差来选择嵌入水印的位置,本文提出了一种基于空间域和变换域的双水印算法,实验验证了该算法的有效性.  相似文献   

8.
在特征价格模型的应用中,函数形式的选择具有多样化,包括线性函数、对数函数、半对数函数等。在国外研究的基础上,提出在线性函数应用的基础上,对模型进行Box-Cox变换,并利用线性Box-Cox特征模型对巴黎的住宅市场进行实证研究。实证研究的结果有效地解释了各个特征与价格之间的关系,同时还说明,对住宅特征的数据变换可以有效地改善模型结构,使得模型的拟合效果更好,从而证实了该特征模型的有效性及优越性。  相似文献   

9.
针对在视觉跟踪任务中,当目标体的外形发生变化时,传统的粒子滤波算法在模型更新的过程中往往出现偏差并逐渐累积,最终导致跟踪性能降低的问题,作者通过挖掘目标体区别于背景的颜色信息,建立特征颜色模型,提出了一种改进算法.该算法首先使用粒子滤波进行粗定位,然后基于特征颜色模型分割目标.实验表明,作者提出的算法速度快,能够准确地跟踪目标的外观变化,对目标体的旋转和遮挡以及光线变化具有一定的鲁棒性,特别适合于跟踪行人和车辆等具有显著颜色的目标.  相似文献   

10.
针对最小二乘支持向量机在语音数据大样本输入下的局限性,提出了一种基于GMM特征变换和模糊LS-SVM的学习算法,结合高斯混合模型在拟合数据分布方面和最小二乘支持向量机在分类辨别方面的突出优势,有效地提取说话者特征信息,压缩了数据,解决了大样本数据输入下最小二乘支持向量机的训练速度和测试精度问题,同时在LS-SVM系统中引入模糊隶属度函数,很好地解决了不可分数据的输出.理论研究和实验表明,所提方法能充分地利用训练数据,使得系统在具有更好辨别能力的同时提高了鲁棒性和识别率.  相似文献   

11.
基于Gaussian混合模型的LSF参数量化方法   总被引:1,自引:1,他引:0  
为了高效率量化线谱频率(linear spectrumfrequency,LSF)参数,提出了基于G auss ian混合模型(G auss ian m ix ture m ode l,GMM)的LSF量化算法。假设LSF矢量属于GMM中的某一个G auss ian分布,用G auss ian分布随机矢量的量化方法对LSF矢量进行了量化。利用准确的G auss ian分布变量量化误差,得到了G auss ian分布矢量的比特分配方法。应用G auss ian分布随机变量的非均匀量化方法量化每一维LSF参数。最后给出了分裂矢量量化、基于概率密度函数(probab ility dens ityfunction,PDF)量化方法和该算法的性能对比。该无记忆LSF量化算法在21 b/帧可以达到透明量化,比传统Sp litVQ节省3 b。  相似文献   

12.
针对距离误差对定位结果的影响,提出一种基于高斯混合模型的无线传感器网络定位算法.该算法将高斯混合模型方法引入到无线传感器网络的定位问题中,通过高斯混合模型分析找出误差较大的距离信息并将其剔除,对剩余距离信息使用三边测量定位法进行定位求解,同时结合加权定位算法进行位置估计.仿真实验结果表明,改进算法能提高定位精度,且定位结果更稳定.  相似文献   

13.
改进的GMM模型语声转换系统   总被引:1,自引:0,他引:1  
传统的基于GMM模型线性语音转换系统在语音转换阶段,由于转换函数的概率加权组合使合成语音共振峰带宽变宽,谱包络过于平滑.文中提出依据后验概率大小和前后语音的相关性,选择部分转换分量函数进行语音转换.实验表明不仅简化了语音转换,而且经过转换的语音质量也有一定的提高,对语音的实时转换有重要的意义.  相似文献   

14.
为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数(MFCC)与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。  相似文献   

15.
提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。  相似文献   

16.
基于高斯混合密度函数估计的语音分离   总被引:3,自引:0,他引:3  
基于最大熵法(Maximum Entropy,ME)、最小互信息量法(Minimum Mutual Information,MMI)和最大似然法(MaximumLIkelihood,ML)最解决盲信号分离问题的常用算法,分析了ME、MMI以及ML算法之间关系。基于高斯混合模式(Gaussian Mixture Model,GMM)概率密度函数估计,提出了一种采用反馈结构的扩展最大熵语音分离算法,与  相似文献   

17.
Skin segmentation is widely used in many computer vision tasks to improve automated visualization. This paper presents a graph cuts algorithm to segment arbitrary skin regions from images. The detected face is used to determine the foreground skin seeds and the background non-skin seeds with the color probability distributions for the foreground represented by a single Gaussian model and for the background by a Gaussian mixture model. The probability distribution of the image is used for noise suppression to alleviate the influence of the background regions having skin-like colors. Finally, the skin is segmented by graph cuts, with the regional parameter γ optimally selected to adapt to different images. Tests of the algorithm on many real world photographs show that the scheme accurately segments skin regions and is robust against illumination variations, individual skin variations, and cluttered backgrounds.  相似文献   

18.
提出利用超声层次上的韵律信息来进行语种辨识.在子词分割的基础上结合元音/辅音检测模型,将语音分割为CnV的假音节模型,然后对每个假音节提取一个五维的特征韵律参数.分割结果比传统的分割方法更接近实际的音节结构.在韵律系统中,对所有的语言建立高斯混合模型(GMM),研究模型的离散度和模型间的干扰程度.实验表明,韵律模型对不同的语言、不同的语系和同一语系中不同语言均具有一定的区分效果.  相似文献   

19.
针对背景场景重复显现问题,提出了一种基于历史背景的混合高斯模型(History Background-based GMM,HBGMM).相较于传统的混合高斯模型,该模型对历史背景模型进行标记,并通过判决匹配次数快速调整历史背景模型的学习率.同时对模型权重低于阈值下限历史模型和非历史模型进行区别处理,用该方法更新模型权重从而降低误检率,使历史模型尽量避免误删除.实验结果表明,本文提出的基于历史背景的混合高斯背景模型能够实现记忆背景的功能,从而更快地适应场景的变化,减少前景误判.  相似文献   

20.
一种新的高斯混合模型参数估计算法   总被引:3,自引:0,他引:3  
该文提出了一种高斯混合模型(GMM)参数估计的改进算法.原始的特征向量先经Schmidt正交化消除各维间的相关性,再用数学形态学方法估计出各维概率分布中混合分量的真实个数,最后按真实的混合分量个数用EM算法对各维分别作标量GMM参数估计.该方法能缓解GMM传统参数估计算法引起的“不易扩展”的不便.实验结果表明,将其应用于说话人辨认,能在较大幅度提高训练速度的基础上相对传统GMM参数估计方法获得更高的识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号