期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

江益靓孙校珩梁晓晶李子晋李伟《复旦学报(自然科学版)》2020,(3):346-353+359

基于客观特征对民族乐器的音色进行了研究与分析.首先通过对音色描述词的主观打分,进行了描述词的分析与聚类选择,将16个音色描述词进一步分为具有区分度的4个音色类别.然后基于同种类乐器具有相似音色的前提,构建了民族乐器音色的分类模型,其中支持向量机模型表现最好,准确率达到78.38%.针对实验现象,本文进一步分析了音色的影响因素,除与乐器种类有关以外,音色还与乐器类别、音高等多重因素相关. 相似文献

2.

基于离散谐波变换的西洋乐器音色特征提取方法

孙聪珊杨婧马琳李海峰《复旦学报(自然科学版)》2020,(5):531-539

音色是乐器识别的依据,考虑到乐音信号的谐波对音色的物理意义,本文提出具有良好稀疏性的离散谐波变换(Discrete Harmonic Transform,DHT)用于乐音信号谐波结构提取,并通过DHT构建了描述乐器音色的DHT特征.通过将本文提出的特征应用于不同复杂度的乐器音频数据集,验证了本文所提出的DHT方法的有效性,在此基础上构建的DHT特征能很好地反应乐器音色的特征,为乐音信号的特征提取提供了新思路.进一步,将本文提出的DHT特征与线性倒谱预测系数(Linear Prediction Cepstrum Coefficient,LPCC)和Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)构成的组合特征分别应用于乐器演奏的单音和乐曲片段数据集的乐器识别中,与现有算法相比,新算法在较低特征维数下达到了更高的乐器识别的准确率. 相似文献

3.

分布参数动态模型的特征线变换仿真

吴惕华《河北科技大学学报》1988,(1)

利用特征线集总化将双曲型偏微分方程组变换为在一定方向上的常微分方程组。在此基础上,用较简单的数值计算方法,如预报—校正数值积分算法,就可得稳定、精确的仿真结果。推广到处理类似回旋窑的复杂分布参数系统,也同样有效。相似文献

4.

音乐声的音色感知特征与情感的关联研究

郭纪莹刘京宇蒋玉暕《复旦学报(自然科学版)》2021,60(3):347-352

本文主要研究音乐声的音色感知特征与情感的关联关系.首先通过多维尺度分析方法确定了一个5维的情感空间;然后针对72种音色的音阶素材和48种音色的旋律素材进行情感标注主观评价实验,得到音色素材的情感数据;按照演奏内容、时域特性以及乐器类型这3种因素进行分类,分别研究了音色感知特征和情感的相关关系;采用多维偏好分析方法和单因... 相似文献

5.

特征的工程变换研究

刘璇沈晓红《北京工商大学学报(自然科学版)》1998,(3)

分析了加工过程对零件特征的需求;探讨了特征工程变换的基本原理．提出了特征分段、特征族化和特征序列等理论与方法;研究了求解工程变换三要素的基本计算公式．相似文献

6.

波形变换域语音波形的帧间差分编码

伍康文陈云凤《中山大学学报(自然科学版)》1995,34(1):41-45

本文提出一种新的语音波形的帧间差分编码算法，文中对帧间差分编码所遇到的帧匹配、过渡帧处理和量化器设计等问题进行了讨论，文末给出了汉语普通话几个常见单元音量化信噪比的测试结果。实验表明：采用四比特帧间差分编码，当信号采样频率为８ｋＨｚ时，其短时量化信噪比的平均值超过２９ｄＢ，利用归一化新波形的对称性、半周期取零技术和基音重复，预测误差用４比特量化时，可在数码率２ｋ～４ｋｂｐｓ情况下得到优质重建语音。相似文献

7.

基于空间域和变换域的双水印算法的研究

杨峰武鲁英杨勇周国亮刘方《山东师范大学学报(自然科学版)》2008,23(2):7-9

归一化方差用来表示图像分解后各级子图受退化处理影响的程度,而且归一化方差越小其抵抗外来攻击的能力越强.用归一化方差来选择嵌入水印的位置,本文提出了一种基于空间域和变换域的双水印算法,实验验证了该算法的有效性. 相似文献

8.

基于Box-Cox变换的住宅特征价格理论研究

下载免费PDF全文

高建周丽萍《河北科技大学学报》2007,28(3):247-250

在特征价格模型的应用中,函数形式的选择具有多样化,包括线性函数、对数函数、半对数函数等。在国外研究的基础上,提出在线性函数应用的基础上,对模型进行Box-Cox变换,并利用线性Box-Cox特征模型对巴黎的住宅市场进行实证研究。实证研究的结果有效地解释了各个特征与价格之间的关系,同时还说明,对住宅特征的数据变换可以有效地改善模型结构,使得模型的拟合效果更好,从而证实了该特征模型的有效性及优越性。相似文献

9.

基于特征颜色模型的粒子滤波改进算法

郝志会汪渤孙抗《北京理工大学学报》2011,31(4):436-440

针对在视觉跟踪任务中,当目标体的外形发生变化时,传统的粒子滤波算法在模型更新的过程中往往出现偏差并逐渐累积,最终导致跟踪性能降低的问题,作者通过挖掘目标体区别于背景的颜色信息,建立特征颜色模型,提出了一种改进算法.该算法首先使用粒子滤波进行粗定位,然后基于特征颜色模型分割目标.实验表明,作者提出的算法速度快,能够准确地跟踪目标的外观变化,对目标体的旋转和遮挡以及光线变化具有一定的鲁棒性,特别适合于跟踪行人和车辆等具有显著颜色的目标. 相似文献

10.

基于GMM特征变换和模糊LS-SVM的说话人辨认

李燕萍唐振民丁辉张燕《华中科技大学学报(自然科学版)》2008,36(Z1)

针对最小二乘支持向量机在语音数据大样本输入下的局限性,提出了一种基于GMM特征变换和模糊LS-SVM的学习算法,结合高斯混合模型在拟合数据分布方面和最小二乘支持向量机在分类辨别方面的突出优势,有效地提取说话者特征信息,压缩了数据,解决了大样本数据输入下最小二乘支持向量机的训练速度和测试精度问题,同时在LS-SVM系统中引入模糊隶属度函数,很好地解决了不可分数据的输出.理论研究和实验表明,所提方法能充分地利用训练数据,使得系统在具有更好辨别能力的同时提高了鲁棒性和识别率. 相似文献

11.

基于Gaussian混合模型的LSF参数量化方法 总被引：1，自引：1，他引：0

赵永刚唐昆崔慧娟《清华大学学报(自然科学版)》2006,46(10):1727-1730

为了高效率量化线谱频率(linear spectrumfrequency,LSF)参数,提出了基于G auss ian混合模型(G auss ian m ix ture m ode l,GMM)的LSF量化算法。假设LSF矢量属于GMM中的某一个G auss ian分布,用G auss ian分布随机矢量的量化方法对LSF矢量进行了量化。利用准确的G auss ian分布变量量化误差,得到了G auss ian分布矢量的比特分配方法。应用G auss ian分布随机变量的非均匀量化方法量化每一维LSF参数。最后给出了分裂矢量量化、基于概率密度函数(probab ility dens ityfunction,PDF)量化方法和该算法的性能对比。该无记忆LSF量化算法在21 b/帧可以达到透明量化,比传统Sp litVQ节省3 b。相似文献

12.

基于高斯混合模型的无线传感器网络定位算法

方省罗引曹家徐楠蒋水宾郝艳妮《吉林大学学报(理学版)》2022,60(3):713-720

针对距离误差对定位结果的影响,提出一种基于高斯混合模型的无线传感器网络定位算法.该算法将高斯混合模型方法引入到无线传感器网络的定位问题中,通过高斯混合模型分析找出误差较大的距离信息并将其剔除,对剩余距离信息使用三边测量定位法进行定位求解,同时结合加权定位算法进行位置估计.仿真实验结果表明,改进算法能提高定位精度,且定位结果更稳定. 相似文献

13.

改进的GMM模型语声转换系统 总被引：1，自引：0，他引：1

申毅简志华杨震《南京邮电大学学报(自然科学版)》2007,27(5):11-15,21

传统的基于GMM模型线性语音转换系统在语音转换阶段,由于转换函数的概率加权组合使合成语音共振峰带宽变宽,谱包络过于平滑.文中提出依据后验概率大小和前后语音的相关性,选择部分转换分量函数进行语音转换.实验表明不仅简化了语音转换,而且经过转换的语音质量也有一定的提高,对语音的实时转换有重要的意义. 相似文献

14.

基于MFCC特征组合参数的说话人识别研究

曾霞霞徐戈吴征远《集美大学学报(自然科学版)》2016,(4):317-320

为提高说话人识别系统的识别率,提出了一种提取Mel频率倒谱系数（MFCC）与差分特征组合参数的方法:先对传统的MFCC参数进行特征分量归一化处理,提升MFCC系数的噪声鲁棒性;再用高斯混合模型(GMM)构建了说话人识别系统。使用TIMIT语音库进行实验测试,并比较了不同高斯混合数的MFCC特征参数组合对识别率的影响。结果表明:使用改进的MFCC混合参数明显地提高了说话人的识别率。相似文献

15.

基于音素分类的汉语语声转换算法

李燕萍张玲华丁辉《南京邮电大学学报(自然科学版)》2011,31(1):10-15,38

提出了一种基于音素分类的语声转换算法。根据汉语语音学理论,分析汉语语言结构,通过帧特征分析,构建了汉语元音映射表,指导音素的分类,然后对每类音素进行独立的特征参数转换,解决了传统GMM转换算法的过平滑问题,避免了训练与测试阶段的语料音素之间的不均衡,从而提高语音的可懂度与自然度。客观评测结果表明,基于音素分类的语声转换算法与GMM算法相比,谱距离比值平均降低了9.31%;主观听力测试表明,ABX测试结果提高了10.36%,同时MOS得分平均提高了29.33%。相似文献

16.

基于高斯混合密度函数估计的语音分离 总被引：3，自引：0，他引：3

虞晓胡光锐《上海交通大学学报》2000,34(2):177-180

基于最大熵法（ＭａｘｉｍｕｍＥｎｔｒｏｐｙ,ＭＥ）、最小互信息量法（ＭｉｎｉｍｕｍＭｕｔｕａｌＩｎｆｏｒｍａｔｉｏｎ,ＭＭＩ）和最大似然法（ＭａｘｉｍｕｍＬＩｋｅｌｉｈｏｏｄ,ＭＬ）最解决盲信号分离问题的常用算法,分析了ＭＥ、ＭＭＩ以及ＭＬ算法之间关系。基于高斯混合模式（ＧａｕｓｓｉａｎＭｉｘｔｕｒｅＭｏｄｅｌ,ＧＭＭ）概率密度函数估计,提出了一种采用反馈结构的扩展最大熵语音分离算法,与相似文献

17.

Skin Segmentation Based on Graph Cuts

胡芝兰王贵锦林行刚严洪《清华大学学报》2009,14(4):478-486

Skin segmentation is widely used in many computer vision tasks to improve automated visualization. This paper presents a graph cuts algorithm to segment arbitrary skin regions from images. The detected face is used to determine the foreground skin seeds and the background non-skin seeds with the color probability distributions for the foreground represented by a single Gaussian model and for the background by a Gaussian mixture model. The probability distribution of the image is used for noise suppression to alleviate the influence of the background regions having skin-like colors. Finally, the skin is segmented by graph cuts, with the regional parameter γ optimally selected to adapt to different images. Tests of the algorithm on many real world photographs show that the scheme accurately segments skin regions and is robust against illumination variations, individual skin variations, and cluttered backgrounds. 相似文献

18.

基于韵律信息的语种辨识系统

下载免费PDF全文

侯丽敏缪炜《上海大学学报(自然科学版)》2009,15(5):441-444

提出利用超声层次上的韵律信息来进行语种辨识.在子词分割的基础上结合元音/辅音检测模型,将语音分割为CⁿV的假音节模型,然后对每个假音节提取一个五维的特征韵律参数.分割结果比传统的分割方法更接近实际的音节结构.在韵律系统中,对所有的语言建立高斯混合模型(GMM),研究模型的离散度和模型间的干扰程度.实验表明,韵律模型对不同的语言、不同的语系和同一语系中不同语言均具有一定的区分效果. 相似文献

19.

一种基于历史背景的混合高斯背景建模算法

肖进胜 刘婷婷张亚琪彭红鄢煜尘《湖南大学学报(自然科学版)》2015,42(10):127-132

针对背景场景重复显现问题,提出了一种基于历史背景的混合高斯模型(History Background-based GMM,HBGMM).相较于传统的混合高斯模型,该模型对历史背景模型进行标记,并通过判决匹配次数快速调整历史背景模型的学习率.同时对模型权重低于阈值下限历史模型和非历史模型进行区别处理,用该方法更新模型权重从而降低误检率,使历史模型尽量避免误删除.实验结果表明,本文提出的基于历史背景的混合高斯背景模型能够实现记忆背景的功能,从而更快地适应场景的变化,减少前景误判. 相似文献

20.

一种新的高斯混合模型参数估计算法 总被引：3，自引：0，他引：3

王超侯丽敏《上海大学学报(自然科学版)》2005,11(5):475-480

该文提出了一种高斯混合模型（GMM）参数估计的改进算法．原始的特征向量先经Schmidt正交化消除各维间的相关性,再用数学形态学方法估计出各维概率分布中混合分量的真实个数,最后按真实的混合分量个数用EM算法对各维分别作标量GMM参数估计．该方法能缓解GMM传统参数估计算法引起的“不易扩展”的不便．实验结果表明,将其应用于说话人辨认,能在较大幅度提高训练速度的基础上相对传统GMM参数估计方法获得更高的识别率．相似文献