首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
张天骐  徐昕  吴旺军  刘瑜 《声学学报》2016,41(1):135-142
针对基本反复模型音乐分离方法自适应性差的问题,提出一种基于美标度倒谱系数(MFCC)的多反复结构模型的音乐分离方法。首先,提取出音乐信号的MFCC系数矩阵(39维的数据构成);然后利用余弦特性得到其相似矩阵,进而将相似度一致的片段划分到一起,建立不同的反复结构模型;之后结合理想二元掩蔽(]BM)分离出背景音乐及歌声的频谱,相应的时域信号则由傅里叶逆变换获得;最后,在不同类型、长度的音乐文件上测试了算法性能,将提出的算法与Rafii的反复算法和Ozerov的灵活窗非负矩阵分解方法进行对比。实验结果表明,改进方法在分离性能上最高提高3 dB左右,并且对于曲调变换大的音乐提高效果更为明显,从而证实了改进方法是一种有效的音乐分离方法,并且更具稳定性。   相似文献   

2.
针对现有的单一音乐分离算法难以分离背景音乐和歌声的问题,提出一种融合声源分离及反复结构模型的音乐分离方法。该方法首先通过迭代的方式分离出音乐的谐波声源和冲击声源,再引入节奏谱分析不同声源的能量谱矩阵,对其建立反复周期结构模型,最后保留谐波源的反复周期成分,去除冲击源的反复周期成分,得到分离后的背景音乐和歌声。针对MIR-1K数据库,对1000首音乐片段的分离实验表明,与现有分离方法对比,本文方法在分离背景音乐和歌声时均表现出优异的性能。   相似文献   

3.
张天骐  熊梅  张婷  杨强 《声学学报》2019,44(3):393-400
针对音乐信号中的歌声与伴奏相互关联难以分离的问题,提出了一种区分性训练深度神经网络(Deep Neural Network,DNN)的音乐分离方法。首先,在DNN模型的基础上同时考虑歌声与伴奏间的重建误差和区分性信息,提出了一种改进的目标函数进行区分性训练;其次,在DNN模型上额外添加一层,引入时频掩蔽对估计出的歌声伴奏进行联合优化,相应的时域信号由傅里叶逆变换获得;最后,验证不同参数设置对分离性能的影响,并与现有的音乐分离方法进行对比.实验结果表明,改进的目标函数和时频掩蔽的引入明显提高了DNN的分离性能,且与现有的音乐分离方法相比分离性能最高提高了4 dB从而证实所提方法是一种有效的音乐分离方法。   相似文献   

4.
For the difficulty of separation between singing and accompaniment in the musical signals,an improved music separation method of based on discriminative training depth neural network(DNN) was proposed.Firstly,based on the DNN model,considering the reconstruction errors and discrimination information between singing and accompaniment,an improved objective function was presented to discriminate the training;Then,an additional layer was added to DNN model,introducing the time-frequency masking to optimize the estimated accompaniment of the song,and the corresponding time-domain signal was obtained by inverse Fourier transform;Finally,the influence of different parameters on the separation performance was verified,and compared it with the existing music separation methods.The experimental results showed that the improved objective function and the introduction of time-frequency masking significantly improved the separation performance of the DNN,and the separation performance was improved about 4 dB compared with other existing music separation methods,thus verifying that the proposed method was an effective music separation algorithm.  相似文献   

5.
章雯  张君  王璐  赵静  鲍明  许耀华 《声学学报》2023,48(1):249-263
针对复杂环境下多通道声信号分离问题,提出稀疏正交联合约束多通道非负矩阵分解声信号分离方法。首先设计基于多通道扩展坂仓斋藤(Itakura-Saito,IS)散度的稀疏正交联合约束项构造代价函数,给出信号稀疏和信号正交约束辅助函数,实现代价函数最小化求解。然后通过迭代更新规则设计,得到稀疏正交优化的多通道非负矩阵分解基矩阵和系数矩阵,讨论了稀疏正交约束对基矩阵和系数矩阵稀疏性与连续性影响。最后基于多通道信号空间特性,进行了非负矩阵分解基聚类以获得多通道非负矩阵分解声信号的分离结果。双通道音频数据与四通道声学目标分离实验数据测试表明,对音频数据,所提算法在性能指标信号失真比(SDR)上提高了0.84 dB,对于直升机声源数据,所提算法在SDR上提高了4.53 dB。  相似文献   

6.
A method used for objective evaluation of pronunciation of finals in standard Chinese is presented. The formant pattern of final is selected as the mam feature and an improved evaluation algorithm based on Support Vector Machine is proposed. In this algorithm, two-level classification strategy is employed. A full-classification model and a sub-classification model are trained for each final. The pronunciation quality is evaluated based on the classification results of this two-level strategy with scoring model of each final. The new evaluation method is compared with traditional methods such as Hidden Markov Model (HMM) posterior probability scoring method and feature of Mel-Frequency Cepstrum Coefficients (MFCC), and the results show that the performance is effectively improved by the proposed method. The correlation of scores between human testers and machine has achieved 82%.  相似文献   

7.
王玮蔚  张秀再 《应用声学》2019,38(2):237-244
针对传统语音情感特征参数在进行情感分类时性能不佳的问题,该文提出了一种基于变分模态分解的语音情感识别方法。情感语音信号首先由变分模态分解提取固有模态函数,然后对所选主导固有模态函数进行重新聚合,再提取梅尔倒谱系数和各固有模态函数的希尔伯特边际谱。为了验证该文提出的特征性能,选用两种语音数据库(EMODB、RAVDESS)进行实验,按该文方法提取特征后使用极限学习机进行语音情感分类识别。实验结果表明:相比基于经验模态分解和集合经验模态分解的语音情感特征,该文提出的特征有更好的识别性能,验证了该方法的实用性。  相似文献   

8.
9.
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。  相似文献   

10.
一种改进的DNN-HMM的语音识别方法*   总被引:2,自引:1,他引:1       下载免费PDF全文
针对深度神经网络与隐马尔可夫模型(DNN-HMM)结合的声学模型在语音识别过程中建模能力有限等问题,提出了一种改进的DNN-HMM模型语音识别算法。首先根据深度置信网络(DBN)结合深度玻尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC)和对数域的Mel滤波器组系数(Fbank)作为声学特征参数,通过TIMIT语音数据集进行实验。实验结果表明:结合了DBM的DNN-HMM模型相比DNN-HMM模型更具优势,其中,使用MFCC声学特征在词错误率与句错误率方面分别下降了1.26%和0.20%。此外,使用默认滤波器组的Fbank特征在词错误率与句错误率方面分别下降了0.48%和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到21.06%和3.12%的好成绩。  相似文献   

11.
肖寒春  郭俊峰  张丽 《应用声学》2018,37(6):909-915
梅尔倒谱系数特征提取技术依据人耳的感知特性将声信号从线性频域转换到梅尔域,在语音识别中得到广泛应用。该文将梅尔倒谱系数技术用于小型低空飞行器的声信号特征提取中,并针对螺旋桨驱动类的小型低空飞行器具有稳定的强谐波特性,对梅尔倒谱系数特征提取中使用的梅尔滤波器进行改进,通过对此类谐波处的线性频谱与梅尔谱转换曲线的斜率进行投影替换,提高滤波器对该谐波处信号的感知敏感度。仿真结果表明,使用改进的梅尔倒谱系数特征提取方法对小型低空飞行器进行特征提取时,能够得到更低的等误识率,并且在低信噪比环境中,改进的梅尔倒谱系数特征提取方法具有更好的抗噪能力。  相似文献   

12.
Optically active bionanocomposite membranes composed of polyester (PE) and cellulose/silica bionanocomposite (BNCs) prepared with simple, green and inexpensive ultrasonic irradiation process. It is a novel method to enhance the gas separation performance. The novel optically active diol containing functional trifluoromethyl groups was prepared in four steps reaction and it was fully characterized by different techniques. Commercially available silica nanoparticles were modified with biodegradable nanocellulose through ultrasonic irradiation technique. Transmission electron microscopy (TEM) analyses showed that the cellulose/silica composites were well dispersed in the polymer matrix on a nanometer scale. The mechanical properties nanocomposite films were improved by the addition of cellulose/silica. Thermo gravimetric analysis (TGA) data indicated an increase thermal stability of the PE/BNCs in compared to the pure polymer. The results obtained from gas permeation experiments showed that adding cellulose/silica to the PE membrane structure increased the permeability of the membranes. The increase in the permeability of the gases was as follows: PCH4 (38%) <PN2 (58%) <PCO2 (88%) <PO2 (98%) Adding silica nanoparticles into the PE matrix, improved the separation performance of carbon dioxide/methane and carbon dioxide/nitrogen gases. Increasing the cellulose/silica mass fraction in the membrane increased the diffusion coefficients of gases considered in the current study. Further, antimicrobial test against pathogenic bacteria was carried out.  相似文献   

13.
视网膜血管分割在眼底图像分析中具有重要作用。结合多尺度Hessian矩阵滤波和线检测算子,提出了一种有效的血管检测方法。首先利用多尺度Hessian矩阵的特征值构建血管相似性函数,实现血管增强;然后采用改进的线检测算子,提取反映血管测度的特征;最后采用SVM实现血管检测。实验结果表明,该方法只需要较少的训练样本即可达到与其他方法相当的准确率,且在灵敏性上具有更好的性能。  相似文献   

14.
高光谱遥感影像包含了丰富的光谱信息,对于地物具有极强的分辨能力,从而促进了不需任何先验信息的高光谱异常目标探测技术的发展。KRX(Kernel RX)异常探测算法巧妙地利用核函数将RX算法映射至高维特征空间,加强了光谱中非线性信息的运用,具有较强的可分辨性,显著改善了低维空间的光谱不可分问题。然而,也暴露了KRX算法中病态Gram矩阵求逆误差大,异常检测效率低等缺点。为实现理论上KRX算法的强探测性能,提出一种基于新型聚类方法的改进KRX探测算法(DC-KRX)。(1)由于空间邻域像元具有较强的光谱相似性,会造成Gram矩阵病态,严重影响了异常探测效果,因此背景虚检现象严重。针对病态Gram矩阵的求逆误差问题,算法改进了KRX算子,对Gram矩阵进行奇异值分解,选取特征值较大的主成分,保证了Gram矩阵的求逆精度,待测像元的探测结果采用l-2范数表示,检测效果提高明显;(2)在改进KRX的基础上,提出了空间聚类KRX算法。空间像元之间具有光谱强相关性,既造成了Gram矩阵的病态,数据的冗余也影响了探测效率。实验发现,通过聚类算法可以合并像元于聚类中心,减少空间维度,提高计算效率;同时,聚类中心按照聚类大小被赋予不同的权重,保证了探测精度;(3)另一方面,选用合适的聚类算法是一个难点。聚类KRX算法对于聚类算法的精度和实时性要求较高,比较发现,一种基于密度峰值快速搜索(DC)的新型聚类算法具有较好的聚类性能。算法采用欧式距离计算任意像元的相似度,利用局部密度和邻域距离作为聚类中心的联合判断准则,对结果进行排序得到聚类中心。实验发现,该聚类算法计算速度快,且能够对任意形状的分布进行聚类,非常适合于维度较高,成分复杂的高光谱图像,且适用于较高次数的重复聚类。DC-KRX算法提供了一种空间聚类预处理的高光谱异常探测新思路,最后,与国际主流探测算法对比发现,该算法表现了较好的探测性能。同时,时效性对比分析发现,聚类前后算法的检测效率提高了30%以上,有效改善了KRX算法的实时性。  相似文献   

15.
Based on a new definition of user similarity, we introduce an improved collaborative filtering (ICF) algorithm, which couM improve the algorithmic accuracy and diversity simultaneously. In the ICF, instead of the standard Pearson coefficient, the user-user similarities are obtained by integrating the heat conduction and mass diffusion processes. The simulation results on a benchmark data set indicate that the corresponding algorithmic accuracy, measured by the ranking score, is improved by 6. 7% in the optimal case compared to the standard collaborative filtering (CF) algorithm. More importantly, the diversity of the recommendation lists is also improved by 63.6%. Since the user similarity is crucial for the CF algorithm, this work may shed some light on how to improve the algorithmic performance by giving accurate similarity measurement.  相似文献   

16.
张少康  田德艳 《应用声学》2019,38(2):267-272
传统水下声目标识别分类方法具有较强的人机交互特性,无法满足未来水下无人平台智能识别分类水声目标的需求。针对这一问题,提出了一种基于梅尔倒谱系数(MFCC)的水下声目标智能识别分类方法,该方法通过提取水下声目标梅尔倒谱系数特征,采用长短时记忆网络(LSTM)构建了智能识别分类模型。使用实际水声信号对该方法进行了验证,结果表明,基于梅尔倒谱系数的水下声目标智能识别分类方法能够在不依赖人工提取特征的情况下,对目标噪声进行识别分类,具备智能化识别分类能力。  相似文献   

17.
覃飞  刘杰 《应用声学》2016,24(1):74-74
为了改进引力搜索算法求解箱式约束优化问题的性能,提出了一类自适应引力搜索算法,新算法定义了算法停滞系数,当算法陷入停滞时,可以自适应的修改引力参数,帮助算法跳出停滞状态;定义了个体相似系数,当种群陷入局部最优时,通过变异策略改善种群的多样性。数值试验结果表明,新算法有效的平衡了全局开发和局部搜索能力,具有更强的全局寻优能力,适于求解复杂优化问题。  相似文献   

18.
基于多带解调分析和瞬时频率估计的耳语音话者识别   总被引:4,自引:0,他引:4  
王敏  赵鹤鸣 《声学学报》2010,35(4):471-476
为了改善耳语音话者识别的稳健性,提出了一种基于调幅-调频(AM-FM)模型的耳语音特征参数,瞬时频率估计(IFE)。根据语音产生的共振峰调制理论,采用多带解调分析(MDA)获得语音的瞬时包络和频率;然后根据包络幅度和频率的加权估计,得到语音的特征IFE来描绘语音的频率结构。将该特征用于耳语话者识别并和传统的Mel倒谱系数(MFCC)进行了比较。实验结果表明,随着测试人数的增加,IFE的识别效果略好于MFCC;在测试信道改变的情况下,与MFCC相比IFE的稳健性得到了有效的提高。   相似文献   

19.
利用正交设计分别配制含有三种防腐剂、四种甜味剂的模拟水样,采用核独立成分分析(KICA)处理模拟水样与加入不同含量标准品的饮料样品的紫外光谱(UV)数据,得到其中待测添加剂或背景成分的UV轮廓的独立组分(IC)信息,以IC的系数矩阵进行支持向量回归(SVR)分析,建立模拟样品中防腐剂与甜味剂的UV-KICA-SVR预测模型。添加不同含量水平添加剂的碳酸饮料样品,采用KICA处理其测试得到的UV光谱数据,得到与添加剂对应的IC信息及量,加入量与预测量线性回归方程截距即为饮料中添加剂含量。利用化学计量学“盲源信号分离”方法提取饮料样品中的待测添加剂IC信息与样品基质信息,利用SVR对解析得到的IC信号回归分析建模,改进传统单一组分测定的标准加入法,建立了碳酸饮料样品中防腐剂和甜味剂高通量筛查分析的新方法。方法用于测定碳酸饮料中山梨酸钾,苯甲酸钠、对羟基苯甲酸甲酯钠三种防腐剂与糖精钠、安赛蜜,阿斯巴甜和甘草酸铵四种甜味剂含量,检测限(LOD)为0.2~1.0 mg·L-1,测定结果与传统的色谱方法相当。  相似文献   

20.
基于层间相似性的时序网络节点重要性研究   总被引:5,自引:0,他引:5       下载免费PDF全文
杨剑楠  刘建国  郭强 《物理学报》2018,67(4):48901-048901
时序网络可以更加准确地描述节点之间的交互顺序和交互关系.结合多层耦合网络分析法,本文提出了基于节点层间相似性的超邻接矩阵时序网络节点重要性识别方法,与经典的认为所有层间关系为常数不同,层间关系用节点的邻居拓扑重叠系数进行度量.Workspace和Enrons数据集上的结果显示:相比经典的方法,使用该方法得到的Kendall’sτ值在各时间层上的平均提高,最高为17.72%和12.44%,结果表明层间相似性的度量对于时序网络的节点重要性度量具有十分重要的意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号