排序方式: 共有15条查询结果,搜索用时 15 毫秒
11.
基于Fisher线性判别分析的语音信号端点检测方法 总被引:1,自引:0,他引:1
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 相似文献
12.
扩展了原有IPv6中Anycast概念,提出了一个IPv6中k-Anycast通信模型概念,此模型允许k个服务器协同工作共同完成一项服务,它很好地实现了k-Anycast组节点动态加入和离开.此外,在本模型中k-Anycast服务请求消息会被距离最近的k-Anycast树节点处理,这样使得k-Anycast服务请求均衡地分布在k-Anycast树节点之间从而得到高效的处理.在IPv6模拟环境下,将k-Anycast模型应用到CDN技术中,实验数据证明,k-Anycast模型的应用不仅大幅度地提高了服务质量而且也有效地节省了网络带宽,充分证明了k-Anycast通信模型的有效性、可行性以及实用性. 相似文献
13.
基于非负矩阵分解的语音去噪,在提高语音信号信噪比的同时,也会引起语音失真,从而导致噪声环境下说话人确认系统性能下降.本文提出基于分区约束非负矩阵分解的语音去噪方法(Nonnegative Matrix Factorization with Partial Constrains,PCNMF),目的是在未知和非平稳噪声条件下提高话人确认系统的鲁棒性.PCNMF在满足分区约束条件的基础上分别构建语音字典和噪声字典.考虑到传统语音训练产生的语音字典往往含有一定的噪声成分,PCNMF通过数学模型产生基音及泛音频谱,在此基础上利用该频谱模仿人声的共振峰结构来合成字典,从而保证语音字典纯净性.另一方面,为了克服传统噪声字典构建方法带来的部分噪声信息丢失问题,PCNMF对在线分离出的噪声样本进行分帧和短时傅里叶变换,然后以帧为单位线性组合生成噪声字典.性能评估实验引入了多种噪声类型,实验结果表明PCNMF可有效提高说话人确认系统的鲁棒性,特别是在未知和非平稳噪声条件下其等错率相比基线系统(Multi-Condition)平均降低了5.2%. 相似文献
14.
根据视觉认知规律,提出描述野外场景图像的三要素:地面、垂直物、天空,给出了单视角野外场景图像方程,通过采用基于独立图元函数码的三要素图像快速分类方法,实现对野外场景图像的分割,并且只在地面上去识别水体.本文重点讨论了野外场景中水体光照模型,分析了野外场景的相关物理特性,定义了水质参数、环境染色参数、图元、独立图元函数码、母图元等新概念,给出了野外场景分析与水体识别系统,提出基于位置、纹理、地质系数和环境染色等多特征参数的数据融合水体识别方法.实验表明该方法对于宽阔的道路场景分析和道路上的水体识别可以得到很好的效果. 相似文献
15.
该文针对基于非负低秩稀疏图的半监督学习算法不能准确地描述数据结构的问题,提出一种融合平滑低秩表示和加权稀疏约束的改进算法。该算法分别对经典算法的低秩项和稀疏项进行改进,准确地捕获了数据的全局子空间结构和局部线性结构。在构建目标函数时,使用对数行列式函数代替核范数平滑地估计秩函数,同时利用形状交互信息和有标签样本的类别信息构造加权稀疏约束正则项。然后通过带有自适应惩罚的线性交替方向方法求解目标函数并采用有效的后处理方法重构数据的图结构,最后利用基于局部和全局一致性的半监督分类框架完成学习任务。在ORL库,Extended Yale B库和USPS库上的实验结果表明,该改进算法提高了半监督学习的准确率。 相似文献