首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
语音识别性能的不理想造成的识别错误以及不符合文法的口语输入往往造成口语理解性能下降.针对这个问题,提出一种改进口语理解稳健性的方法.该方法通过在训练数据集中人工加入错误文本噪声进行语料扩充,再进行条件随机场口语理解模型训练,用得到的模型对具有噪声的未知数据集进行口语理解.实验结果表明该方法能提高口语理解的稳健性,较未加入噪声训练得到的模型在准确率、召回率及F1值上都有显著的提高.  相似文献   

2.
基于人工神经网络的多媒体语音特征挖掘   总被引:1,自引:1,他引:0  
提出了一种基于人工神经网络的聋儿语音训练识别的多媒体特征挖掘技术 .构造了邻域三层神经元合作竞争的动态行为神经元模型 ;实验选取了动态递减函数、动态最小覆盖矩阵和动态确定阈值形成的 SOL A挖掘算法 ;以及聚类分布的网络图技术 .解决了聋儿语音训练系统中基本语音识别的难题 .  相似文献   

3.
语谱 图在语音分析方 面 有着广泛 的应用.音素的 自动分割是语音识别过程中的一个基本阶段,它 将把语音句子按音素特征 进行分割.本文提出 了一 个音素 自动分割的方法 ;使用了两个表示 语谱图密度变化 的形变函 数,以及 自适应阂值技术来 定位每个音素段的边 缘.这个方法在 计算机 上 具体实现 后.我们对取于 一 个 语谱图数据 库的一组 实验数据,用本 文所介绍 的自动分割方法划分 音素,将所得结果与 由一 语音学家分 割的结果进行 比较,得到 的识别率高于 93 %.这 个方法作为语音识别系 统的一 部分.已经在一 个语音分析 系统中使用.  相似文献   

4.
本文研讨缺乏语言资源的民族语言(如维吾尔语)中如何引用语音技术、开发应用系统问题.提出基于GMM-UBM混合SVM技术方法实现实用性说话人识别系统,通过小语料人工标注语音语料预选高精度声学根(seed)模型、再引导大语料训练生成鲁棒性声模提高连续语音识别精度实现汉民会话语音翻译系统.对维吾尔语70人发话电话语音识别实验结果显示,基于GMM-UBM -SVM方法的不特定说话人识别实验其正确识别率为94.3%,比先行GMM-UBM方法精度提升3%;基于seed声模HTK-Julius技术的维吾尔语连续语音识别实验,其识别率为72.5%,比直接使用语音文本对齐语料单靠HTK实现识别方法(63.2%)精度提高9.3%;同时本研究讨论基于Moses技术的汉维医院门诊会话语音翻译系统预测Blue值达到了57.7%.  相似文献   

5.
近年来,文本方面级的细粒度情感分析受到了越来越多的重视,并且在医疗文本方面的作用也越来越大。与粗粒度情感分析相比,细粒度情感分析可以区分医疗文本的每个具体方面词,并且可以得到每个方面词所表达的情感信息。方面级情感分析任务需要考虑方面词和情感词之间的交互,而医疗文本既可作为方面词,又可作为情感词。因此,提出了一个包含上下文位置潜在信息的方面级情感分析模型,实现对于医疗文本信息的情感分析。医疗文本中与特定方面词情感极性判断相关的上下文词一般位于该方面词的附近,而且由于医疗方面词的上下文的词数量存在差异,可能会导致词嵌入向量表示的属性变化,使得方面词的相对位置会有所不同。因此,提出了一种新的上下文位置调整函数,通过调整上下文词在不同位置的权重,增强与指定方面词相关的情感极性词的针对性,减轻方面词两侧词数差异对情感极性判断的干扰。同时,为了将包含特定方面的情感信息的方面词以向量表示,引入了一个线性条件随机场模型辅助建立方面词向量表示的模型。最终,使用焦点损失函数来训练模型参数,处理医疗文本中的情感分析的类不平衡问题。  相似文献   

6.
采用基于段长分布的非齐次隐马尔可夫模型(DDBHMM)进行维吾尔语声学建模。在新语料下由于总词汇量的成倍增加导致识别时间倍增,为缩短识别时间将耗时最长的概率计算部分采用多线程机制优化了识别模块,同时加入了端点检测进行控制,并相继设计了录音模块、特征提取模块、波形显示及结果输出显示模块等,对这些模块进行集成界面化后产生了一个基于DDBHMM的维吾尔语连续语音声学层实时识别系统,并对系统进行了测试及验证.  相似文献   

7.
为了在大规模定制环境下准确高效的获取产品工时,本文研究了已有工时估算模型的特点,提出一种基于模型集成的工时估算方法.通过对待集成工时模型分析,找出影响各工时模型的关键因子,采用模糊评价法构建关键因子信息矩阵;运用因子间相关度和因子对模型贡献度计算模型间距离,进而根据反距离权重法求出各模型权重,从而得到集成模型.通过实例和结果对比验证了该方法的可行性和精确性.  相似文献   

8.
基于距离的自适应Web数据库记录匹配方法   总被引:1,自引:0,他引:1  
Web数据库环境的重复记录识别是Deep Web信息集成的重要步骤,具有查询依赖性、缺乏训练样本、在线处理要求等特征,导致现有的实体识别技术无法适用.在分析现有方法基础上,引入动态属性权重调整思想,提出基于距离的自适应记录匹配算法,在计算记录对的相似度时,加大匹配记录集合中相似度较大的属性的权重,并加大非匹配记录集合中相似度较小的属性的权重,迭代处理从而达到自适应动态调整各个属性权重的目标.该方法不需要训练样本,也不需要人工参与,实验结果表明其适用于Web数据库环境的重复记录识别处理.  相似文献   

9.
为了准确识别自然成熟的香梨果实,使得采摘机能对水果目标进行精确的定位,提出了使用目标检测深度学习网络模型的方法.该模型基于Mask R-CNN,首先通过在Kaggle数据集以及网上爬取并筛选出的9 600张水果图片对Resnet网络进行初步训练,然后在预训练过的Resnet网络基础上加入掩模分支和分类分支训练自然环境下成熟香梨的数据集,最终获得准确识别香梨目标的网络模型.实验结果表明,在同等目标未添加噪声的情况下,在使用水果图片数据集预训练的基础上,图片的平均分割精度为98.02%,这与使用COCO数据集进行预训练相比(精度为93.72%),平均分割精度增加了4.30%.此外,该模型对于被遮挡水果也有着不错的识别效果,在未添加噪声的情况下,被遮挡水果的平均分割精度为95.28%,这与未被遮挡水果的分割精度相比,误差仅增加了2.74%.所以,此模型对于香梨的识别和分割具有很好的鲁棒性.  相似文献   

10.
针对基于任务一角色的访问控制模型(task-role-based access control,T-RBAC)无法满足主体客体上下文环境变化对访问授权的要求,并且只考虑了部分工作流上下文信息如任务执行序列与互斥任务等问题,本文对其进行了扩展,提出了一种动态的上下文相天访问控制模型,它保留了原T-RBA(:支持角色层次关系及任务驱动的特性,引入上下文环境,将其与模型中的主体及任务关联.扩展后的模型充分考虑任务执行时主体与客体的物理环境,可以动态地激活主体相关角色及权限;在商业过程所建立起的工作流上下文环境下,支持权限级职权分离与任务实例级动态职权分离;根据任务的主动和被动特性,分别使用主动会话和被动会话的方法来实现动态授权.  相似文献   

11.
语音语料库是语音识别和语音合成技术研究的基础.由于维吾尔语文字与语音特征、维吾尔语语音语料库的建立、管理、使用之工作不仅工作量巨大,且具有一定的复杂性,这就不得不开发维吾尔语语音数据库管理软件.本文首先研究维吾尔语语音语料库的设计过程,包括语音文本的设计、语音录制、语音库的标注、并在此基础上论述维吾尔语语音语料管理软件的总体功能设计以及部分关键技术的实现方法.  相似文献   

12.
业务流程访问控制机制是组合Web服务应用中的难点,现有的访问控制模型忽视了流程活动之间动态交互性和协同性的特点,不能适应业务流程权限的动态管理.本文提出一种使用控制支持的组合Web服务业务流程动态访问控制模型WS-BPUCON,模型通过角色和权限的分离解除了组织模型和业务流程模型的耦合关系,能够根据分布式开放网络环境中的属性信息,基于授权、职责和条件三种约束决定策略来检查访问控制决策,具有上下文感知、细粒度访问管理等特性,给出了WS-BPUCON的实施框架.  相似文献   

13.
文本情绪原因识别是情感分析中一个新的研究方向,旨在从文本中自动检测出导致某一情绪产生的原因。针对循环神经网络在长文中出现的长期依赖问题,本文提出了一种基于注意力机制和双向长短时记忆(attention model and bi-directional long short-term memory,AM-BiLSTM)神经网络模型的情绪原因识别方法。该方法采用字符向量表示文本语义信息,使用BiLSTM模型提取文本特征,该过程结合了人工提取的子句特征,在训练模型时,引入了注意力机制来优化模型性能,使用softmax对子句进行分类。实验结果表明本文方法对情绪原因的识别是有效的。  相似文献   

14.
时序知识图谱的嵌入表示是知识工程领域的研究热点之一,现有的时序嵌入模型大多通过不同的方式将时间信息融入静态嵌入模型中,以此学习实体和关系的时间演化过程,但是难以挖掘和学习细粒度的时序关联信息。因此本文在之前研究的基础上,提出一种在复数空间下上下文时序关联的时序图谱嵌入表示模型,将细粒度时序信息细分为知识开始时间的相关性和知识时间间隔的一致性。设计了一种上下文感知时序关联信息挖掘方法,筛选语义相似的上下文四元组,挖掘训练四元组中包含的时间信息与上下文四元组时序关联信息,增强嵌入模型对于细粒度时序信息的学习。将本文方法与已有的方法在两个公开的时序知识图谱数据集YAGO11k和Wikidata12k上进行了实验。实验结果表明,对于MRR(mean reciprocal rank)和Hits@k(k=1,3,10)指标,本文方法与已有方法相比都有一定的提升。  相似文献   

15.
在发音错误检错系统中,将传统语音识别系统中的最大似然估计准则和最小音素错误准则应用于声学模型训练通常不能获得F1值指标意义下的最佳性能.本文在对最大似然准则以及最小音素错误准则参数更新公式进行分析的基础上,提出了最大化F1值函数的区分性训练准则,并利用构造弱意义辅助函数的方法对声学模型参数进行优化.通过比较,发现最大化F1值函数的区分性训练准则能够有效地增大训练和测试数据检错的F1值,同时训练数据和测试数据上的精确度、召回率都有明显改进.  相似文献   

16.
蛋白质折叠的识别是一种不依赖于序列相似性的蛋白质结构研究方法.本文将相关向量机应用于蛋白质折叠的识别,将两类相关向量机推广到多分类情况,对多类蛋白质折叠进行识别.与支持向量机相比较,相关向量机无需调整多余的参数,核函数不需要满足mercer条件,实际数据集上的测试结果表明,相关向量机可以得到更加稀疏的模型,在交叉检验中获得了更高的精度,表明相关向量机是一种有效的识别蛋白质折叠的方法.  相似文献   

17.
根据表情与人脸表情特征关系,提出采用隐马尔可夫模型进行人脸表情识别;又鉴于人脸图像二维特性,提出了更具健壮性、更易处理二维数据的扩展型隐马尔可夫模型.该模型相比伪二维隐马尔可夫模型,简化了复杂度.为提高模型的识别效率,根据敏感度不一,提出多重感兴趣区域替代单一的感兴趣区域.为提高表情子库内样本的聚合度及库间样本离散度,提出相应的改进方案.首先通过人脸检测,实现表情样本采集;然后采用二维离散余弦实现图像频域转化,并结合低频数据生成特征向量;最后采用扩展型隐马尔可夫模型进行表情建模,实现表情训练与识别.实验表明:采用扩展型隐马尔可夫模型可有效识别表情,尤其是优化后的设计方案.  相似文献   

18.
本文根据现有的维吾尔文语音识别语音库的不足,以自然口语为对象研究维吾尔语的语音特征,提出了适合该语言的电话语音语料库设计方案,其中包括了维吾尔语电话语音库的文本设计、发音人的选择、语音录制、语音库的标注和后期处理方法等.本文从构建的350个说话人的维吾尔语电话语音语料库中挑选50个目标人提供给基于GMM-UBM/SVM的维吾尔语电话信道说话人识别的研究.  相似文献   

19.
语音识别是通过对说话人语音信号的分析和提取.自动确定说话人是否在所登记的说话人集合中,以及说话的人是谁的过程.本文提出了一种基于特征提取技术的模板匹配语音识别算法.该算法中,采用与文本有关(主要用于时域分析)和与文本无关(主要用于频域分析)相结合的三种识别方法:快速傅立叶变换(FFT)、平均过零率分析(RBZ)和高斯混合模型(GMM),最后通过三种方法的加权平均来生成判决门限值.通过比较门限值误差的大小,根据“最大似然准则”给出待识别语音的身份.  相似文献   

20.
神经网络是工业尾气检测系统的一个重要组成部分. 为提高神经网络的预测精度和收敛速度, 建立k-means-RBF集成神经网络模型. 首先, 通过选取不同的径向基函数神经网络参数, 得到一组RBF神经网络; 然后, 利用k-means算法对生成的RBF神经网络进行聚类, 并筛选出各类中精度较高的神经网络; 最后, 通过简单平均法对筛选出的神经网络进行集成, 得到高性能的k-means-RBF集成神经网络模型. 为验证模型有效性, 搭建基于k-means-RBF集成神经网络模型的工业尾气检测系统进行验证. 结果表明, 与粒子群算法优化后的Back Propagation (PSO-BP)神经网络模型相比, k-means-RBF集成神经网络模型的平均预测精度提高78.27%, 收敛时间节省99.65%  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号