首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
介绍BP神经网络与多分类支持向量机等分类模型的基本原理,并基于这两种方法对水质识别与分类的准确度进行实例比较研究,随机抽取了南昌市内2010-2013年水域水质的300组数据为样本,选取了pH,氨氮,Cl-,SO2-3,总硬度,硝酸盐氮为评价的主要特征。通过把训练后的模型在测试集中进行的检验对得到的模型进行评估,表明了BP神经网络和多分类支持向量机均可以较好地解决水质识别与分类过程中存在的复杂性,多变量,非线性等问题,相比较而言多分类支持向量机有较强的鲁棒性,预测结果更为精确稳定,将其应用到水质评价中具有一定的可行性。更多还原  相似文献   

2.
近年来,文本方面级的细粒度情感分析受到了越来越多的重视,并且在医疗文本方面的作用也越来越大。与粗粒度情感分析相比,细粒度情感分析可以区分医疗文本的每个具体方面词,并且可以得到每个方面词所表达的情感信息。方面级情感分析任务需要考虑方面词和情感词之间的交互,而医疗文本既可作为方面词,又可作为情感词。因此,提出了一个包含上下文位置潜在信息的方面级情感分析模型,实现对于医疗文本信息的情感分析。医疗文本中与特定方面词情感极性判断相关的上下文词一般位于该方面词的附近,而且由于医疗方面词的上下文的词数量存在差异,可能会导致词嵌入向量表示的属性变化,使得方面词的相对位置会有所不同。因此,提出了一种新的上下文位置调整函数,通过调整上下文词在不同位置的权重,增强与指定方面词相关的情感极性词的针对性,减轻方面词两侧词数差异对情感极性判断的干扰。同时,为了将包含特定方面的情感信息的方面词以向量表示,引入了一个线性条件随机场模型辅助建立方面词向量表示的模型。最终,使用焦点损失函数来训练模型参数,处理医疗文本中的情感分析的类不平衡问题。  相似文献   

3.
面向知识图谱的表示学习在低维语义空间中对实体和关系进行编码,提升了知识理解和推理能力。传统的平移模型在处理知识图谱中的一对多、多对一以及多对多这些复杂关系时,难以区分在某一属性具有相同语义的实体。本文构建了一种基于二值可信向量的平移模型(TransV),通过向量不同维度的元素值控制对应属性的激活与抑制程度,使不同的关系关注不同的实体属性信息,提高模型处理复杂关系的效果。除了知识图谱中的三元组信息,非结构化文本中包含了丰富的语义信息,能够提高实体表达能力。利用与实体相关的文本信息,构建了一种融合上下文信息的基于二值可信向量的知识图谱表示学习模型(CKRV),使得三元组信息与语义信息能相互影响、相互融合。实验结果表明,该方法复杂度更低,在实体预测准确性方面有明显提升。  相似文献   

4.
文本情绪原因识别是情感分析中一个新的研究方向,旨在从文本中自动检测出导致某一情绪产生的原因。针对循环神经网络在长文中出现的长期依赖问题,本文提出了一种基于注意力机制和双向长短时记忆(attention model and bi-directional long short-term memory,AM-BiLSTM)神经网络模型的情绪原因识别方法。该方法采用字符向量表示文本语义信息,使用BiLSTM模型提取文本特征,该过程结合了人工提取的子句特征,在训练模型时,引入了注意力机制来优化模型性能,使用softmax对子句进行分类。实验结果表明本文方法对情绪原因的识别是有效的。  相似文献   

5.
研究了临床指南事件及事件关系的提取,提出了基于句法分析的事件信息抽取方法.通过分析临床指南语料库,总结出临床指南事件及关系模型;将临床指南数据进行句法分析,根据事件触发词来匹配事件与事件关系模型;将抽取出的事件信息进行优化处理,得到最终结果.通过具体临床指南数据对方法进行评估,获得了较好的准确率与召回率,验证了该方法的可行性与有效性.  相似文献   

6.
将集对论中表示确定性与不确定性的量即联系数引入图像检索中,把图像象素分为三类:主色集(同类)、边界颜色集(异类)、噪声颜色集(反类).继而提出图像的联系数模型,在此模型基础上利用图像的全局形状和局部颜色统计量构成图像联系数向量.采用图像联系数向量作为图像索引,在形状自适应逼近表示方法的基础上,提出了利用特征向量进行图像检索的检索算法.实验结果表明,该算法具有良好的平移、尺度、旋转不变性,证明联系数是一个有效的图像特征.  相似文献   

7.
双语短语对抽取是基于短语的统计机器翻译中短语翻译模型训练的关键步骤,但由于汉维平行语料库规模有限,数据稀疏问题严重.本文提出了一种改进的短语抽取算法,该算法首先考虑词对齐矩阵中一个汉语词对齐到多个维吾尔语词的情况(包括不连续),然后利用Och方法抽取短语对,最后考虑维吾尔语SOV语序结构特点,抽取双语短语.实验表明,该算法能够较准确地且尽可能多地抽取汉维短语对,从而提高翻译模型的质量.  相似文献   

8.
在金融领域的资产定价模型修正过程中,股市的非线性现象往往被选择性忽视,未纳入模型框架,现有模型亦无法刻画因子之间的非线性定价结构。为解决上述问题,引入了机器学习领域中的神经网络模型,以捕获市场组合收益率、市值、账面市值比三因子间的非线性定价结构,并对股票收益率进行预测。将该模型与经典Fama-French三因子模型在样本外拟合优度、多空策略业绩表现上做了对比,结果表明:神经网络模型能精准捕获市场组合收益率、市值、账面市值比3个因子之间的非线性关系,且在样本外拟合优度、多空策略业绩表现上均要优于传统三因子线性定价模型。  相似文献   

9.
在金融领域的资产定价模型修正过程中,股市的非线性现象往往被选择性忽视,未纳入模型框架,现有模型亦无法刻画因子之间的非线性定价结构。为解决上述问题,引入了机器学习领域中的神经网络模型,以捕获市场组合收益率、市值、账面市值比三因子间的非线性定价结构,并对股票收益率进行预测。将该模型与经典Fama-French三因子模型在样本外拟合优度、多空策略业绩表现上做了对比,结果表明:神经网络模型能精准捕获市场组合收益率、市值、账面市值比3个因子之间的非线性关系,且在样本外拟合优度、多空策略业绩表现上均要优于传统三因子线性定价模型。  相似文献   

10.
在分析模糊C均值聚类算法与支持向量机回归的特点后,将二者结合,提出了模糊聚类支持向量机回归(FCM-SVR)算法,对空气中颗粒物浓度PM2.5进行预测.该方法首先利用模糊C均值聚类算法把一个复杂的数据集分成多个群体,再在每个群体上建立支持向量机回归(SVR)模型,然后进行集成,对区域空气的PM2.5浓度进行预测.预测结果分别与自组织竞争神经网络支持向量机回归(SOM-SVR)模型和单一的支持向量机回归(SVR)的结果进行比较.结果表明,FCM-SVR模型的预报准确率高于SOM-SVR模型和SVR模型.  相似文献   

11.
PM2.5小时浓度多为单步预测。为实现PM2.5小时浓度的多步预测,基于“编码器-解码器”的序列-序列预测(Seq2Seq)模型,集合图卷积神经网络提取非欧式空间数据特征的能力以及注意力机制自适应关注特征的能力,提出了融合图卷积神经网络和注意力机制的PM2.5小时浓度多步预测(GCN_Attention_Seq2Seq)模型。并与Seq2Seq模型和使用了图卷积神经网络、未使用注意力机制的GCN_Seq2Seq模型进行了对照,以2015—2016年北京市22个空气质量监测站点的空气质量数据为样本进行实例验证,结果表明,Seq2Seq模型和图卷积神经网络(GCN)可对PM2.5小时浓度数据的时空依赖进行有效建模,注意力机制有助于减缓多步预测中的预测精度衰减,提升PM2.5小时浓度多步预测的精度。GCN_Attention_Seq2Seq模型可有效应用于多种长度的PM2.5浓度预测窗口。  相似文献   

12.
针对新词识别过程中出现大量噪声词和伪新词的问题,提出一种基于生存法则模型的稳定新词识别方法.该方法借鉴自然法则和遗忘定律,分析候选词串在时序分布中的词频变化,通过词串在语言环境中表现的综合竞争力淘汰突发性特征的噪声词以及词义不稳定的伪新词,识别网络短文本中出现的稳定新词.该方法可以保证网络新词的新颖性和稳定性,可为舆情本体新概念的抽取提供基础支持,有助于提高舆情本体概念抽取的准确率和查全率.  相似文献   

13.
基于支持向量机设计了一种产品字符编码识别系统,该系统通过CCD视觉传感器采集图像信息,经过目标提取、字符分割、编码识别过程,最后输出识别结果.其中,识别过程采用支持向量机作为判别函数分类器,该方法能较好的解决小样本、非线性、高维数等实际问题,并且较传统的神经网络识别方法训练速度更快.实验结果表明,该方法识别率高,可以达到98.3%,并且具有较高的实时性.  相似文献   

14.
本文根据信息论、系统论的观点,运用教育学、心理学和管理学的知识,采用调查法,专家法等方法对体育教师的教学能力结构进行了研究,确定了由四个部分二十二个指标 构成的体育教师教学能力结构。在此基础上,采用“改进的对偶比较法”确定各个指 标的权重,再运用模糊教学方法建立了中学体育教师教学能力的二级模糊综合评价模型.并 用该模型对43 名实习生进行实际考察,还将该模型编制成 B ISI C 程序  相似文献   

15.
针对受限玻尔兹曼机(restricted Boltzmann machines,RBM)算法对时序数据预测存在抽取抽象特征向量能力较差和梯度下降能力有限的问题,基于CRBM(conditional restricted Boltzmann machines)算法以及信念网络(deep belief network,DBN)模型,构建了一种非线性的CRBM-DBN深度学习模型,并采用高斯分布处理输入特征值和对比散度抽样,用于预测时序数据.实验以浙江省近岸海域赤潮时序数据作为输入特征值,讨论该模型的深度及参数选取,并与经典的深度学习模型RBM、DAE和浅层学习中的BP神经网络进行对比,实验验证CRBM对于赤潮时序数据的预测拟合度要明显优于其他3种模型,该模型可有效用于赤潮类时序数据的趋势性预测.  相似文献   

16.
为了解决扩展高斯图像在三维模型特征表示上的缺陷,提出了一种多层多分辨率的三维模型特征描述方法.首先用法向主成分分析法对三维模型进行姿态校正,使得三维模型具有平移、缩放、旋转的不变性,然后将三维模型映射到多个扩展高斯球面上,统计各个高斯球面网格上的法向面积分布,并对该分布作球面调和分析得到三维模型的特征描述向量.实验结果表明该办法查全-查准率均好于基于射线的球面映射方法(radialized spheri-cal extent function,REXT),特征描述向量的维数仪为REXT的26.5%.  相似文献   

17.
从非结构化文本中抽取实体关系是构建知识图谱流程中的重要一环,然而在解决中文文本的关系重叠与实体嵌套问题方面,已有的研究成果却很少,并且领域内基于联合学习的抽取方法大多无法识别实体类型。针对这些问题提出了一种基于指针级联标注策略的中文实体关系联合抽取模型。模型采用以实体类型作为区分的指针标注策略来解决实体嵌套与预测实体类型的问题,并以关系模型作为函数,将句子中的头实体映射到尾实体以解决关系重叠问题。实验结果表明,该模型在两种不同领域的中文数据集上表现突出,F1值分别为81.1%,58.4%。利用此模型抽取的实体关系元组可以直接导入图数据库,极大地简化了从非结构化数据源构建知识图谱的流程。  相似文献   

18.
权重向量的确定是有序加权平均(ordered weighted aweraging,OWA)算子理论中的一个关键问题,目前已有不少获取权重向量的模型。2010年EMROUZNEJAD 和AMIN两位专家在计算OWA算子权重向量时提出了改进最小最大不一致模型:对于给定的orness测度建立一个最小最大目标规划问题,求解该模型可以得到最优权重向量。但由该方法得到的最优解并不唯一,且存在无穷多解,因此,该模型存在不可靠性。本文通过引理给出定理,证明了其最优解的不唯一性,并用简单有效的数值例子予以说明。  相似文献   

19.
权重向量的确定是有序加权平均(ordered weighted aweraging,OWA)算子理论中的一个关键问题,目前已有不少获取权重向量的模型。2010年EMROUZNEJAD 和AMIN两位专家在计算OWA算子权重向量时提出了改进最小最大不一致模型:对于给定的orness测度建立一个最小最大目标规划问题,求解该模型可以得到最优权重向量。但由该方法得到的最优解并不唯一,且存在无穷多解,因此,该模型存在不可靠性。本文通过引理给出定理,证明了其最优解的不唯一性,并用简单有效的数值例子予以说明。  相似文献   

20.
作文智能评分和评语智能生成能极大减轻评阅专家的工作量、节约人力成本。目前,评分和评语结果的准确性与公平性尚不高。近年来,机器学习和自然语言处理等技术的快速发展,在一定程度上提升了文本分类、机器翻译等任务的性能,但仍有许多新的研究成果尚未应用于作文智能评价。本研究综合了词向量(word2vec)、段落向量(paragraph2vec)、词性向量(pos2vec)和LDA (latent dirichlet allocation)等特征,共同组合为作文的语义表示向量;采用基于kNN (k nearest neighbors)算法的语义相似度模型,得到作文的评语标签;采用基于XGBoost(extreme gradient boosting)的回归模型计算英语作文的评分值;并以900篇大学生英语作文为样本,构造算例进行验证。最后表明,提出的智能评价框架在英语作文自动评分和评语生成的准确性上,都要高于传统方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号