首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
中文时间信息的TIMEX2自动标注   总被引:5,自引:0,他引:5  
为了完善中文时间信息标注规范,实现中文时间短语的自动标注,该文研究并修改国际通用的时间短语标注规范TIMEX2的中文标注草案,以此为基础开发一个基于正则表达式的中文TIMEX2自动标注系统(CTAT).该系统采用3层候选确定参考时间,并行使用多个模块识别输入句子中的时间短语,通过排序冲突消解确定最终结果.经测试,该系统识别时间短语和将时间信息值解析为标准格式的F-measure分别达到了90.15%和83.27%, 与其他语言同类系统性能相当.应用该系统标注的语料,为时间信息处理方面的后续研究提供了重要资源.  相似文献   

2.
提出了一种基于Vague融合的自动图像标注方法,通过有效区域匹配方式,利用近邻语义信息来平衡正负样本数目,并且首次利用Vague集的真假隶属度融合图像的区域信息,从而获得更准确的标注结果.实验结果表明,该标注方法是可行的,同时,与传统的标注方法相比,标注结果得到了明显的提高.  相似文献   

3.
论述了AutoCAD为图形支持软件,实现零件图中视图、剖视图、剖面图的自标注;局部放大图自动形成的程序设计方法。  相似文献   

4.
本文论述了以微机辅助绘图软件AutoCAD为图形支撑软件实现机械图尺寸公差自动标注和尺寸标注的程序设计方法。用这种方法设计的程序面向用户,标注参数易于控制,使尺寸公差自动标注成为可能。  相似文献   

5.
从重视专利信息的全面检索、利用专利创新提高企业竞争力、利用全面检索解决专利侵权无效诉讼等方面,阐述了专利信息对企业发展的重要作用。  相似文献   

6.
介绍了一种电气系统CAD中,采用人工智能技术自动标注原理图上线号的方法。该方法不仅可以准确地标注原理图上的全部线号,而且可以自动将图上元件对应的线号提取出来,从而提高电气系统设计和速度和准确性。  相似文献   

7.
动词与动词搭配类型的自动标注方法   总被引:1,自引:0,他引:1  
自动句法分析是中信息处理的重要环节,而在自动句法分析中,词语搭配关系的分析是关键.动词是汉语中常见的一种词性,所以动词搭配关系的确定便显得尤为重要.本在统计了动词-动词搭配中各关系类型的分布特征以及搭配词语的位置分布特征的基础上,运用统计模型、搭配类型标注规则,识别语料中的动词-动词搭配类型.  相似文献   

8.
论述了以AutoCAD为图形支持软件,实现焊缝代号自动标注的程序设计方法。它可方便地对焊接件图进行标注。  相似文献   

9.
张犁朦  孙靓 《安徽科技》2010,(10):31-33
本文针对专利申请及受理量大幅度攀升的同时,相关查新捡索单位接待的专利查新委托量却相对减少的现象,分析了问题存在的原因;并将专利查新分为专利性查新检索、专利管理查新检索、专利侵权查新检索和专利法律状态查新检索等不同类型,对其方法和功能进行探讨。  相似文献   

10.
本文分析了目前国家知识产权的发展现状,企业对知识产权的运用、保护、管理服务以及对专利信息数据库扩展建设的迫切需求。以企业为研究对象,通过专利信息资源系统在全国企业的推行使用,提出了如何构建资源汇集、开放共享的专利信息应用服务平台,以此加强专利信息向企业的宣传与推广应用,并激发企业应用专利信息创新创造的内生动力。  相似文献   

11.
提出了结合主动学习和自动标注的评价对象抽取方法。具体实现过程中,首先,利用少量的已标注样本训练分类器,对非标注样本进行测试,获取自动标注结果及其置信度:其次,通过置信度计算每个样本的整体置信度,挑选出低置信度即不确定性高的样本待标注:最后,对待标注样本中置信度低的词语进行人工标注,而置信度高的部分则采用自动标注结果。实验表明,该方法可以在确保抽取性能的同时有效地减小人工标注语料的开销。  相似文献   

12.
如何有效地挖掘变量与标签之间的相互关系和处理高维数据是自动图像标注的两个具有挑战性的问题。以往的自动图像标注都是基于向量模式的学习算法,这样一方面产生高维数据,另一方面破坏了图像数据的高阶结构和内在相关性,导致信息丢失。向量模式下的罚偏最小二乘算法(penalized partial least square,PPLS)可以在获取变量和标签相关性的同时,进行维度约简。在PPLS的基础上,提出基于张量罚偏最小二乘算法(tensor-PPLS)。首先构造图像的张量数据形式,然后采用多线性主成分分析(MPCA)进行降维预处理,最后用tensor-PPLS进行图像标注。在图像标注的三个标准数据集上,提出的算法标注结果明显优于传统的基于向量模式的学习算法。  相似文献   

13.
Automatic image annotation (AIA) has become an important and challenging problem in com- puter vision due to the existence of semantic gap. In this paper, a novel support vector machine with mixture of kernels (SVM-MK) for automatic image annotation is proposed. On one hand, the com- bined global and local block-based image features are extracted in order to reflect the intrinsic con- tent of images as complete as possible. On the other hand, SVM-MK is constructed to shoot for bet- ter annotating performance. Experimental results on Corel dataset show that the proposed image fea- ture representation method as well as automatic image annotation classifier, SVM-MK, can achieve higher annotating accuracy than SVM with any single kernel and mi-SVM for semantic image annota- tion.  相似文献   

14.
A novel image auto-annotation method is presented based on probabilistic latent semantic analysis (PLSA) model and multiple Markov random fields (MRF).A PLSA model with asymmetric modalities is first constructed to estimate the joint probability between images and semantic concepts,then a subgraph is extracted served as the corresponding structure of Markov random fields and inference over it is performed by the iterative conditional modes so as to capture the final annotation for the image.The novelty of our method mainly lies in two aspects:exploiting PLSA to estimate the joint probability between images and semantic concepts as well as multiple MRF to further explore the semantic context among keywords for accurate image annotation.To demonstrate the effectiveness of this approach,an experiment on the Corel5k dataset is conducted and its results are compared favorably with the current state-of-the-art approaches.  相似文献   

15.
知识表达在智能数据处理中占有十分重要的地位。本文主要讨论知识处理框架中的知识表达方法,首先介绍用数据表描述的知识表达系统及形式化定义,然后给出知识表达系统中属性的重要性概念。在文中我们还根据粗集理论讨论了决策理论中的一些基本问题和决策表简化的方法,介绍决策表的形式化定义和一些性质。  相似文献   

16.
In recent years, multimedia annotation problem has been attracting significant research attention in multimedia and computer vision areas, especially for automatic image annotation, whose purpose is to provide an efficient and effective searching environment for users to query their images more easily.In this paper, a semi-supervised learning based probabilistic latent semantic analysis ( PL-SA) model for automatic image annotation is presenred.Since it' s often hard to obtain or create la-beled images in large quantities while unlabeled ones are easier to collect, a transductive support vector machine ( TSVM) is exploited to enhance the quality of the training image data.Then, differ-ent image features with different magnitudes will result in different performance for automatic image annotation.To this end, a Gaussian normalization method is utilized to normalize different features extracted from effective image regions segmented by the normalized cuts algorithm so as to reserve the intrinsic content of images as complete as possible.Finally, a PLSA model with asymmetric mo-dalities is constructed based on the expectation maximization( EM) algorithm to predict a candidate set of annotations with confidence scores.Extensive experiments on the general-purpose Corel5k dataset demonstrate that the proposed model can significantly improve performance of traditional PL-SA for the task of automatic image annotation.  相似文献   

17.
信息集成若干方法的比较   总被引:5,自引:0,他引:5  
介绍并比较了TSIMMIS,IM,SIMS等系统采用的方法,同时也介绍信息集成中的知识表示方法,最后提出了改进方法。  相似文献   

18.
针对医学文本缺乏可量化数据结构,基于关键词模型的文本处理方法不适用的问题,在研究词之间潜在语义关联和关键词树结构的基础上,构造了一种基于潜在语义树的语义分析模型用于医学文本的数据挖掘。进一步地将隐含主题与潜在语义的研究相关联,设计出一种基于潜在狄利克雷分配和潜在语义树模型的文本处理方法,可针对不同类型的医学文本生成有一定可读性的自动批注。该方法形成的自动批注主观性低,其准确度和可读性均高于关键词模型的处理结果,可辅助医生进行医学文本的批注和分类,从而减轻其工作量。程序结果表明,该方法目前可应用于对医学图像所见形成诊断意见、对病人病历进行摘要形成和对病症描述给出对症处方等方面,批注的语义匹配度可达67.7%,文本的平均可读性为60.02%。  相似文献   

19.
基于技术创新理论快速提升我国建筑业的生产效率,降低成本,是我国目前大规模建设的迫切需求.然而与其他国家和地区相比,我国建筑领域技术创新规律的系统研究还处于起步阶段.文章以建筑脚手架类专利为研究对象,通过查阅我国的专利数据库,收集88份具有代表性的脚手架专利,基于TRIZ理论中的技术矛盾矩阵,通过深入分析每份专利申请书,...  相似文献   

20.
将现有W eb提升为语义W eb的有效方法之一就是标注W eb页。当前W eb上,动态生成页面的规模有静态页面的500倍之多,标注从数据库动态生成的页面是深度标注方法之一。针对数据库生成的W eb页面具有模板和结构化的特征,在对带模板的结构化HTM L文档和本体形式化表示之后,提出了两段式的深度标注框架,即第一阶段解析HTM L文档,抽取结构化信息,第二阶段指定实例与词汇间的映射,标注自动生成。与其他标注方法相比,该方法能明显降低标注过程的工作量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号