首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 33 毫秒
1.
文本聚类作为一种自动化程度较高的无监督机器学习方法,能够实现对文本信息的有效组织、摘要和导航,近年来已经广泛应用在信息检索领域。笔者针对使用向量空间模型进行聚类时对于同义词和多义词的处理存在的缺陷,提出了基于本体的文本聚类模型。首先使用WordNet词典对文档中的词进行语义标注,得到文档的概念集合;然后对每个文档的概念集合进行概念聚类,生成文档的概念主题;最后通过计算主题的相似度完成文本聚类。该模型减少了相似度计算量,改善了聚类结果和聚类性能。  相似文献   

2.
基于聚类分析法的本体构造方法   总被引:4,自引:0,他引:4  
根据聚类分析法的特点,提出基于聚类分析法的本体构造方法.首先根据类的相关属性构造了一个数据矩阵,并利用矩阵中的值计算新生成的类和未合并类之间的绝对值距离,然后根据距离的大小对类进行合并,并产生新的类.用同样的方法计算新生成的类和未合并类之间的绝对值距离,直到得出最顶层的类为止.并以酒本体的构造为例来具体说明该方法.  相似文献   

3.
针对现有本体映射过程中相似度计算方法的精度及效率的不足,提出一种新的综合概念相似度算法模型,该算法分别对本体概念的名称、属性和实例相似度进行计算,过程中融合了信息增益和聚类集方法,并最终对三种相似度量结果加权综合。实验表明,算法得出的概念相似度计算结果在合理性和准确率上都有所提高。  相似文献   

4.
数字图书馆个性化服务用户模型研究   总被引:32,自引:0,他引:32  
提出了一种数字图书馆个性化服务用户模型构架,并对实现过程中的几个关键问题,包括用户模型表示方法,用户模型的建立以及更新算法进行了详细论述.提出了基于本体论的空间向量用户模型表示方法,建立了简单的数字图书馆领域本体,以空间向量表示用户模型,以本体概念作为向量的特征项;采用支持向量机分类算法和无监督聚类算法相结合提取用户兴趣;在用户模型更新方法上,采用渐进遗忘和滑动窗口相结合的方法实现用户兴趣概念的漂移.  相似文献   

5.
文本聚类具有数据稀疏性的特点,常见的聚类方法采用基于距离的相异度,为了增强文档的区分特征,提出一种基于非对称相似度的方法,来度量文档对象之间的关联。定义了文本对象之间的非对称相似度度量。利用文本非对称相似度矩阵的稀疏特性,采用强连通构件的划分方法对文本对象进行聚类分析。并通过迭代的方法形成聚类结果的概念层次。实验结果表明:非对称相似度比距离相异度具有更高的准确率和更少的执行时间,当聚类结果簇数目达到较小时,准确率提高约为20%。  相似文献   

6.
提出一种新的处理n:m映射的方法,该方法将n:m映射问题转化为聚类问题,利用Hownet中的资源使本体中的实体基于语义关系聚合,并重新给出了查全率和查准率的计算公式.使用Hownet及其相关工具对OAEI组织给出的一组本体对进行实验,实验结果表明,该方法对块匹配问题效果较好.  相似文献   

7.
多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,提出了一种结合软约束的实时数据流模糊聚类算法。算法引入2种模糊性软约束来描述微簇距离和密度上的不确定度,通过阈值划分出核心微簇、边界微簇和离群微簇;在类簇边缘使用模糊隶属度,给予微簇分属不同类簇的可能性,保证类簇的完整性并提高聚类效果;使用两阶段的流程结构和2种时间窗口模型,赋予算法具有对可变化数据流的适应能力和更低的时间空间占用率。在多种数据集上的实验表明,该算法相比同类型算法在聚类效果上提升了1%~3%,且平均运行时间缩短5%~20%,在实际硬件平台的测试中也验证了算法的聚类分离性能。  相似文献   

8.
动态模糊ISODATA聚类方法及其在故障诊断中的应用   总被引:2,自引:0,他引:2  
根据故障诊断分类的特点,用变分原理导出了动态聚类的最优解的存在条件,讨论了相应的算法及其收敛性,并在柴油机供油系统故障诊断中的实现故障分类的动态表示,证明了其在故障分类识别中的有效性。  相似文献   

9.
基于粗集理论的数据离散化技术研究   总被引:3,自引:0,他引:3  
信息系统连续型属性值的离散化对决策规则或决策树的学习具有非常重要的意义。它能够提高系统对样本的聚类能力,增强系统抗数据噪音的能力,减少机器学习算法的时间和空间开销,提高其学习精度。粗集是有效的数据离散化工具。对基于粗集理论的数据离散化方法进行了深入研究,分析其特征,评述其研究进展,并通过仿真实验研究了几种典型的启发式离散化算法的性能。其结果对发展新的离散化技术或为特定应用选择合适算法都有参考价值。  相似文献   

10.
从原理和实验2方面对基于MapReduce和Spark的大数据模糊K-均值算法进行分析比较,并对2种大数据开源平台的优缺点进行了总结.由于模糊K-均值算法是一种迭代算法,需要对部分数据进行重复操作以得到最终聚类结果,因此主要从算法执行时间、同步次数、文件数目、容错性能、资源消耗这5方面进行比较,得出的结论对从事大数据研究的人员具有较高的参考价值.  相似文献   

11.
研究构建领域情感本体,显式描述产品与产品部件、产品与产品属性之间的语义关系;设计词性模式匹配方法提取特征词和情感词的固定搭配,并采用评论句的极性标签结合否定词典,逆向推测搭配组合的情感极性,建立特征词与情感词的关联关系;进一步设计本体节点匹配规则进行情感分析,提高对电商网站评论文本情感分析的性能. 实验结果表明,领域情感本体的构建有利于消除情感词的领域依赖性及识别评论中的隐性特征.   相似文献   

12.
提出了一种应用于产品变型设计中的本体筛检方法,该方法以完整的产品资源本体视图为基础,将产品的功能需求、结构特征等转化为需求约束,设计人员根据需求约束对产品资源本体进行筛检。针对不同的筛检层次和筛检对象,给出了模式匹配、实例匹配与人工决策相结合、实例推理自动匹配等筛检规则。这种人机结合的半自动筛检方法提高了产品变型设计方案的准确性,增加了设计过程的柔性和效率。开发了一套针对建筑门窗产品的变型设计支持系统,证明所述方法的可行性和有效性。  相似文献   

13.
基于设计结构矩阵的产品结构模块聚类方法   总被引:4,自引:0,他引:4  
阐述了当前产品结构模块聚类方法中存在的不足,并通过基于设计结构矩阵(DSM)的聚类方法较好地解决了这些不足.给出建立产品结构DSM模型的方法,并基于五点刻度法对产品结构DSM模型进行数字化.在聚类的过程中开发了基于产品结构DSM联系强度的聚类算法和基于联系成本的择优算法.以某摩托车发动机为例进行了实际建模、聚类运算及聚类择优,得出了优化的模块聚类结果.  相似文献   

14.
设计中开发计算理论的一个挑战是必须能支持计算机的有效运用,这一机制允许从设计专家那儿或设计样例中取得产生,累加和转换的设计知识。而其中的一个方法是把机器学习机制综合成基于知识的支持系统,以模拟设计过程初级阶段,使设计成为一个增加和诱导学习的过程。模拟的需要产生于在不同的提取阶段获取,提炼和转移设计知识的需求,从而使得能轻而易举的熟练操作。在设计中,现有的知识产生于过去的设计解决方案,而过去的解决方案提供的反馈信息能更新和提高设计理论知识基础。但是,没有学习接受能力,设计系统不能反映设计家们在这一领域的成长经历,也不能反映设计家们从以往设计案例中提取知识的能力。在此提出了方案设计和效力评价中的三种方法。  相似文献   

15.
概念设计作为产品开发过程中的一个重要环节,实现协同设计有必要对其进行有效的管理,由于在多数概念设计的主要任务是对原有设计事例的修正,因此如何管理和利用原有设计事例,就显得尤为重要,在基于事例的推理思想的基础上,提出了一种支持协同设计的产品概念设计事例管理的系统框架,并讨论了其实现机制。  相似文献   

16.
产品族设计框架及其关键技术研究   总被引:8,自引:1,他引:8  
分析了典型产品的开发过程,以及产品族设计与单一产品设计的主要区别,提出一种适合于大批量定制生产模式的产品族设计框架,并对其中的顾客需求空间、功能原理空间和结构空间进行了形式化描述.采用聚类分析、结构树、功能技术矩阵和产品功能矩阵等分析方法,对相应的关键技术,如顾客需求的表示与聚类、产品族功能空间的表示及其与顾客需求空间的映射、结构空间的表示及其与功能空间的映射等进行了深入研究.该框架为实现产品族设计中的产品族市场定位、提高零部件可重用性和产品族平台规划提供了系统的分析方法,为企业实施产品族设计提供了理论指导.同时,结合实例对提出的相关方法进行了说明.  相似文献   

17.
概念学习是机器学习中的一个主要内容。概念的层次和分类对概念学习系统的构造有重要意义。本文论述了概念分类系统的基本原理,对于概念表达形式到谓词逻辑表示的转换以及概念分类系统中的概念运算作了较详细的介绍。  相似文献   

18.
鉴于细粒度产品特征挖掘的重要性以及现有产品评论研究中对产品特征语义(上下位特征、同义特征)缺失的问题,根据手机产品说明书构建手机产品特征本体,再采用爬虫程序从电子商务网站获取用户评论信息,并对自然评论语言进行分词、词性标注、去重等预处理,利用Apriori算法提取相应的产品特征,结合HowNet词典,将手机产品特征本体进行语义扩展、完善,便于将来进一步准确地从用户角度对产品进行情感分析.  相似文献   

19.
Ontology mapping is the bottleneck ot handhng confilicts among heterogeneous ontologies and of implementing reconfiguration or interoperability of legacy systems. We proposed an ontology mapping method by using machine learning, type constraints and logic mining techniques. This method is able to find concept correspondences through instances and the result is optimized by using an error function; it is able to find attribute correspondence between two equivalent concepts and the mapping accuracy is enhanced by combining together instances learning, type constraints and the logic relations that are imbedded in instances; moreover, it solves the most common kind of categorization conflicts. We thenproposed a merging algorithm to generate the shared ontology and proposed a reconfigurable architecture for interoperation based on multi agents. The legacy systems are encapsulated as information agents to participate in the integration system. Finally we give a simplified case study.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号