首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 219 毫秒
1.
基于物元可拓性的潜信息挖掘   总被引:3,自引:1,他引:2  
潜信息挖掘是数据挖掘的核心内容 .本文应用可拓论 ,提出了基于物元可拓性的潜信息挖掘方法 ,探讨了潜信息挖掘的发散性方法 ,相关性方法和蕴含性方法 ,这些方法与现有的数据挖掘方法相兼容 ,相互补充 ,相得益彰 .  相似文献   

2.
CPI指数变换对产品销售影响的可拓数据挖掘   总被引:2,自引:0,他引:2  
目前对数据挖掘的研究主要集中在对静态数据的挖掘,而在实际工作中,经常要处理的矛盾问题,需要通过可拓变换和可拓变换的运算来解决,这就需要用到变换的知识,需要运用动态数据挖掘或可拓数据挖掘来解决问题.运用可拓逻辑和可拓数据挖掘的理论知识,根据国家消费者物价指数的变换对产品销售数据的影响来研究可拓数据挖掘中传导知识的挖掘,为企业的决策者在目前的市场环境下提出更加合理的销售策略提供依据.  相似文献   

3.
微生物组学大数据在生态环境、人类健康和疾病研究方面都起到了重要作用。通过数学、统计等数据挖掘方法,从高维复杂数据中提取有用信息,是微生物组学大数据建模和分析的关键问题。本文分析了微生物组学大数据的特点,对当前数据分析和计算研究中存在的热点和难点进行了探讨分析,并综述了当前微生物组学大数据模式挖掘、网络重建与分析的研究概况。  相似文献   

4.
微生物组学大数据在生态环境、人类健康和疾病研究方面都起到了重要作用。通过数学、统计等数据挖掘方法,从高维复杂数据中提取有用信息,是微生物组学大数据建模和分析的关键问题。本文分析了微生物组学大数据的特点,对当前数据分析和计算研究中存在的热点和难点进行了探讨分析,并综述了当前微生物组学大数据模式挖掘、网络重建与分析的研究概况。  相似文献   

5.
数据挖掘过程中连续属性离散化新方法研究   总被引:2,自引:0,他引:2  
在知识发现和机器学习领域里,许多数据挖掘方法如基于粗集的数据挖掘工具等需要使用离散的属性值,但实际观测到的大多是连续性属性数据,这对许多新型数据挖掘工具的研究带来了不便.本文针对以上问题,在综合分析目前连续属性离散化方法的基础上,提出了一种基于数据分布特征的连续属性离散化新方法,并用经典算例验证了此算法,实验结果表明该方法具有合理性和可行性.  相似文献   

6.
高维大数据的相似性计算是数据挖掘领域的研究重点,论文通过分析高维大数据相似性计算的难点,提出采用可拓学的方法解决其中矛盾问题的研究思路。在基元表示高维大数据的基础上,借助数据转换、数据筛选、权重的确定、数据预处理等技术实现了数据之间的相似性计算,并基于水污染常规分析数据进行了算法验证。论文借助可拓的思想研究大数据相似性的问题,不仅对数据挖掘的研究有一定的理论促进,同时也为可拓学的研究提供了新的应用空间。  相似文献   

7.
Data mining aims to find patterns in organizational databases. However, most techniques in mining do not consider knowledge of the quality of the database. In this work, we show how to incorporate into classification mining recent advances in the data quality field that view a database as the product of an imprecise manufacturing process where the flaws/defects are captured in quality matrices. We develop a general purpose method of incorporating data quality matrices into the data mining classification task. Our work differs from existing data preparation techniques since while other approaches detect and fix errors to ensure consistency with the entire data set our work makes use of the apriori knowledge of how the data is produced/manufactured.  相似文献   

8.
粗糙集理论作为一种智能数据分析和数据挖掘的新的数学工具,其主要优点在于它不需要任何关于被处理数据的先验或额外知识.提出了一种基于粗糙集理论的智能数据分析模型,从目标数据集出发,通过数据预处理、数据分类和规则获取,实现对原始数据集的智能分析,并通过实例测试验证了该模型的有效性.  相似文献   

9.
In this work, we propose a hybridization of GRASP metaheuristic that incorporates a data mining process. We believe that patterns obtained from a set of sub-optimal solutions, by using data mining techniques, can be used to guide the search for better solutions in metaheuristics procedures. In this hybrid GRASP proposal, after executing a significant number of GRASP iterations, the data mining process extracts patterns from an elite set of solutions which will guide the following iterations. To validate this proposal we have worked on the Set Packing Problem as a case study. Computational experiments, comparing traditional GRASP and different hybrid approaches, show that employing frequent patterns mined from an elite set of solutions conducted to better results. Besides, additional performed experiments evidence that data mining strategies accelerate the process of finding good solutions. ★★Work sponsored by CNPq research grants 300879/00-8 and 475124/03-0. Work sponsored by CNPq research grant 475124/03-0.  相似文献   

10.
本文通过不确定性推理的分析,提出了模糊关联的概念,用模糊概念表示事务数据之间的关联关系,研究了模糊关联的性质,给出了模糊关联产生式的发掘算法及应用的实例.  相似文献   

11.
数据驱动的决策支持系统概念及内涵   总被引:1,自引:0,他引:1  
从数据的观点出发,讨论了数据驱动的决策支持系统的概念及其内涵,对数据仓库、联机分析处理和数据挖掘等手段也进行了一定程度的讨论。另外,还对DSS数据和日常操作数据进行了分析,并给出了数据驱动的决策支持系统的基本结构。  相似文献   

12.
数据挖掘是近年来国际上智能信息处理和决策支持分析领域的最前沿的研究方向之一.本文综合介绍了数据挖掘的主要概念和新技术,并展示了其丰富的应用领域.  相似文献   

13.
移动电话客户流失数据挖掘   总被引:12,自引:0,他引:12  
本文首先回顾了顾客流失的相关文献,然后利用统计分析方法和数据挖掘技术分析了移动电话号码与移动电话型号对客户流失的影响,对分析结果进行了解释,并给出一些营销建议。  相似文献   

14.
Computational complexity of multiscale methods based on the first‐principles energetics is analyzed. Computational cost of such methods is dominated by expensive first‐principles determination of structural energies and atomic forces, including structural relaxations. Information integration is an opportunity to eliminate recalculation of known data, and, consequently, to reduce the total cost of multiscale calculations. We propose the Structural Database as a universal tool for structural data integration, and explain its conceptual design and functionality, including data mining options. To exemplify benefits provided by the Structural Database, we consider search for new ground states, construction of a phase diagram for a bulk material, and prediction of surface patterning. We show that the Structural Database is a powerful tool for information integration and data mining, which can greatly reduce the cost of multiscale computations and materials design. © 2006 Wiley Periodicals, Inc. Complexity 11: 36–42, 2006  相似文献   

15.
可拓数据挖掘研究进展   总被引:3,自引:1,他引:2  
可拓学研究用形式化模型解决矛盾问题的理论与方法,可拓数据挖掘是可拓学和数据挖掘结合的产物,它探讨利用可拓学方法和数据挖掘技术,去挖掘数据库中与可拓变换有关的知识,包括可拓分类知识、传导知识等可拓知识.随着经济全球化的推进,环境的多变促使了信息和知识的更新周期缩短,创新和解决矛盾问题越来越成为各行各业的重要工作.因此,如何挖掘可拓知识就成为数据挖掘研究的重要任务.研究表明,可拓数据挖掘将具有广阔的应用前景.将介绍可拓数据挖掘的集合论基础、基本知识和目前研究的主要内容,并提出今后需要进一步探讨的问题及其发展前景.  相似文献   

16.
本文提出了数据挖掘中求解聚类中心问题的一种新方法.这类问题属于非凸非光滑全局最优化问题.我们首先利用光滑化方法将非光滑聚类函数用光滑函数逼近,然后对光滑化问题利用填充函数搜索其全局最优点.对不同数据库的数值试验表明,本文提出的算法是可行和有效的.  相似文献   

17.
DEA与数据挖掘   总被引:1,自引:1,他引:0  
使用Wei和Yan给出的凸多面体的"和形式"与"交形式"相互转化的方法,得到"交形式"的生产可能集TWY,以及由此判别相对效率的方法,研究DEA用于数据挖掘,处理具有"海量"决策单元的相对效率评价(包括技术有效性和规模收益递增、不变、递减以及"拥挤"迹象).给出的方法只需使用一个"交形式"的生产可能集,与本作者先前的"DEA评测机"相比,可以节省很多计算量.方法是对DEA评测机的一种新的改进,是对数据挖掘领域的一个补充.  相似文献   

18.
图论、最优化理论显然在蛋白质结构的研究中大有用场. 首先, 调查/回顾了研究蛋白质结构的所有图论模型. 其后, 建立了一个图论模型: 让蛋白质的侧链来作为图的顶点, 应用图论的诸如团、 $k$-团、 社群、 枢纽、聚类等概念来建立图的边. 然后, 应用数学最优化的现代摩登数据挖掘算法/方法来分析水牛普里昂蛋白结构的大数据. 成功与令人耳目一新的数值结果将展示给朋友们.  相似文献   

19.
Denoising analysis imposes new challenge for mining high-frequency financial data due to its irregularities and roughness. Inefficient decomposition of the systematic pattern (the trend) and noises of high-frequency data will lead to erroneous conclusion as the irregularities and roughness of the data make the application of traditional methods difficult. In this paper, we propose the local linear scaling approximation (in short, LLSA) algorithm, a new nonlinear filtering algorithm based on the linear maximal overlap discrete wavelet transform (MODWT) to decompose the systematic pattern and noises. We show several unique properties of this brand-new algorithm, that are, the local linearity, computational complexity, and consistency. We conduct a simulation study to confirm these properties we have analytically shown and compare the performance of LLSA with MODWT. We then apply our new algorithm with the real high-frequency data from German equity market to investigate its implementation in forecasting. We show the superior performance of LLSA and conclude that it can be applied with flexible settings and suitable for high-frequency data mining.  相似文献   

20.
加权线性支持向量分类机是数据挖掘的新方法.它对应于一个优化问题.针对加权线性支持向量分类机优化问题建立了数据扰动分析理论方法.具体地针对加权线性支持向量分类机的原始问题建立了数据扰动分析基本定理,定理可以得到加权线性支持向量分类机问题的解及决策函数对数据参数的偏导数,同时可以定量分析输入数据的误差以及数据各种变化对其解以及决策函数值的定量影响,可以回答加权线性支持向量分类机问题的稳定性问题和灵敏度分析问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号