首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
可拓数据挖掘研究进展   总被引:3,自引:1,他引:2  
可拓学研究用形式化模型解决矛盾问题的理论与方法,可拓数据挖掘是可拓学和数据挖掘结合的产物,它探讨利用可拓学方法和数据挖掘技术,去挖掘数据库中与可拓变换有关的知识,包括可拓分类知识、传导知识等可拓知识.随着经济全球化的推进,环境的多变促使了信息和知识的更新周期缩短,创新和解决矛盾问题越来越成为各行各业的重要工作.因此,如何挖掘可拓知识就成为数据挖掘研究的重要任务.研究表明,可拓数据挖掘将具有广阔的应用前景.将介绍可拓数据挖掘的集合论基础、基本知识和目前研究的主要内容,并提出今后需要进一步探讨的问题及其发展前景.  相似文献   

2.
可拓建筑形态设计变换数据库是可拓学、数据挖掘的理论和方法在建筑形态设计方面的应用.尝试探讨面向建筑形态设计的可拓变换数据库,论述其概念、类型、实例和作用.以理论概述和实例解析的方法,构建了有效的建筑形态设计数据表达方式,提出了建筑形态数据挖掘工作的前提和基础,为可拓建筑形态设计数据挖掘研究拓展了理论基础.  相似文献   

3.
数据挖掘过程中连续属性离散化新方法研究   总被引:2,自引:0,他引:2  
在知识发现和机器学习领域里,许多数据挖掘方法如基于粗集的数据挖掘工具等需要使用离散的属性值,但实际观测到的大多是连续性属性数据,这对许多新型数据挖掘工具的研究带来了不便.本文针对以上问题,在综合分析目前连续属性离散化方法的基础上,提出了一种基于数据分布特征的连续属性离散化新方法,并用经典算例验证了此算法,实验结果表明该方法具有合理性和可行性.  相似文献   

4.
CPI指数变换对产品销售影响的可拓数据挖掘   总被引:2,自引:0,他引:2  
目前对数据挖掘的研究主要集中在对静态数据的挖掘,而在实际工作中,经常要处理的矛盾问题,需要通过可拓变换和可拓变换的运算来解决,这就需要用到变换的知识,需要运用动态数据挖掘或可拓数据挖掘来解决问题.运用可拓逻辑和可拓数据挖掘的理论知识,根据国家消费者物价指数的变换对产品销售数据的影响来研究可拓数据挖掘中传导知识的挖掘,为企业的决策者在目前的市场环境下提出更加合理的销售策略提供依据.  相似文献   

5.
基于物元可拓性的潜信息挖掘   总被引:3,自引:1,他引:2  
潜信息挖掘是数据挖掘的核心内容 .本文应用可拓论 ,提出了基于物元可拓性的潜信息挖掘方法 ,探讨了潜信息挖掘的发散性方法 ,相关性方法和蕴含性方法 ,这些方法与现有的数据挖掘方法相兼容 ,相互补充 ,相得益彰 .  相似文献   

6.
数据挖掘中统计方法的作用和问题点   总被引:4,自引:0,他引:4  
本文讨论了数据挖掘与统计学间的关系,介绍了在数据挖掘中常用的统计方法和存在的问题。提出了统计怎样适应于数据挖掘的课题。  相似文献   

7.
在介绍数据挖掘的概念、方法以及实证经济学发展的基础上,本文提出应该把数据挖掘的方法技术引入和应用到实证经济分析中去,以促进经济学的现代化、科学化.  相似文献   

8.
一种遗传模糊神经网络数据挖掘算法   总被引:2,自引:0,他引:2  
数据挖掘是近年来信息处理领域出现的新的研究方向。本文探讨了扩展型TS模糊神经网络和遗传算法在数据挖掘中的应用,并提出了一种把模糊神经网络与遗传算法相结合的数据挖掘方法。在该方法中由遗传算法自适应地构造和优化TS模型,TS模型完成预测,这种预测是建立在遗传算法的聚类结果之上的。二者的结合,提高数据挖掘的应用效果。文章最后给出该方法的应用实例。  相似文献   

9.
教学质量的评价指标往往具有模糊性,模糊数据挖掘是一种利用模糊信息进行决策的有效工具.针对高校教师教学特点,构建了合理可行的教学质量满意度评价体系,通过问卷调查收集学生对教师教学质量的满意度评价,共采集了623个有效样本,使用模糊数据挖掘和遗传算法发现评估指标同满意度之间的规则知识,生成了包括11条语意值组合与满意度的模糊规则库,进而归纳出影响教学质量满意度的关键指标,为高校管理者和教师提供决策支持.  相似文献   

10.
"数据挖掘"是数据处理的一个新领域.支持向量机是数据挖掘的一种新方法,该技术在很多领域得到了成功的应用.但是,支持向量机目前还存在许多局限,当支持向量机的训练集中含有模糊信息时,支持向量机将无能为力.为解决一般情况下支持向量机中含有模糊信息(模糊参数)问题,研究了模糊机会约束规划、模糊分类中的模糊特征及其表示方法,建立了模糊支持向量分类机理论,给出了模糊线性可分的模糊支持向量分类机算法.  相似文献   

11.
刘书庆  王怡萍 《运筹与管理》2021,30(11):176-182
为有效解决因产品质量危机事件发生原因揭示不准确而导致应对措施选择与实施不当问题,根据产品质量危机影响因素发掘结果,提取出了产品质量危机事件可能原因,采用故障树法构建了质量危机事件潜在原因关系模型;将故障树法和贝叶斯网络相结合,基于专家调查与模糊集理论,推理出底层原因先验概率算法,并将其先验概率输入贝叶斯网络模型,获得底层原因后验概率及关键重要度,将后验概率及关键重要度共同作为质量危机事件关键原因诊断依据,构建了质量危机事件原因挖掘模型;通过实际案例验证了关键原因挖掘结果的准确性,为企业挖掘质量危机事件发生原因提供了理论依据。  相似文献   

12.
符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。研究应用区间型符号数据的PCA方法来评价股票的市场综合表现问题。首先介绍了符号数据分析的基本理论。接下来研究了区间数据样本的经验描述统计量的计算,并基于经验相关矩阵,给出了区间主成分分析的算法,该算法最终得到区间数表达形式的主成分取值。最后选取上海证券交易市场20支股票在某一周上的交易数据,进行了实证研究,基于区间主成分得分的矩形图表示,将20支股票按其市场综合表现分成了四类。  相似文献   

13.
商品需求预测对于电商企业意义重大,对阿里电商平台的交易数据进行挖掘以获取有效特征,利用特征建立模型对未来两周这些商品的需求进行动态预测,并基于预测结果和成本最小的原则提出分仓规划建议.预测模型选择随机森林做回归,然后在残差分析的基础上建立报童模型求解分仓的库存规划.对特征数量众多的电商交易数据挖掘所建立的模型有助于电商企业进行有效的商品需求预测并据此制定成本更低的分仓规划.  相似文献   

14.
Blind source separation (BSS) is a problem that is often encountered in many applications, such as biomedical signal processing and analysis, speech and image processing, wireless telecommunication systems, data mining, sonar, radar enhancement, etc. One often solves the BSS problem by using the statistical properties of original sources, e.g., non-Gaussianity or time-structure information. Nevertheless, real-life mixtures are likely to contain both non-Gaussianity and time-structure information sources, rendering the algorithms using only one statistical property fail. In this paper, we address the BSS problem when source signals have non-Gaussianity and temporal structure with nonlinear autocorrelation. Based on the two statistical characteristics of sources, we develop an objective function. Maximizing the objective function, we propose a gradient ascent source separation algorithm. Furthermore, We give some mathematical properties for the algorithm. Computer simulations for sources with square temporal autocorrelation and non-Gaussianity illustrate the efficiency of the proposed approach.  相似文献   

15.
为快速、准确地对胎膜早破进行预测,首次应用了一种新型的数据挖掘技术-支持向量机预测模型.该模型针对所获取的胎膜早破及正常破膜数据集100个病例进行建模,并与神经网络、Logistic回归建模的性能进行了比较.结果表明,支持向量机具有可调参数少、学习速度快等优点,计算所得到的结果无论从准确率,还是所获取知识的可理解性等方面,都优于常用的神经网络等方法.用支持向量机方法建立的胎膜早破预测模型合理可行.  相似文献   

16.
针对在重大突发事件应急决策大数据环境下决策者偏好的不确定性及偏离群体一致性导致的风险,提出一种基于UGC大数据挖掘的大群体两阶段风险性应急决策方法。首先,通过数据挖掘和自然语言处理方法从UGC中获取公众对事件的偏好信息并构建应急决策属性体系,利用TF-IDF方法结合专家评估信息确定属性权重;其次,建立一个意见开放式的两阶段决策流程,提出依据决策者意见的可靠度和准确度量化决策风险,利用聚类方法得到相应的成员权重,并使用TOPSIS法对决策方案进行排序。最后通过天津港“8·12”重大爆炸事故的案例分析和对比验证了所提出方法的可行性和有效性。  相似文献   

17.
The credit scoring is a risk evaluation task considered as a critical decision for financial institutions in order to avoid wrong decision that may result in huge amount of losses. Classification models are one of the most widely used groups of data mining approaches that greatly help decision makers and managers to reduce their credit risk of granting credits to customers instead of intuitive experience or portfolio management. Accuracy is one of the most important criteria in order to choose a credit‐scoring model; and hence, the researches directed at improving upon the effectiveness of credit scoring models have never been stopped. In this article, a hybrid binary classification model, namely FMLP, is proposed for credit scoring, based on the basic concepts of fuzzy logic and artificial neural networks (ANNs). In the proposed model, instead of crisp weights and biases, used in traditional multilayer perceptrons (MLPs), fuzzy numbers are used in order to better model of the uncertainties and complexities in financial data sets. Empirical results of three well‐known benchmark credit data sets indicate that hybrid proposed model outperforms its component and also other those classification models such as support vector machines (SVMs), K‐nearest neighbor (KNN), quadratic discriminant analysis (QDA), and linear discriminant analysis (LDA). Therefore, it can be concluded that the proposed model can be an appropriate alternative tool for financial binary classification problems, especially in high uncertainty conditions. © 2013 Wiley Periodicals, Inc. Complexity 18: 46–57, 2013  相似文献   

18.
The Global Information Technology Report released by the World Economic Forum (WEF) has employed networked readiness index (NRI) to measure the global competitiveness of a country’s information and communication technologies (ICT) diffusion. The final NRI overall scores were measured by an arithmetic mean aggregation of the composite pillars scores, which implicitly assumed that all the pillars have constant weights. The Report did not explore the critical pillars and causal relations for better decision making. To add values to this Report, the objective of this paper is to propose an innovative approach by using data mining techniques and partial least squares path modeling to scrutinize the critical pillars within the NRI and to further explore the causal relations amongst them. An empirical analysis based on the latest Report (2009-2010) is carried out. The results show that “business usage,” “business readiness,” and “market environment” are the three root drivers—critical pillars to manipulate the NRI overall scores; whereas “government readiness,” which is further mostly affected by the “government usage,” is the foremost enabler to the NRI overall scores. Based on the results, policy makers are suggested to allocate limited resources with priority to the three root drivers and one foremost enabler to frog-leap the global competitiveness of national ICT diffusion.  相似文献   

19.
特木尔朝鲁  银山 《数学学报》2007,50(5):1017-103
考虑了一般微分方程(组)高次积分和其微分特征列集(吴方法)机械化确定算法.首先提出微分方程的积分因子和首次积分的推广高次积分因子与其对应的高次积分的概念.其次给出了由高次积分因子确定其对应的高次积分的计算公式,使确定高次积分的问题转化为求高次积分因子的问题.再其次对确定高次积分因子的问题,给出了微分特征列集算法.最后用给定的算法确定了二阶和三阶微分方程拥有高次积分的结构定理,并给出了具体的算例和结论.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号