首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文提出一个新的多元统计方法:双重筛选判别分类。其目的是解决已知模型样本较少时,如何进两类样本差别分类的问题。将此方法用于地质学中对于有矿和无矿的差别。取得较好的应用效果。  相似文献   

2.
有序判别分析新算法及其应用   总被引:1,自引:1,他引:0  
判别分析是用已知分类数据建模对未知分类数据进行判别的方法,所用数据和分类不分顺序。要对有序又有周期数据进行判别分析,就要探索有序判别的新方法。这种方法的分类应当是有序的,并且能够排除事物发展周期性的干扰。本文介绍多元数据有序判别分析新方法的原理、建模流程、应用流程和应用实例。这种判别分析将分类建模与判别归类分开。新方法对多元数据建模时在多类模型中建立滑移的多套子模型,应用时根据应用领域的知识对样本归属作初步预估,然后程序选择相关的子模型进行判别归类。这种方法解决了由于时间序列多元数据周期性造成的样本分类颠倒问题,为时间序列数据的分类和预测开辟了新途径,在实际应用中取得了良好的效果,解决了重大难题。  相似文献   

3.
基于贝叶斯逐步判别法构建入侵检测模型,将入侵检测转化为一个分类判别问题,基于步进式引入的方法淘汰冗余的特征变量,能够在保障判别效果的前提下有效降低原分类判别函数的计算复杂度.使用KDD CUP99数据中10%数据集作为实验数据,以常见的拒绝服务攻击(DoS攻击)为例创建具体的模型实例,实验结果表明,模型对于样本内连接记录的回代判对率和样本外连接记录的检测正确率均较高.  相似文献   

4.
在对目前我国信用评级方法应用现状分析的基础上,提出改进的多标准等级判别模型.并将该模型应用于商业银行信用风险评估中.通过对银行五级分类贷款样本的实证研究,证实了该判别模型的有效性和先进性.  相似文献   

5.
主要研究垃圾文本识别问题,利用苹果手机评论文本特征向量建立了SVM分类模型对垃圾文本进行识别,并与BP神经网络判别模型结果进行对比,得出苹果手机前400组训练样本的判别正确率为71%,后196组测试样本的判别正确率为70.12%.故得到,影响垃圾观点文本识别效果的主要原因为:1)评论文本的特征项的提取和文本特征空间向量求解.2)判别分类方法的选择,其中SVM文本识别效果最优.  相似文献   

6.
基于图的半监督分类方法近年来在模式识别和机器学习领域取得了广泛的关注.然而许多传统方法在构建邻域图时采用固定的邻域尺寸,且在模型训练过程中同等对待所有样本,忽略了样本间的差异性,从而影响了方法的效果.对此,文章提出一种基于自步学习和稀疏自表达的半监督分类方法,提取并保持数据的有判别信息的稀疏自表达结构,并基于自步学习机制提出一种新的自步学习项,将数据重要程度的软权重与硬权重相结合,来对样本进行学习.所提方法能够自适应建立数据间的关系,自动给出样本的重要程度并由易到难进行学习,且具有多类的显性非线性分类函数.几个标准数据集上的实验结果表明,所提算法具有较好的半监督分类效果.  相似文献   

7.
非参数逐步判别分析在脑中风分类诊断中的应用   总被引:4,自引:0,他引:4  
本文采用不等带宽核密度估计的非参数逐步判别分析,使用SAS软件,对复旦大学附属中山医院78例脑中风样本病例,科学地进行了脑出血、脑缺血的分类诊断。经交叉证实法得判别正确率为:脑出血87 88%、脑缺血88 89%,总判别正确率88 46%,判别效果良好。应用78例训练样本建立的判别函数,在苏州大学附属医院2002年42例脑中风病人的分类诊断中,取得了成功的实际应用效果。  相似文献   

8.
Logistic回归模型在信用风险分析中的应用   总被引:2,自引:0,他引:2  
通过运行SPSS,建立L og istic回归信用评价模型(cred it eva luation m odel),用来对中国2000年106家上市公司进行两类模式分类,这两类模式是指按照公司的经营状况分为“差”和“正常”两个小组.对每一家上市公司,考虑其经营状况的4个主要财务指标:每股收益、每股净资产、净资产收益率和每股现金流量.仿真结果表明,L og istic回归信用评价模型对总体106个样本,判别准确率达到99.06%.此外,本文的研究结果还发现,当利用SPSS的D iscrim inan t给出的模型系数建立的线性判别分析模型和利用SPSS的M u ltinom ia lL og istic给出的模型参数建立的L og istic回归模型,L og istic回归模型的判别结果不如线性判别模型.但如果剔除不合格的样本,或是将样本数据规格化,则可以提高L og istic回归模型的分类准确率.  相似文献   

9.
稀疏表示是近年来新兴的一种数据表示方法,是对人类大脑皮层编码机制的模拟。稀疏表示以其良好的鲁棒性、抗干扰能力、可解释性和判别性等优势,广泛应用于模式识别领域。基于稀疏表示的分类器在人脸识别领域取得了令人惊喜的成就,它将训练样本看成字典,寻求测试样本在字典下的最稀疏的表示,即用尽可能少的训练样本的线性组合来重构测试样本。但是经典的基于稀疏表示的分类器没有考虑训练样本的类别信息,以致被选中的训练样本来自许多类,不利于分类,因此基于组稀疏的分类器被提出。组稀疏方法考虑了训练样本的类别相似性,其目的是用尽可能少类别的训练样本来表示测试样本,然而这类方法的缺点是同类的训练样本或者同时被选中或者同时被丢弃。在实际中,人脸受到光照、表情、姿势甚至遮挡等因素的影响,样本之间关系比较复杂,因此最后介绍局部加权组结构稀疏表示方法。该方法尽量用来自于与测试样本相似的类的训练样本和来自测试样本邻域的训练样本来表示测试样本,以减轻不相关类的干扰,并使得表示更稀疏和更具判别性。  相似文献   

10.
在多标度数据的分类问题中,对于分布特征不清或小样本下的数据的相似性度量仍是研究的热点.对此,建立了基于样本几何轮廓相似度的判别分析模型,并应用于采动沉陷建筑物损坏等级的评价,结果表明该模型简洁、有效,无需数据预处理,较少依赖先验信息,具有推广应用的价值.  相似文献   

11.
马田系统(MTS)是一种多元模式识别方法,它首先通过正常样本来建立基准空间,再利用正交表和信噪比来筛选有效变量,最后通过马氏距离来进行分类、诊断和预测.当建立基准空间的正常样本中掺杂少数异常点时,MTS的性能必然会受到影响.根据多变量控制图原理对建立基准空间样品的适合性进行判别,将在控制线外的样品点删除后建立新的基准空间,并通过UCI数据集进行可行性分析及分类效果比较,结果显示:经多变量控制图优化后的MTS,其性能得到显著提高.  相似文献   

12.
冰雹是一种强烈的自然灾害,为了提前对冰雹进行预测,提出了一种BP神经网络做预测,极限学习机做识别的预测方法.方法以雷达回波反射率图像的均值、方差、熵为判别指标,首先训练好能够分类云层特征的极限学习机,其次结合雹云形成过程,使用经过较大样本训练的BP神经网络对未来30分钟数据预测,最后使用经过训练的极限学习机进行云层的类型判别.实验结果表明,BP神经网络能够平均提前5-20分钟预测出降雹,具有较好的预测效果.  相似文献   

13.
特征筛选方法是处理超高维数据的一种快速有效的降维方法.针对超高维判别分类数据,提出一种改进的超高维特征筛选方法,方法不需要特定的模型假定;可以处理多分类响应变量情形;可适用于离散型或连续型协变量情形;对服从重尾分布的协变量,方法仍具有较好的稳健性.从理论上证明了所提出特征筛选方法满足确定筛选性和指标排序相合性,并通过数值模拟和实例分析在有限样本条件下验证了方法的有效性.  相似文献   

14.
DNA序列的分类   总被引:7,自引:0,他引:7  
本文对 A题中给出的 DNA序列分类问题进行了讨论 .从“不同序列中碱基含量不同”入手建立了欧氏距离判别模型 ,马氏距离判别模型以及 Fisher准则判定模型 ;又从“不同序列中碱基位置不同”入手建立了利用序列相关知识的相关度分类判别算法 ,并进一步研究了带反馈的相关度分类判别算法 .对于题中所给的待分类的人工序列和自然序列 ,本文都一一作了分类 .接着 ,本文又对其它各种常见的分类算法进行了讨论 ,并着重从分类算法的稳定性上对几种方法作了比较 .  相似文献   

15.
本文发现通常的k—近邻判别不是Bayes风险相合的,提出了一种利用历史样本来确定近邻阶数的自适应方法,它确保了判别的Bayes风险相合性,又照顾到小样本特性,文中对结果给出了细致论证,最后还提出了一个有趣的问题。  相似文献   

16.
以50个神经元的三维坐标为基础数据,选取并计算出神经元的20个形态特征,通过对20个特征单因子方差分析得知其中19个特征都是显著性因子.建立基于Matlab的判别分析模型,以50个神经元作为训练样本,对20个未知样本进行分类识别,得到较理想的结果.  相似文献   

17.
素数的判别与分类宋八全(华中师范大学数学系92级)记p是不等于2,5的素数.本文试用循环小数的性质讨论素数的判别与分类.全文计划如下:(1)建立素数与循环小数的联系,证明一个素数判别定理.(2)确定素数分类关系和制造素数表的方法并指明用此表分解合数....  相似文献   

18.
判别分析是判别样品所属类型的一种统计方法.利用M ATLAB提供的神经网络工具箱为基础,设计了一个三层BP神经网络判别模型,提出了一种进行判别分析的新方法,实例表明,利用BP神经网络建立的判别模型是进行判别分析的有效方法.是对研究分类问题的方法的扩充.  相似文献   

19.
Bayes判别在进行判别分析时考虑到各总体出现的先验概率、预报的先验概率及错判造成的损失,其判别效能优于其他判别方法.对Bayes判别方法详细介绍的基础上,利用R软件对一组舒张压和胆固醇数据分别进行Bayes判别分析、Fisher判别分析和基于距离的判别分析,对比三种不同方法下得到的判别结果,结果表明Bayes判别分析得到的分类结果精度较高,Bayes判别分析在医学领域有较好的应用前景.  相似文献   

20.
用LDA Boosting算法进行客户流失预测   总被引:2,自引:1,他引:1  
本文提出一种LDA boost(Linear Discriminant Analysis boost)分类方法,该算法能有效利用样本的所有特征,并且能够从高维特征空间里提取并组合优化出最具有判别能力的低维特征,使得样本类间离散度和类内离散度的比值最大,从而不会产生过度学习,大大提高算法效率。该算法有效性在某商业银行的客户流失预测过程的真实数据集中得到了验证。与其他同类算法,如人工神经网络、决策树、支持向量机等运算结果相比,该方法可以显著提高运算精度。同时,LDAboosting与其他boosting算法相比,也具有显著的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号