期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

林哲程龙生《数学的实践与认识》2015,(4):134-143

马田系统是由日本著名质量工程学家田口玄一提出的一种模式识别方法,它将正交试验设计、信噪比与马氏距离进行集成,筛选有效特征变量,对待测群体进行诊断、评价和预测.马田系统利用正交表和信噪比筛选特征变量可能存在不足之处,而粗糙集是处理不完善、不确定数据等不完全信息并能进行属性约简的有效方法,引入粗糙集筛选有效特征变量以改进马田系统.癌细胞的及早发现有助于乳腺癌的早期预防和及时治疗,以乳腺癌细胞的分类检测为背景,选取UCI数据库中600个细胞作为研究样本,使用改进马田系统方法区分正常细胞和乳腺癌细胞,并将其分类效果与经典马田系统相比较.结果表明,基于粗糙集的改进马田系统对乳腺癌细胞的分类正确率高于经典马田系统,粗糙集方法大大减少了特征变量个数,可简化数据的收集工作,为医疗上乳腺癌疾病的早期诊断及其他实际分类工作提供技术参考. 相似文献

2.

基于岭估计的岭马田系统在复共线性数据中的应用

陶建波程龙生《数学的实践与认识》2016,(4):109-116

在多变量模式识别领域,变量间经常会存在复共线性,复共线性不仅会影响参数估计的效果,也会使变量的敏感性出现显著异常.马田系统是以马氏距离作为测量尺度的多变量模式识别方法,复共线性会通过马氏距离影响马田系统变量筛选的效果和判别的准确率.基于岭估计提出了一种新的测量尺度—岭马氏距离,利用岭迹法确定岭参数,将其引入马田系统使得马田系统对病态数据具有更好的耐受性.通过案例验证了岭马氏距离可以很好的克服复共线性,并提高马田系统的判别准确率. 相似文献

3.

基于改进阈值的马田系统在医疗智能诊断中的应用

詹君程龙生崔玉宝《数学的实践与认识》2020,(1):163-172

人工智能与医疗数据的融合可以加速疾病诊断过程,提高诊断精度,挖掘诊断过程关键指标,改善医疗工作流程.以医疗决策者偏好为前提,提出基于二次损失函数改进阈值的马田系统算法.通过正交表与信噪比对指标进行优化,降低模型复杂度;通过对阈值的改进,提高模型的灵敏度,满足医疗工作者的决策偏好.将此方法应用于UCI乳腺癌医学数据及三甲医院哮喘临床数据,并与其他改进阈值的马田系统算法及智能算法对比分析.结果表明,改进阈值的马田系统算法识别灵敏度高,简化诊断指标,训练耗时少,是一种更为有效的医疗智能诊断方法. 相似文献

4.

基于GBMTS算法的不平衡数据分类研究

顾玉萍程龙生陈湘来《数理统计与管理》2016,(6):1016-1027

解决不平衡数据分类问题,在现实中有着深远的意义。马田系统利用单一的正常类别构建基准空间和测量基准尺度,并由此建立数据分类模型,十分适合不平衡数据分类问题的处理。本文以传统马田系统方法为基础,结合信噪比及F-value、G-mean等分类精度,建立了基于遗传算法的基准空间优化模型,同时运用Bagging集成化算法,构造了改进马田系统模型算法GBMTS。通过对不同分类方法及相关数据集的实验分析,表明:GBMTS算法较其他分类算法,更能够有效的处理不平衡数据的分类问题。相似文献

5.

基于多变量控制图的马田系统优化研究

顾玉萍程龙生生志荣《数学的实践与认识》2017,(11):164-170

马田系统(MTS)是一种多元模式识别方法,它首先通过正常样本来建立基准空间,再利用正交表和信噪比来筛选有效变量,最后通过马氏距离来进行分类、诊断和预测.当建立基准空间的正常样本中掺杂少数异常点时,MTS的性能必然会受到影响.根据多变量控制图原理对建立基准空间样品的适合性进行判别,将在控制线外的样品点删除后建立新的基准空间,并通过UCI数据集进行可行性分析及分类效果比较,结果显示:经多变量控制图优化后的MTS,其性能得到显著提高. 相似文献

6.

基于控制图的马田系统马氏空间生成机理研究

生志荣程龙生顾玉萍《数理统计与管理》2017,(6):1059-1068

马田系统是以马氏距离为测量尺度,通过选取正常样本构建马氏空间,对多元系统进行诊断和预测的分类技术。马氏距离对样本数据的变化非常敏感,因此用于构建马氏空间的正常样本的数据质量直接影响到分类的准确率。实际应用中正常样本的选取大多依据主观经验判断,缺乏客观规范的选择机制。本文提出基于控制图的马氏空间生成机理,先由专家选取的正常样本构建初始马氏空间,再以每个正常样品在初始马氏空间和对应的缩减马氏空间上的马氏距离增量作为新的测量尺度,以此建立单值控制图,利用控制图稳定性判定规则剔除异常数据,从而得到稳定状态的马氏空间。实验分析结果表明该方法的有效性且提高了马田系统分类的准确率。相似文献

7.

采用优化模型指标筛选的马田系统综合评价方法研究

《数学的实践与认识》2015,(17)

传统的马田系统主要用于分类与诊断.将马田系统作为一种综合评价方法进行研究,分别研究了有基准空间和无基准空间两种情形下的马田系统综合评价方法及步骤.针对传统马田系统变量筛选存在的缺陷,构建多目标规划模型进行评价指标筛选,采用遗传算法求解模型.通过两个实际案例,将马田系统综合评价方法与一些常用的综合评价方法对比研究,结果表明,马田系统可以筛选评价指标和避免指标赋权问题,是一种实用且有效的综合评价方法. 相似文献

8.

极限学习机集成在肿瘤分类中的应用

陆慧娟张金伟马小平郑文斌《数学的实践与认识》2012,42(17):148-154

提出一种基于数据集分割的极限学习机集成算法——DS-E-ELM.该算法主要包含以下3个步骤:首先,将数据集分成互不相关的κ个子集,选择κ一1个子集组合成一个训练集,这样可以得到κ个不同的数据集;然后将新得到的κ个数据集利用极限学习机训练得到κ个分类器;最后对κ个分类器预测得到的结果通过多数投票的方法决定预测结果.通过对6个肿瘤数据集的实验证明,DS-E-ELM与单独的ELM、Bagging、Boosting等算法相比,具有更高的分类精度,且稳定性更好. 相似文献

9.

分类讨论在初中数学学习中的应用

张玲《数学之友》2022,(3):52-54

分类讨论应用场景广泛,包括概念学习、公式运用、问题解答等方面,其中利用分类讨论解答数学问题,应该作为初中数学学习的重点,这样更有利于突出学生在数学学习活动中的主体地位.初中数学学习主要有“数学概念”“数学准则”“数学问题”三种类型,将其逐一分析并讨论其中分类讨论应用方式. 相似文献

10.

分类思想在初中数学解题中的应用

程言彪《上海中学数学》2010,(12):23-24

分类讨论是初中数学重要的思想方法之一,因试题覆盖的知识点多,知识面广,具有明显的“逻辑性、综合性、探索性”的特点,能体现“着重考查学生数学能力”的要求,所以成为历年中考的热点之一．从近几年中考学生的答题情况看,分类讨论题得分率很低,学生出错往往是因为不知道何时、为何分类, 相似文献

11.

Classification Trees With Bivariate Linear Discriminant Node Models

《Journal of computational and graphical statistics》2013,22(3):512-530

This article introduces a classification tree algorithm that can simultaneously reduce tree size, improve class prediction, and enhance data visualization. We accomplish this by fitting a bivariate linear discriminant model to the data in each node. Standard algorithms can produce fairly large tree structures because they employ a very simple node model, wherein the entire partition associated with a node is assigned to one class. We reduce the size of our trees by letting the discriminant models share part of the data complexity. Being themselves classifiers, the discriminant models can also help to improve prediction accuracy. Finally, because the discriminant models use only two predictor variables at a time, their effects are easily visualized by means of two-dimensional plots. Our algorithm does not simply fit discriminant models to the terminal nodes of a pruned tree, as this does not reduce the size of the tree. Instead, discriminant modeling is carried out in all phases of tree growth and the misclassification costs of the node models are explicitly used to prune the tree. Our algorithm is also distinct from the “linear combination split” algorithms that partition the data space with arbitrarily oriented hyperplanes. We use axis-orthogonal splits to preserve the interpretability of the tree structures. An extensive empirical study with real datasets shows that, in general, our algorithm has better prediction power than many other tree or nontree algorithms. 相似文献

12.

The Optimal Classification Using a Linear Discriminant for Two Point Classes Having Known Mean and Covariance

Tristrom Cooke Michael Peake 《Journal of multivariate analysis》2002,82(2):379

The current study provides a simple algorithm for finding the optimal ROC curve for a linear discriminant between two point distributions, given only information about the classes' means and covariances. The method makes no assumptions concerning the exact type of distribution and is shown to provide the best possible discrimination for any physically reasonable measure of the classification error. This very general solution is shown to specialise to results obtained in other papers which assumed multi-dimensional Gaussian distributed classes, or minimised the maximum classification error. Some numerical examples are provided which show the improvement in classification of this method over previously used methods. 相似文献

13.

Classification accuracy and correlation: LDA in failure prediction

Erkki K. Laitinen 《European Journal of Operational Research》2007

The relationship between canonical correlation and classification accuracy in linear discriminant analysis is explored mathematically. The discriminant score is assumed to conform to a uniform distribution on the interval (0, 1]. This distribution is used as a reference distribution to extract a minimum correlation for certain classification accuracy. Four different cases are analyzed. First, a case for equal group size is considered for an overall accuracy of 100%. Second, the results are generalized for unequal group size. Third, existence of discordant observations is allowed. Fourth, the effect of concentration is analyzed for the first case. The results are demonstrated by numerical examples. In addition, a sample of 2092 default and 63,072 non-default Finnish firms are used to empirically illustrate the results in the context of failure prediction. The results show that group size of default firms, number of discordant observations, and bipolar concentration of observations strongly affect both canonical correlation and classification accuracy. 相似文献

14.

基于贝叶斯统计方法的两总体基因表达数据分类 总被引：1，自引：0，他引：1

孟宪花于彬王翼飞《应用数学与计算数学学报》2005,19(2):31-39

在疾病的诊断过程中,对疾病的精确分类是提高诊断准确率和疾病治愈率至关重要的一个环节,DNA芯片技术的出现使得我们从微观的层次获得与疾病分类及诊断密切相关的基因功能信息．但是DNA芯片技术得到的基因的表达模式数据具有多变量小样本特点,使得分类过程极不稳定,因此我们首先筛选出表达模式发生显著性变化的基因作为特征基因集合以减少变量个数,然后再根据此特征基因集合建立分类器对样本进行分类．本文运用似然比检验筛选出特征基因,然后基于贝叶斯方法建立了统计分类模型,并应用马尔科夫链蒙特卡罗(MCMC)抽样方法计算样本归类后验概率．最后我们将此模型应用到两组真实的DNA芯片数据上,并将样本成功分类．相似文献

15.

基于MTS特征选择的神经网络集成方法

时建中程龙生牛俊磊郭志芳《数学的实践与认识》2012,42(6):164-168

在Bagging算法基础上,运用马田系统进行特征选择,形成双重扰动改善神经网络集成的分类性能.实验表明,双重扰动增加了集成网络个体精度和差异度,基于MTS-Bagging算法的分类性能相比于Bagging有明显提高. 相似文献

16.

Bayes判别分析在医疗数据处理中的应用 总被引：1，自引：0，他引：1

贾云青侯木舟《数学理论与应用》2009,(2):117-119

本文利用判别分析的基本原理和方法,针对肝硬化医疗数据建立数学模型,然后利用SPSS16.0作为工具求解模型,得到了三个有意义的能判别归类的函数判别式。相似文献

17.

MTS法用于上市公司财务质量评估初探 总被引：2，自引：0，他引：2

薛跃韩之俊盛党红《数理统计与管理》2005,24(1):81-85

本文应用MTS法(MahananobisTaguchiSystem)于我国股票市场,以评估上市公司的财务质量。通过综合分析深圳和上海1000余家上市公司2000年年度财务报表的15项财务比率发现,利用MTS法提供的技术可以较有效识别存在财务质量以及财务造假问题的公司。相似文献

18.

非参数逐步判别分析在脑中风分类诊断中的应用 总被引：4，自引：0，他引：4

高歌王艾丽曹晓韵《数理统计与管理》2004,23(5):48-51,77

本文采用不等带宽核密度估计的非参数逐步判别分析,使用SAS软件,对复旦大学附属中山医院78例脑中风样本病例,科学地进行了脑出血、脑缺血的分类诊断。经交叉证实法得判别正确率为:脑出血87 88%、脑缺血88 89%,总判别正确率88 46%,判别效果良好。应用78例训练样本建立的判别函数,在苏州大学附属医院2002年42例脑中风病人的分类诊断中,取得了成功的实际应用效果。相似文献

19.

基于R软件的Bayes判别分析在医学中的应用

高蒙张旭峰刘权芳《数学的实践与认识》2014,(22)

Bayes判别在进行判别分析时考虑到各总体出现的先验概率、预报的先验概率及错判造成的损失,其判别效能优于其他判别方法.对Bayes判别方法详细介绍的基础上,利用R软件对一组舒张压和胆固醇数据分别进行Bayes判别分析、Fisher判别分析和基于距离的判别分析,对比三种不同方法下得到的判别结果,结果表明Bayes判别分析得到的分类结果精度较高,Bayes判别分析在医学领域有较好的应用前景. 相似文献