共查询到15条相似文献,搜索用时 78 毫秒
1.
罚模型聚类实现了在聚类过程中精简变量的目标,同时如何识别聚类的有效变量成了一个新的问题.在这个问题上,已有的研究有成对罚模型,模型处理了各类数据同方差的情况.考察了异方差情况下的变量选择问题,针对异方差数据提出了两种新的模型,并给出模型的解和算法.模拟数据分析结果表明,异方差数据上两个新模型都有更好的表现. 相似文献
2.
3.
4.
5.
混合模型已成为数据分析中最流行的技术之一,由于拥有数学模型,它通常比聚类分析中的传统的方法产生的结果更精确,而关键因素是混合模型中子总体个数,它决定了数据分析的最终结果。期望最大化(EM)算法常用在混合模型的参数估计,以及机器学习和聚类领域中的参数估计中,是一种从不完全数据或者是有缺失值的数据中求解参数极大似然估计的迭代算法。学者们往往采用AIC和BIC的方法来确定子总体的个数,而这两种方法在实际的应用中的效果并不稳定,甚至可能会产生错误的结果。针对此问题,本文提出了一种利用似然函数的碎石图来确定混合模型中子总体的个数的新方法。实验结果表明,本文方法确定的子总体的个数在大部分理想的情况下可以得到与AIC、BIC方法确定的聚类个数相同的结果,而在一般的实际数据中或条件不理想的状态下,碎石图方法也可以得到更可靠的结果。随后,本文将新方法在选取的黄石公园喷泉数据的参数估计中进行了实际的应用。 相似文献
6.
癌症的早期诊断可以显著提高癌症患者的存活率,三分类问题就是将未知样本与已知样本进行匹配度检测,预测样本是健康状态,良性发展状态,还是癌症状态.针对复杂难分的卵巢癌蛋白质质谱数据,提出了一种基于高斯混合模型和BP神经网络的三分类预测模型.首先,去除原数据中的冗余,对其进行方差排序及交集筛选提取特征集合一,再利用高斯混合模型处理求得参数作为特征集合二,最后使用BP神经网络进行样本三分类,准确率达到72.9%.结果表明:模型可以作为卵巢癌质谱数据三分类的可选择工具. 相似文献
7.
描述最大似然参数估计问题,介绍如何用EM算法求解最大似然参数估计.首先给出EM算法的抽象形式,然后介绍EM算法的一个应用:求隐Markov模型中的参数估计.用EM算法推导出隐Markov模型中参数的迭代公式. 相似文献
8.
9.
10.
截断奇异值分解是一类非常重要的矩阵分解,其在病态模型问题分析等领域有广泛的应用.该文主要研究复矩阵截断奇异值分解的有效算法,将问题转化为复Stiefel乘积流形上的黎曼优化问题,进而设计基于乘积流形的黎曼混合牛顿法求解.为有效求解黎曼牛顿方程,从降低系统维数和简化计算入手,通过克罗内克积和复矩阵拉直算子将其转化为易于求解的标准实对称线性方程组.数值实验和数值比较验证该文所提算法针对复矩阵截断奇异值分解问题是高效可行的. 相似文献
11.
12.
项目反应理论(IRT)模型是教育统计与测量中一种十分重要的模型,它包含项目参数和能力参数.目前一种常用的估计IRT模型项目参数的方法是由Woodruff和Hanson(1997)应用EM算法给出的,它用于完全反应数据,而把能力参数看作缺失数据.本文将Woodruff的方法推广到处理缺失反应的情况,基本思想是把能力参数和缺失反应均看作缺失数据,再运用EM算法估计参数.通过模拟研究,在不同被试人数和不同缺失比例的情况下,本文比较了我们给出的方法和BILOG-MG软件的缺失数据处理方法的参数估计效果.结果表明,在大多数情况下,本文提出的方法能得到更好的估计. 相似文献
13.
A cured model is a useful approach for analysing failure
time data in which some subjects could eventually experience and others never
experience the event of interest. All subjects in the test belong to one of the
two groups: the susceptible group and the non-susceptible group. There has been
considerable progress in the development of semi-parametric models for regression
analysis of time-to-event data. However, most of the current work focuses on
right-censored data, especially when the population contains a non-ignorable
cured subgroup. In this paper, we propose a semi-parametric cure model for current
status data. In general, treatments are developed to both increase the patients'
chances of being cured and prolong the survival time among non-cured patients. A
logistic regression model is proposed for whether the subject is in the susceptible
group. An accelerated failure time regression model is proposed for the event
time when the subject is in the non-susceptible group. An EM algorithm is used
to maximize the log-likelihood of the observed data. Simulation results show that
the proposed method can get efficient estimations. 相似文献
14.
15.
首先给出非零截距线性模型T-型估计的模型与EM算法,其次给出非线性回归模型参数的T-型估计,利用泰勒级数对模型线性化,得到参数估计的迭代算法,最后用数值模拟实验验证了该算法的正确性和证实了T-型估计的稳健性. 相似文献