首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
回归系数的主相关估计及其优良性   总被引:6,自引:0,他引:6  
本文在回归系数的主成分估计的基础上,提出一种新的降维估计-主相关估计,讨论了它的优良性,并用实例说明主相关估计对主成分估计的改进效果。  相似文献   

2.
本文在回归系数的岭型主相关估计的基础上,提出了广义岭型主相关估计,进一步研究其在降维估计类中方差最优性。  相似文献   

3.
主成分的最优性与广义主成分估计类   总被引:8,自引:0,他引:8  
在多元降维分析中,主成分之所以倍受重视,重要原因之一是它具有许多最优性质。Okamoto把主成分的最优性质归纳为三类:变差最优性、信息损失最小性和相关最优性。稍后,Chen又提出了一种回归最优性。在Massy引进了回归系数的主成分估计之后,学者们从多方面研究主成分估计的性质。除了它比最小二乘估计(以下简称LS估计)有较小的均方误差以及可容许性、Bayes估计之外,Greenberg还证明了,在一个很小的估计类中,主成分估计的方差和最小。Formby注意到,选择k(k小于回归自变量的个数p)个主成分的主  相似文献   

4.
闫莉  陈夏 《数学杂志》2006,26(3):323-326
本文研究了线性模型中的一种有偏估计,利用均方误差和残差平方和,得到了岭型主相关估计的一些性质,是对[1]中相关结果的推广.  相似文献   

5.
回归系数的稳健主成分估计   总被引:5,自引:0,他引:5  
自变量间多元共线关系的存在以及数据集中离群值的存在,对回归系数最小二乘估计产生较大的影响。主成分估计用以抗多元共线,稳健M-估计具有抗离群值的特性。本文探讨了离群值对主成分估计的影响和多元共线对M-估计的影响。在此基础上提出了回归系数稳健主成分估计(RPC),RPC是主成分估计与M-估计的有机结合,它能同时抗离群值和多元共线并保留主成分估计与M-估计的优点。本文应用Monte-Carlo方法,考证了在多元共线与离群值同时存在时,RPC优于Ls估计、主成分估计和M-估计,说明RPC具有一定的实用价值。  相似文献   

6.
纯净效应准则是选择最优设计的一个重要准则,实际中往往部分二阶交互效应是可忽略的,此时对主效应的估计,可以允许主效应与可忽略二阶交互效应混杂.文章首先回顾了部分纯净主效应设计的相关理论、进展、以及二水平情形下的结果.然后以三水平为例,给出了高水平下部分纯净主效应设计的若干结果.相比二水平情形,其存在更多类的高水平部分纯净主效应设计.最后通过随机模拟比较,验证了三水平部分纯净主效应设计在估计参数上的优势.  相似文献   

7.
针对线性回归模型Y=Xp e,e~(0,σ2I)在设计矩阵X呈病态(存在复共线性关系)时,从主成分估计的思想出发,结合岭估计减少均方误差的方法,提出并推导了一类新的估计β(k)=(X'X Φx2kΦ'2)-1X'Y,称之为广义岭型估计.优点是只对主成分和非主成分添加两个不同的常数,均方误差大幅度降低的同时,相对于一般的广义岭估计,计算量减少,相对于主成分估计,便于对原变量做出解释.文中进一步讨论了该估计与主成分估计和岭估计的优劣.  相似文献   

8.
随着信息技术的高速发展,每条数据所包含的信息越来越丰富,使得数据不可避免地含有异常值,且随着维数的增加,异常值出现的可能性更大。传统的主成分聚类分析对异常值特別敏感,基于MCD估计的主成分聚类方法虽然对异常值具有防御作用,但是在高维数据下MCD估计的偏差过大,其稳健性显著降低,而且当维数大于观测值个数时MCD估计失效。为此本文提出了基于MRCD估计的稳健主成分聚类方法,数值模拟和实证分析表明,基于MRCD估计的主成分聚类分析的效果优于传统的主成分聚类分析和基于MCD估计的主成分聚类分析,尤其是在维数大于样本观测值的情况下,MRCD估计更为有效。  相似文献   

9.
回归系数的stein型主成分估计   总被引:4,自引:0,他引:4  
对于设计阵X呈病态的线性回归模型,本文提出了一种新的关于回归系数的有偏估计─stein型主成分估计,并在均方误差意义下,论证了在一定条件下stein型主成分估计优于主成分估计,因此也优于stein型OLS估计与OLS估计,最后,我们又对偏参数的存在性,最优性进行了讨论,并得出了一些重要结论.  相似文献   

10.
本文在不同基准风险边际模型下考虑带辅助协变量的相关失效时间数据的统计推断.假设感兴趣的主协变量仅在全研究队列的一个子集中是精确测量的,而主协变量的辅助协变量则对研究队列的全部个体均可获得.首先利用辅助信息经验地估计相对风险函数,然后提出一种加权估计伪部分似然(weighted estimated pseudo-partial likelihood, WEPPL)方法求边际风险率参数的估计.本文在辅助协变量为分类变量的情形下建立WEPPL估计的渐近性质.相应估计被证明是相合的和渐近正态的.本文通过模拟研究评估提出的估计在有限样本下的表现.结果显示提出的加权估计在效率上要优于未加权的估计,特别是当失效时间之间相关性较强的时候.  相似文献   

11.
In this paper, we propose a new biased estimator of the regression parameters, the generalized ridge and principal correlation estimator. We present its some properties and prove that it is superior to LSE (least squares estimator), principal correlation estimator, ridge and principal correlation estimator under MSE (mean squares error) and PMC (Pitman closeness) criterion, respectively.  相似文献   

12.
应用SAS解非线性回归问题   总被引:2,自引:0,他引:2  
.应用SAS/STAT估计非线性回归模型中的参数.首先,通过变量代换,把可以线性化的非线性回归模型化为线性回归模型,并用普通最小二乘法、主成分分析法和偏最小二乘法求模型中的参数和回归模型.其次,通过改良的高斯—牛顿迭代法来估计Logistic模型和Compertz模型中的参数.  相似文献   

13.
当设计矩阵X复共线时,对齐次线性约束回归模型参数的约束最小二乘估计进行改进,提出参数的主成分压缩估计,并对新参数估计的性质进行了讨论,最后进行了数值模拟,验证了算法的参数估计优于约束最小二乘估计.  相似文献   

14.
关于线性回归模型的有偏估计   总被引:3,自引:0,他引:3  
有偏估计方法是近代回归分析的常用方法.本文研究了几种常用的有偏估计方法,澄清了这些方法的区别和联系.对有偏估计的一些关键点进行研究,给出了一种新的岭参数确定法和一种新的主成分概念,并讨论了这些方法的优良性.为了提高有偏估计的效率,提出了用比例因子规范模型的方法.最后,给出了说明本文方法的数值例子.  相似文献   

15.
为便于进行数据分析,首先将数据中的位点信息由原来字母编码方式转换为数值编码的方式,根据位点的编码信息和患病信息,采用Logistic回归的方法,找出某种疾病最有可能的一个或几个致病位点,同时采用显著性检验进一步对建立的模型进行检验,证明了建立结果的合理性。此外,通过主成分分析,从原有的300个主成分中取出了225个主成分尽可能多地反映原来基因变量的信息,再通过主成分Logistic回归分析找出与疾病最有可能相关的一个或几个基因。最后,采用典型相关分析找出与相关性状有关联的基因位点。  相似文献   

16.
房产需求量中的若干数学模型和研究   总被引:1,自引:0,他引:1  
本文是继2006年研究项目“上海市基础房价走势”后的又一后续课题.其宗旨是研究、预测2007年上海市住宅需求量.基于易居(中国)房地产研究院所提供的数据,本文在数据相关性分析基础上,建立了二个预测模型,每个模型分别用2种方法得出结果,以便验证并消除系统误差.模型一:回归模型.分别利用主成分分析基础上的回归以及逐步回归法.模型二:核密度函数模型.通过核估计以及核回归,进行预测.本文模型具有一定的可操作性,使用简便.所得结果得到有关专家的论证和确认.  相似文献   

17.
胡倩  胡尧  刘伟 《经济数学》2020,37(4):123-129
应用主成分估计方法,对Logistic回归模型进行参数估计,并消除多重共线性影响.首先选取了累计贡献率达到85%以上的6个主成分,对因变量进行主成分估计,然后挑选出冠心病患者发病的主要影响因素,最后得到了因变量(冠心病发病)与6个主要影响因素(血压(sbp)、累计烟草量(tobacco)、低密度脂蛋白胆固醇(ldl)、心脏病家族史(famhist)、型表现(typea)和发病年龄(age))的回归模型.根据结果可知,心脏病家族史是导致心脏病发病最大的一个原因,它是一个不可控因素;在可控因素中,累计烟草量对冠心病发病的影响最大,因此建议患者应该控制烟草摄入量,以保证病情的稳定性.  相似文献   

18.
Sliced inverse regression (SIR) is an important method for reducing the dimensionality of input variables. Its goal is to estimate the effective dimension reduction directions. In classification settings, SIR is closely related to Fisher discriminant analysis. Motivated by reproducing kernel theory, we propose a notion of nonlinear effective dimension reduction and develop a nonlinear extension of SIR called kernel SIR (KSIR). Both SIR and KSIR are based on principal component analysis. Alternatively, based on principal coordinate analysis, we propose the dual versions of SIR and KSIR, which we refer to as sliced coordinate analysis (SCA) and kernel sliced coordinate analysis (KSCA), respectively. In the classification setting, we also call them discriminant coordinate analysis and kernel discriminant coordinate analysis. The computational complexities of SIR and KSIR rely on the dimensionality of the input vector and the number of input vectors, respectively, while those of SCA and KSCA both rely on the number of slices in the output. Thus, SCA and KSCA are very efficient dimension reduction methods.  相似文献   

19.
对收集而来的数据进行相关性分析,筛选出与满意度效标值相关显著的选项:首先找出影响大学生活满意度的因素,然后用主成分分析的方法和全部入选法建立的回归方程得出影响大学生活满意度的主要因素。分析结果可以对如何进行大学生心理健康教育和素质教育提供一定的参考信息。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号