首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
本文用PLS过程建立多因变量的偏最小二乘回归模型 ,并用具体例子对最小二乘回归(MLR)、主成分回归 (PCK)和偏最小二乘回归 (PLS)进行比较  相似文献   

2.
我国上市公司资本结构影响因素实证分析   总被引:17,自引:0,他引:17  
本文选取了可能影响企业资本结构的多个指标变量进行分析 ,利用主成分分析提供的方法将变量综合成彼此互不相关的少数几个主成分。再用主成分 (作为回归自变量 )对企业的 5种资本负债比 (作为回归因变量 )进行多元回归分析 ,得出了影响企业资本结构的主要因素 ,以及这些因素与企业资本结构之间的关系 ,为企业确定资本结构提供参考依据 ,为企业财务决策提供支持。  相似文献   

3.
针对线性回归模型Y=Xp e,e~(0,σ2I)在设计矩阵X呈病态(存在复共线性关系)时,从主成分估计的思想出发,结合岭估计减少均方误差的方法,提出并推导了一类新的估计β(k)=(X'X Φx2kΦ'2)-1X'Y,称之为广义岭型估计.优点是只对主成分和非主成分添加两个不同的常数,均方误差大幅度降低的同时,相对于一般的广义岭估计,计算量减少,相对于主成分估计,便于对原变量做出解释.文中进一步讨论了该估计与主成分估计和岭估计的优劣.  相似文献   

4.
生存分析(Ⅲ)   总被引:18,自引:0,他引:18  
<正> 在§2中我们曾提到生存分析中所讨论的第三类问题是对可能影响生存期的各因素(包括反映患者个体差异的量以及反映不同治疗方法的量)在各种模型下进行统一的定量分析,以便在尽可能排除个体差异的情况下对临床中感兴趣的因素的作用进行考察.因此我们需要考察某些定量的或定性的因素 z_1,z_2,…,z_p(称为协变量)对生存期 T 的影响.一种直接的方法是将 T 或 log T 作因变量,考察它们与协变量 z_ξ的线性回归,估计T(或 log T)对各个 z_ξ的回归系数并进行有关的显著性检验.例如我们可以考虑模型  相似文献   

5.
肥胖症是一组常见的代谢症候群,其发病率在中国逐年上升.影响肥胖症的因素很多,本文研究的是年龄、肥胖症家族史、吸烟时间、吸烟数量、饮酒时间、饮酒频率、饮酒数量和户外活动.另外,由于肥胖症通常会有并发症,所以,还附加了高血压,冠心病,糖尿病,高血脂这四个疾病的相关指标,总共16个指标.本文首先用单因子Logistic回归挑选出与肥胖症患病相关性较大的因素,然后用主成分分析方法消除因素间的共线性,最后用标准化自变量的Logistic回归模型将这些因素对肥胖症患病影响的重要性程度进行排序,同时拟合出患病概率的预测模型.  相似文献   

6.
以高血压患者的患病因素为例进行解析,提出代谢综合症相关问题的解决方法.研究年龄、BMI、家族史、吸烟、饮酒、文化程度、职业等18个影响高血压疾病的因素.研究的主要目的是将这些因素对高血压患病影响的重要性程度进行排序,并建立相应患病概率的预测模型.这不仅对人们日常生活疾病的预防、监控有一定的指导意义,也给医疗保险中保单的核保提供了风险度量的判别依据.首先用相关性分析剔除与高血压患病相关性较小的因素,继而用主成分分析方法消除因素间的共线性,最后用Logistic回归拟合患病概率模型并根据系数进行排序和预测.结果显示,无论性别,对高血压疾病影响最大的首先是家族史,其次为年龄.  相似文献   

7.
主成分的最优性与广义主成分估计类   总被引:8,自引:0,他引:8  
在多元降维分析中,主成分之所以倍受重视,重要原因之一是它具有许多最优性质。Okamoto把主成分的最优性质归纳为三类:变差最优性、信息损失最小性和相关最优性。稍后,Chen又提出了一种回归最优性。在Massy引进了回归系数的主成分估计之后,学者们从多方面研究主成分估计的性质。除了它比最小二乘估计(以下简称LS估计)有较小的均方误差以及可容许性、Bayes估计之外,Greenberg还证明了,在一个很小的估计类中,主成分估计的方差和最小。Formby注意到,选择k(k小于回归自变量的个数p)个主成分的主  相似文献   

8.
随着社交网络平台的快速发展,带有网络结构的时序数据越来越多.为拟合用户行为的动态变化,网络向量自回归模型被提出.模型最早研究的是连续型因变量.然而实际数据常观测到离散型因变量.由此,本文提出广义网络向量自回归模型.模型假设存在一个潜在的连续型变量,决定了可观测到的离散型因变量的取值.为了估计和推断模型,本文提出了MCMC (Markov chain Monte Carlo)算法并通过随机模拟进行验证.最后,使用某社交网络平台上的两个真实的数据案例作为例证.  相似文献   

9.
运用相关性分析方法,研究哈尔滨市PM_(2.5)质量浓度与主要空气污染物及气象因素之间的相关关系.建立PM_(2.5)与影响其质量浓度变化的因素的单因变量的偏最小二乘回归分析(PLS1)模型,模型拟合良好,由模型知CO是导致PM_(2.5)质量浓度升高的主要因素.运用通径分析方法,研究解释变量对因变量的直接影响、通过其他解释变量对因变量的间接影响以及各解释变量的对因变量的协同作用.结果表明,各解释变量对PM_(2.5)质量浓度变化的总作用从大到小依次为:CO、PM_(10)、NO_2、风速、湿度、SO_2.  相似文献   

10.
采用主成分回归分析(PCRA)法实现瓦斯爆燃最高温度预测.选取爆燃最高温度影响因素分别为点火能量、环境温度、环境湿度、瓦斯浓度、氧气浓度、惰性气体浓度、管道长度、点火头与管道开口端的距离,共8个.通过影响因素主成分分析,得出瓦斯浓度与氧气浓度对瓦斯爆燃最高温度影响作用最大.通过计算瓦斯爆燃最高温度影响因素主成分得分,构建瓦斯爆燃最高温度预测模型.结果表明:PCRA法预测瓦斯爆燃最高温度最大误差为4.17%,最小仅为0.13%,证明了PCRA法在瓦斯爆燃最高温度预测中的科学性.  相似文献   

11.
The paper presents a methodology, based on Fuzzy Set Theory, to study the influence of social and psychological factors on the coronary disease.A life history questionnaire has been used to collect data from control subjects and coronary patients. The two groups (made homogeneous in respect to objective features like sex, age, job, etc.) have been used as training sets to learn the most relevant combinations of social and psychological features in the characterization of the coronary disease. Each of these features (like Stress, Social mobility, Hysteria, etc.) is represented by means of a fuzzy linguistic variable, whose membership value is evaluated on the basis of the answers to the questions relative to the particular feature.  相似文献   

12.
季晓春  黄春军  彭莹莹 《应用数学》2015,37(5):375-376,380
目的 探讨桥本甲状腺炎(HT)合并甲状腺癌的危险因素。方法 采用回顾性病例对照研究,选取59 例HT 合并甲状腺癌患者为病例组,按照1∶2比例选取118 例HT 合并甲状腺良性结节或单纯HT 患者为对照组,对相关因素进行单因素和多因素logistic 回归分析。结果 单因素分析显示甲状腺疾病家族史、碘摄入情况、辐射接触史、甲状腺自身抗体和合并单发结节为HT 合并甲状腺癌的影响因素。经多因素分析家族史、高碘摄入、辐射接触史为HT 合并甲状腺癌的危险因素,其OR 值(95%CI)分别为2.141(1.664~2.755)、2.479(1.895~2.936)和4.596(3.693~4.997)。结论 HT 合并甲状腺癌发病机制有待于进一步研究,应针对危险因素(家族史、碘摄入情况、辐射接触史)采取措施进行早防早治。  相似文献   

13.
为便于进行数据分析,首先将数据中的位点信息由原来字母编码方式转换为数值编码的方式,根据位点的编码信息和患病信息,采用Logistic回归的方法,找出某种疾病最有可能的一个或几个致病位点,同时采用显著性检验进一步对建立的模型进行检验,证明了建立结果的合理性。此外,通过主成分分析,从原有的300个主成分中取出了225个主成分尽可能多地反映原来基因变量的信息,再通过主成分Logistic回归分析找出与疾病最有可能相关的一个或几个基因。最后,采用典型相关分析找出与相关性状有关联的基因位点。  相似文献   

14.
偏最小二乘回归方法(PLS)在短期气候预测中的应用   总被引:3,自引:0,他引:3  
对广西88个站冬季(12月、1月和2月)各月平均气温距平场作自然正交展开(EOF分解),选取累积方差贡献超过90%的前3个主成分作为预报量.从前期平均大气环流场和海温场中查找预报因子,对这些初选因子用偏最小二乘回归方法(PLS)进行信息筛选和成分提取,用提取的新综合变量(又称成分)作预报因子,分别建立各月平均气温前3个主成分的回归预报方程.经独立样本预报试验证明,偏最小二乘回归方法具备良好的因子信息提取能力,其预报建模方法对冬季月平均气温预报具有较好的预测效果.  相似文献   

15.
This paper studies estimation in functional partial linear composite quantile regression model in which the dependent variable is related to both a function-valued random variable in linear form and a real-valued random variable in nonparametric form. The functional principal component analysis and regression splines are employed to estimate the slope function and the nonparametric function respectively, and the convergence rates of the estimators are obtained under some regularity conditions. Simulation studies and a real data example are presented for illustration of the performance of the proposed estimators.  相似文献   

16.
The seminal Cox’s proportional intensity model with multiplicative frailty is a popular approach to analyzing the frequently encountered recurrent event data in scientific studies. In the case of violating the proportional intensity assumption, the additive intensity model is a useful alternative. Both the additive and proportional intensity models provide two principal frameworks for studying the association between the risk factors and the disease recurrences. However, methodology development on the additive intensity model with frailty is lacking, although would be valuable. In this paper, we propose an additive intensity model with additive frailty to formulate the effects of possibly time-dependent covariates on recurrent events as well as to evaluate the intra-class dependence within recurrent events which is captured by the frailty variable. The asymptotic properties for both the regression parameters and the association parameters in frailty distribution are established. Furthermore, we also investigate the large-sample properties of the estimator for the cumulative baseline intensity function.  相似文献   

17.
本文根据山西省运城市1828名女职工2008年体检数据研究女性职工高血压的流行特征。(1)用交叉表的Pearson卡方检验方法对高血压病的相关因素进行了研究,结果表明,年龄、超重、肥胖、家族病史与高血压病有显著关系,而职业与高血压病无显著关系。(2)用回归分析方法对高血压患病率随年龄变化的规律进行研究,建立了患病率的统计模型。结果表明,从28岁起,年龄增加1岁,患高血压病的可能性增加0.8%。研究结果表明预防高血压病应加强体育锻炼。  相似文献   

18.
关于我国体质指数BMI的分布研究   总被引:7,自引:0,他引:7  
生活水平的提高,使肥胖症患的人数逐年增加。大量研究证明,肥胖是诱发高血压、冠心病、糖尿病、高脂血症等慢性病的一种主要危险因素,对肥胖症的预防是主要的。确定肥胖的一个简单而又有效的办法是利用世界卫生组织推荐的体质指数BMI(Body Mass Index)。本基于上海市延吉地区近万名30岁以上成年人的调查结果,对体质指数的分布进行了研究,并利用被污染的正态分布族模型对其进行了拟合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号