共查询到20条相似文献,搜索用时 55 毫秒
1.
数据缺失在实际应用中普遍存在,数据缺失会降低研究效率,导致参数估计有偏.在协变量随机缺失(MAR)的假定下,本文基于众数回归和逆概率加权估计方法对线性模型进行参数估计.该方法结合参数Logistic回归和非参数Nadaraya-Watson估计两种倾向得分估计方法,分别构建IPWM-L估计量和IPWM-NW估计量.模拟研究和实例分析表明,众数回归模型比均值回归模型更具稳健性,逆概率加权众数(IPWM)估计方法在缺失数据下表现出了更好的拟合效果,与IPWM-L估计量相比, IPWM-NW估计量更稳健. 相似文献
2.
3.
针对存在缺失数据的超高维可加分位回归模型,本文提出一种有效的变量筛选方法.具体而言,将典型相关分析的思想引入到最优变换的最大相关系数,通过协变量和模型残差最优变换后的最大相关系数重要变量的边际贡献进行排序,从而进行变量筛选.然后,在筛选的基础上,利用稀疏光滑惩罚进一步做变量选择.所提变量筛选方法有三点优势:(1)基于最优变换的最大相关可以更全面的反映响应变量对协变量的非线性依赖结构;(2)在迭代过程中利用残差可以获取模型的相关信息,从而提高变量筛选的准确度;(3)变量筛选过程和模型估计分开,可以避免对冗余协变量的回归.在适当的条件下,证明了变量筛选方法的确定性独立筛选性质以及稀疏光滑惩罚下估计量的稀疏性和相合性.同时,通过蒙特卡罗模拟给出了所提方法的表现并通过一组小鼠基因数据说明了所提方法的有效性. 相似文献
4.
《数学的实践与认识》2016,(24)
基于逆概率加权方法研究了响应变量缺失下非线性回归模型的参数估计问题,提出了一种利用广义部分线性单指标模型对选择概率建模的加权半参数估计方法.从理论上证明了所得估计量具有渐近正态性,并通过数据模拟分析研究了所提方法在有限样本下的表现. 相似文献
5.
对于高维空间数据,利用半参数空间自回归进行建模,模型中会同时存在内生性、非线性、变量过多等问题。本文研究半参数空间分位回归模型,提出了新的估计程序:首先利用样条基函数,对模型中未知平滑函数进行逼近,解决非线性问题;然后运用特征向量空间滤波,将空间滞后因子转化为空间代理变量的线性组合,有效解决了内生性问题;利用再中心化影响函数,进行无条件分位回归建模,能够刻画不同分位水平下变量之间的关系;最后引入自适应Lasso惩罚,对高维线性部分进行变量选择,得到系数的稀疏估计,有效增强了模型的可解释性。数值模拟中对参数作不同的设置,展现了本文提出方法的有效性。最后,利用半参数空间分位回归模型分析了住房销售价格数据集。 相似文献
6.
家庭收入和医疗保健一直是备受广泛关注的民生问题。本文借助2015年中国健康与养老追踪调查(China Health and Retirement Longitudinal Study,CHARLS)的部分数据,构建非参数逆概率加权分位数回归模型,旨在通过原理简单、易于实现且统计性质(尤其是无偏性)良好的非参数逆概率加权法,解决因变量和自变量均存在随机缺失的问题,研究中老年家庭收入与医疗保健问题,以期为推动中国医药卫生体制改革、优化全国人民消费结构、提高中老年群体健康状况和生活质量提供一定借鉴。 相似文献
7.
文章考虑协变量含有测量误差的变系数模型,为了消除测量误差的影响,在估计过程中引入工具变量,利用工具变量对含有测量误差的协变量进行校正.为了获得稳健估计,利用分位数回归方法得到不同分位点上系数函数的估计.在一些正则条件下,证明了所提出的估计的渐近正态性.模拟研究比较了Naive估计,基于工具变量校正的分位数回归估计(IVQR)以及基于工具变量校正的最小二乘估计(IVLS),模拟结果表明文章提出的方法优于已有的方法.最后采用文章提出的方法对中国农村居民的金融资产余额的影响因素进行了分析,结果表明住户债务余额系数呈现U型变化,家庭收入系数呈现倒U型变化. 相似文献
8.
针对传统面板协整检验在建模过程中易受异常值影响以及其原假设设置的主观选择问题,本文利用动态公共因子刻画面板数据潜在的截面相关结构,提出基于动态因子的截面相关结构的贝叶斯分位面板协整检验,结合各个主要分位数水平下参数的条件后验分布,设计结合卡尔曼滤波的Gibbs抽样算法,进行贝叶斯分位面板协整检验;并进行Monte Carlo仿真实验验证贝叶斯分位面板协整检验的可行性与有效性。同时,采用中国各省金融发展和经济增长的面板数据进行实证研究,结果发现在各主要分位数水平下中国金融发展和经济增长之间具有协整关系。研究结果表明:贝叶斯分位面板协整检验方法避免了传统面板数据协整方法由于原假设设置不同而发生误判的问题,克服了异常值的影响,能够提供全面准确的模型参数估计和协整检验结果。 相似文献
9.
混合时空地理加权回归模型作为一种有效处理空间数据全局平稳和局部非平稳的分析方法得到了广泛的应用.但其参数估计方法中假定固定系数变量已知且不存在时空效应,这一较强的前提使回归系数的估计值变得极不稳定.为探究当固定系数变量存在时空效应时的参数估计方法,本文提出一种变量选择(Variable Selection)方法来剔除指标间的交互效应,并给出相应的算法过程.通过乌鲁木齐市商品住宅真实价格数据对不同估计方法进行对比验证,结果表明,利用变量选择方法后得到的MGTWR模型性能和拟合效果得到提升,固定回归系数的估计更加稳定,原有参数估计方法得到改善. 相似文献
10.
在响应变量带有单调缺失的情形下考虑高维纵向线性回归模型的变量选择.主要基于逆概率加权广义估计方程提出了一种自动的变量选择方法,该方法不使用现有的惩罚函数,不涉及惩罚函数非凸最优化的问题,并且可以自动地剔除零回归系数,同时得到非零回归系数的估计.在一定正则条件下,证明了该变量选择方法具有Oracle性质.最后,通过模拟研究验证了所提出方法的有限样本性质. 相似文献
11.
12.
Zhiwei Zhang Howard E. Rockette 《Annals of the Institute of Statistical Mathematics》2006,58(4):687-706
We consider parameter estimation in parametric regression models with covariates missing at random. This problem admits a
semiparametric maximum likelihood approach which requires no parametric specification of the selection mechanism or the covariate
distribution. The semiparametric maximum likelihood estimator (MLE) has been found to be consistent. We show here, for some
specific models, that the semiparametric MLE converges weakly to a zero-mean Gaussian process in a suitable space. The regression
parameter estimate, in particular, achieves the semiparametric information bound, which can be consistently estimated by perturbing
the profile log-likelihood. Furthermore, the profile likelihood ratio statistic is asymptotically chi-squared. The techniques
used here extend to other models. 相似文献
13.
14.
本文应用最优化理论,对固定效应的面板数据分位数回归模型,提出一种模式搜索方法,此方法可以同时估计出所有分位点处的解释变量系数和所有个体的固定效应值。进一步利用蒙特卡洛模拟比较现有文献中涉及的面板数据分位数回归方法,结果显示无论误差项是否满足经典假设,模式搜索分位数回归法较之其他分位数回归估计方法更为有效. 相似文献
15.
分位数的估计在生物医学、社会经济调查等领域有着广泛的应用,然而在实际问题的研究中,往往由于各种人为或不可控因素造成数据收集不完全.本文在随机缺失(MAR)假设条件下,利用非参数核补法和局部多重插补法给出了响应变量缺失时样本分位数的估计,并利用经验过程等理论证明了由这两种方法得到的分位数估计的大样本性质,同时,使用重抽样方法给出了估计的渐近方差的估计,模拟结果验证了这两种方法的有效性.文章所提两种方法的优点在于:首先,所提出的缺失修正方法不需要对缺失概率的模型做任何假设;其次,方法亦适用于其他有关参数不可微的估计目标函数;最后,方法很容易地推广到一般M估计的情况,并可以对多个分位数同时进行估计. 相似文献
16.
《Journal of computational and graphical statistics》2013,22(3):497-513
The SiZer methodology proposed by Chaudhuri and Marron (1999) is a valuable tool for conducting exploratory data analysis. Since its inception different versions of SiZer have been proposed in the literature. Most of these SiZer variants are targeting the mean structure of the data, and are incapable of providing any information about the quantile composition of the data. To fill this need, this article proposes a quantile version of SiZer for the regression setting. By inspecting the SiZer maps produced by this new SiZer, real quantile structures hidden in a dataset can be more effectively revealed, while at the same time spurious features can be filtered out. The utility of this quantile SiZer is illustrated via applications to both real data and simulated examples. This article has supplementary material online. 相似文献
17.
Composite quantile regression model with measurement error is considered. The SIMEX estimators of the unknown regression coefficients are proposed based on the composite quantile regression. The proposed estimators not only eliminate the bias caused by measurement error, but also retain the advantages of the composite quantile regression estimation. The asymptotic properties of the SIMEX estimation are proved under some regular conditions. The finite sample
properties of the proposed method are studied by a simulation study, and a real example is analyzed. 相似文献
18.
??Composite quantile regression model with measurement error is considered. The SIMEX estimators of the unknown regression coefficients are proposed based on the composite quantile regression. The proposed estimators not only eliminate the bias caused by measurement error, but also retain the advantages of the composite quantile regression estimation. The asymptotic properties of the SIMEX estimation are proved under some regular conditions. The finite sample
properties of the proposed method are studied by a simulation study, and a real example is analyzed. 相似文献
19.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果. 相似文献
20.
This paper studies estimation in functional partial
linear composite quantile regression model in which the dependent variable
is related to both a function-valued random variable in linear form and a
real-valued random variable in nonparametric form. The functional principal
component analysis and regression splines are employed to estimate the slope
function and the nonparametric function respectively, and the convergence
rates of the estimators are obtained under some regularity conditions.
Simulation studies and a real data example are presented for illustration
of the performance of the proposed estimators. 相似文献