首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
郑明  郁文 《应用概率统计》2010,26(2):123-137
在很多实际应用中,个体寿命时间可能被同时左截断与右截断.本文在左右截断变量都能被观察到的假设下,提出了一种半参数推断方法,来分析协变量对于相应寿命时间或其某种变换的中位数的影响,并讨论了所得估计量的渐近性质.此外,本文还提供了一种基于经验似然的回归参数推断方法,并讨论了将这些方法推广到经典双侧截断数据的可能性.一些模拟计算被用于展示这些方法的有效性.  相似文献   

2.
生长曲线模型是一个典型的多元线性模型, 在现代统计学上占有重要地位. 文章首先基于Potthoff-Roy变换后的生长曲线模型, 采用自适应LASSO为惩罚函数给出了参数矩阵的惩罚最小二乘估计, 实现了变量的选择. 其次, 基于局部渐近二次估计, 对生长曲线模型的惩罚最小二乘估计给出了统一的近似估计表达式. 接着, 讨论了经过Potthoff-Roy变换后模型的惩罚最小二乘估计, 证明了自适应LASSO具有Oracle性质. 最后对几种变量选择方法进行了数据模拟. 结果表明自适应LASSO效果比较好. 另外, 综合考虑, Potthoff-Roy变换优于拉直变换.  相似文献   

3.
本文结合复合分位数回归和自适应LASSO惩罚方法为固定效应面板数据模型提供了一种稳健变量选择过程。先通过正向正交偏差变换消除固定效应,再利用自适应LASSO构造惩罚复合分位数回归目标函数,进而同时进行回归系数的估计和变量选择。在一些正则条件下,证明了所提出的估计具有Orcale性质。该方法不仅消除了固定效应对估计的影响,而且具有稳健性。模拟研究了所提出方法的有限样本性质并将其应用于实际数据分析。  相似文献   

4.
来源于不同总体的数据异质性较大,数据“零取值”较多且离散度大,可利用零膨胀泊松(ZIP)混合回归模型建模分析,然而混合模型中自变量较多.为了筛选出重要变量,本文利用自适应LASSO对ZIP混合回归模型进行变量选择,即在似然函数中加入惩罚项,再利用EM算法估计参数.通过模拟,验证了该方法在变量选择和参数估计中的有效性.同时,将ZIP混合回归模型应用于预测借贷失败次数的实际数据分析,筛选出对借贷失败有重要影响的因素.最后,通过比较各模型的预测效果,得到ZIP混合回归模型优于泊松(Poisson),负二项(NB)和ZIP回归模型.  相似文献   

5.
变量选择是统计建模中重要的问题。当试验数据维数很高时,传统变量选择方法的应用受到了很多制约。本文以高维混料试验为基础,比较了AIC准则和LASSO在变量选择问题上的优良性。通过实例验证,LASSO可以快速且准确地对高维混料模型中的变量进行筛选,从而得出最优模型,达到降低成本、提高利益的目的。  相似文献   

6.
本文研究测量误差模型的自适应LASSO(least absolute shrinkage and selection operator)变量选择和系数估计问题.首先分别给出协变量有测量误差时的线性模型和部分线性模型自适应LASSO参数估计量,在一些正则条件下研究估计量的渐近性质,并且证明选择合适的调整参数,自适应LASSO参数估计量具有oracle性质.其次讨论估计的实现算法及惩罚参数和光滑参数的选择问题.最后通过模拟和一个实际数据分析研究了自适应LASSO变量选择方法的表现,结果表明,变量选择和参数估计效果良好.  相似文献   

7.
部分线性单指标模型的复合分位数回归及变量选择   总被引:1,自引:0,他引:1       下载免费PDF全文
本文提出复合最小化平均分位数损失估计方法 (composite minimizing average check loss estimation,CMACLE)用于实现部分线性单指标模型(partial linear single-index models,PLSIM)的复合分位数回归(composite quantile regression,CQR).首先基于高维核函数构造参数部分的复合分位数回归意义下的相合估计,在此相合估计的基础上,通过采用指标核函数进一步得到参数和非参数函数的可达最优收敛速度的估计,并建立所得估计的渐近正态性,比较PLSIM的CQR估计和最小平均方差估计(MAVE)的相对渐近效率.进一步地,本文提出CQR框架下PLSIM的变量选择方法,证明所提变量选择方法的oracle性质.随机模拟和实例分析验证了所提方法在有限样本时的表现,证实了所提方法的优良性.  相似文献   

8.
何晓霞  徐伟  李缓  吴传菊 《数学杂志》2017,37(5):1101-1110
本文研究了基于面板数据的分位数回归模型的变量选择问题.通过增加改进的自适应Lasso惩罚项,同时实现了固定效应面板数据的分位数回归和变量选择,得到了模型中参数的选择相合性和渐近正态性.随机模拟验证了该方法的有效性.推广了文献[14]的结论.  相似文献   

9.
为避免模型出现过拟合,将自适应LASSO变量选择方法引入二元选择分位回归模型,利用贝叶斯方法构建Gibbs抽样算法并在抽样中设置不影响预测结果的约束条件‖β‖=1以提高抽样值的稳定性.通过数值模拟,表明改进的模型有更为良好的参数估计效率、变量选择功能和分类能力.  相似文献   

10.
与传统的的媒体营销模式相比,搜索引擎广告因其精准和投入低等特点获得巨大成功。但已有的搜索引擎广告点击率模型不能有效解决数据量大及特征维度高的问题,使预测结果的准确性大打折扣。本文构建了一种基于LASSO变量选择方法的广告点击率预测模型,能有效克服现有广告点击率模型在处理数据高维性和稀疏性方面的不足。利用某公司的竞价数据对模型进行验证,结果表明影响广告点击率的关键因素是广告关键词中的商标信息、地域信息和每点击成本。该研究结果为企业制定搜索引擎广告营销策略提供一定的理论依据。  相似文献   

11.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

12.
本文考虑截断回归模型,给出了基于截断数据估计回归参数的一种新方法,此处并不设定残差分布.我们使用早先的关于误差分布非参数估计的结果,在某些正则条件下建立了估计量的相合性.并给出实例说明我们的结果是Heckman(1979)-项工作的本质改进.  相似文献   

13.
针对高维强相关数据的变量选择问题,本文提出了改进的变量选择方法.该方法先利用自适应弹性网方法(Aenet)在原始的强相关数据上建立模型,选出对响应变量起重要作用的群组变量和独立变量;再通过偏最小二乘方法(PLS)对选出的变量作模型估计;最后,将两种方法得到的估计系数做线性组合,并以此系数来建立回归模型.新模型具有精度高、解释性好的优点,数值实验验证了该方法的有效性.  相似文献   

14.
15.
随着大数据时代的到来,在经济学、金融学和生物医学等众多研究领域中频繁收集到高维数据.高维数据的特征之一是变量维数p随着样本量n的增加而变大且通常会超过样本量,同时,异常值也容易出现在高维数据中.因此,如何克服异常值给高维统计推断带来的影响,从而得到更精确的模型,是目前统计学研究的热点问题之一.本文是对高维线性模型下的稳健变量选择方法进行综述.具体地,首先介绍评估稳健性的三个指标:影响函数、崩溃点和最大偏差.其次着重介绍了稳健变量选择方法,包括响应变量含有异常值,响应变量和协变量都含有异常值,高崩溃点且高效的变量选择方法.紧接着介绍相关算法,通过模拟和实例比较不同变量选择方法.最后,简要探讨了高维稳健有效变量选择方法存在的问题及未来的可能发展方向.  相似文献   

16.
郑明  李四化 《应用数学》2004,17(4):524-529
本文讨论了在带有截断情况的线性回归模型中 ,响应变量均值的估计问题 .将经验似然的方法应用到带有截断情况的回归模型中 ,在估计响应变量的均值时构造了调整的经验似然统计量 ,证明了在一定的条件下 ,该统计量渐近服从 χ2 分布 ,给出了均值的置信区间 ,并与正态下得到的结果进行了比较 ,模拟的结果说明了经验似然的优良性 .  相似文献   

17.
本文提出一种基于Fiducial推断的模型不确定度量,给出基于Fiducial边际似然的高维线性回归变量选择方法改进ε-容许集(ε-admissible set, EAS)方法.在传统的稀疏性假设下,本文证明该方法所选择的最优模型具有相合性.此外,本文还建议使用一种快速的算法来挑选阈值参数.本文通过模拟研究验证了所提出方法的优越性,并使用所提出的方法分析了一个真实数据案例.  相似文献   

18.
王启华 《中国科学A辑》1995,38(8):819-832
对固定设计下的半参数回归模型 Yi=xiβ+g(ti)+εi,i=1,2,…,n,当Yi因受某种随机干扰而被右截断时,分别就截断分布已知与未知两种情形,利用所获的截断观察定义了参数β和回归函数g(·)的估计,并证明了它们均具有强相合性与P(≥2)阶平均相合性.  相似文献   

19.
高维回归分析的变量选择问题是目前统计学研究的一个热点和难点问题.提出了一个基于条件分布函数的相关性度量准则,并在此基础上提出三种变量选择方法.与现有的方法相比,提出的方法不依赖于统计模型,可以适用于线性模型和非参数可加模型.数值模拟结果表明,即使协变量之间存在一定的相关性,方法也有较为满意的表现.  相似文献   

20.
刘宣  陈建宝 《数学学报》2023,(3):405-424
本文研究了固定效应空间自回归分位数模型的变量选择问题.通过惩罚压缩相关参数,达到了同时识别空间效应、估计未知参数和选择解释变量的目的.此外,给出了变量选择的实现算法并证明了惩罚估计量的大样本性质.数值模拟和实例分析均表明了所提方法的优良表现.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号