共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
生长曲线模型是一个典型的多元线性模型,
在现代统计学上占有重要地位. 文章首先基于Potthoff-Roy变换后的生长曲线模型,
采用自适应LASSO为惩罚函数给出了参数矩阵的惩罚最小二乘估计,
实现了变量的选择. 其次, 基于局部渐近二次估计,
对生长曲线模型的惩罚最小二乘估计给出了统一的近似估计表达式. 接着,
讨论了经过Potthoff-Roy变换后模型的惩罚最小二乘估计,
证明了自适应LASSO具有Oracle性质. 最后对几种变量选择方法进行了数据模拟.
结果表明自适应LASSO效果比较好. 另外, 综合考虑,
Potthoff-Roy变换优于拉直变换. 相似文献
3.
4.
来源于不同总体的数据异质性较大,数据“零取值”较多且离散度大,可利用零膨胀泊松(ZIP)混合回归模型建模分析,然而混合模型中自变量较多.为了筛选出重要变量,本文利用自适应LASSO对ZIP混合回归模型进行变量选择,即在似然函数中加入惩罚项,再利用EM算法估计参数.通过模拟,验证了该方法在变量选择和参数估计中的有效性.同时,将ZIP混合回归模型应用于预测借贷失败次数的实际数据分析,筛选出对借贷失败有重要影响的因素.最后,通过比较各模型的预测效果,得到ZIP混合回归模型优于泊松(Poisson),负二项(NB)和ZIP回归模型. 相似文献
5.
6.
本文研究测量误差模型的自适应LASSO(least absolute shrinkage and selection operator)变量选择和系数估计问题.首先分别给出协变量有测量误差时的线性模型和部分线性模型自适应LASSO参数估计量,在一些正则条件下研究估计量的渐近性质,并且证明选择合适的调整参数,自适应LASSO参数估计量具有oracle性质.其次讨论估计的实现算法及惩罚参数和光滑参数的选择问题.最后通过模拟和一个实际数据分析研究了自适应LASSO变量选择方法的表现,结果表明,变量选择和参数估计效果良好. 相似文献
7.
本文提出复合最小化平均分位数损失估计方法 (composite minimizing average check loss estimation,CMACLE)用于实现部分线性单指标模型(partial linear single-index models,PLSIM)的复合分位数回归(composite quantile regression,CQR).首先基于高维核函数构造参数部分的复合分位数回归意义下的相合估计,在此相合估计的基础上,通过采用指标核函数进一步得到参数和非参数函数的可达最优收敛速度的估计,并建立所得估计的渐近正态性,比较PLSIM的CQR估计和最小平均方差估计(MAVE)的相对渐近效率.进一步地,本文提出CQR框架下PLSIM的变量选择方法,证明所提变量选择方法的oracle性质.随机模拟和实例分析验证了所提方法在有限样本时的表现,证实了所提方法的优良性. 相似文献
8.
9.
为避免模型出现过拟合,将自适应LASSO变量选择方法引入二元选择分位回归模型,利用贝叶斯方法构建Gibbs抽样算法并在抽样中设置不影响预测结果的约束条件‖β‖=1以提高抽样值的稳定性.通过数值模拟,表明改进的模型有更为良好的参数估计效率、变量选择功能和分类能力. 相似文献
10.
与传统的的媒体营销模式相比,搜索引擎广告因其精准和投入低等特点获得巨大成功。但已有的搜索引擎广告点击率模型不能有效解决数据量大及特征维度高的问题,使预测结果的准确性大打折扣。本文构建了一种基于LASSO变量选择方法的广告点击率预测模型,能有效克服现有广告点击率模型在处理数据高维性和稀疏性方面的不足。利用某公司的竞价数据对模型进行验证,结果表明影响广告点击率的关键因素是广告关键词中的商标信息、地域信息和每点击成本。该研究结果为企业制定搜索引擎广告营销策略提供一定的理论依据。 相似文献
11.
12.
本文考虑截断回归模型,给出了基于截断数据估计回归参数的一种新方法,此处并不设定残差分布.我们使用早先的关于误差分布非参数估计的结果,在某些正则条件下建立了估计量的相合性.并给出实例说明我们的结果是Heckman(1979)-项工作的本质改进. 相似文献
13.
15.
随着大数据时代的到来,在经济学、金融学和生物医学等众多研究领域中频繁收集到高维数据.高维数据的特征之一是变量维数p随着样本量n的增加而变大且通常会超过样本量,同时,异常值也容易出现在高维数据中.因此,如何克服异常值给高维统计推断带来的影响,从而得到更精确的模型,是目前统计学研究的热点问题之一.本文是对高维线性模型下的稳健变量选择方法进行综述.具体地,首先介绍评估稳健性的三个指标:影响函数、崩溃点和最大偏差.其次着重介绍了稳健变量选择方法,包括响应变量含有异常值,响应变量和协变量都含有异常值,高崩溃点且高效的变量选择方法.紧接着介绍相关算法,通过模拟和实例比较不同变量选择方法.最后,简要探讨了高维稳健有效变量选择方法存在的问题及未来的可能发展方向. 相似文献
16.
本文讨论了在带有截断情况的线性回归模型中 ,响应变量均值的估计问题 .将经验似然的方法应用到带有截断情况的回归模型中 ,在估计响应变量的均值时构造了调整的经验似然统计量 ,证明了在一定的条件下 ,该统计量渐近服从 χ2 分布 ,给出了均值的置信区间 ,并与正态下得到的结果进行了比较 ,模拟的结果说明了经验似然的优良性 . 相似文献
17.
18.
对固定设计下的半参数回归模型 Yi=xiβ+g(ti)+εi,i=1,2,…,n,当Yi因受某种随机干扰而被右截断时,分别就截断分布已知与未知两种情形,利用所获的截断观察定义了参数β和回归函数g(·)的估计,并证明了它们均具有强相合性与P(≥2)阶平均相合性. 相似文献
19.
高维回归分析的变量选择问题是目前统计学研究的一个热点和难点问题.提出了一个基于条件分布函数的相关性度量准则,并在此基础上提出三种变量选择方法.与现有的方法相比,提出的方法不依赖于统计模型,可以适用于线性模型和非参数可加模型.数值模拟结果表明,即使协变量之间存在一定的相关性,方法也有较为满意的表现. 相似文献
20.
本文研究了固定效应空间自回归分位数模型的变量选择问题.通过惩罚压缩相关参数,达到了同时识别空间效应、估计未知参数和选择解释变量的目的.此外,给出了变量选择的实现算法并证明了惩罚估计量的大样本性质.数值模拟和实例分析均表明了所提方法的优良表现. 相似文献