期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

闫懋博田茂再《系统科学与数学》2020,(1):141-155

在使用变量选择方法选出模型后,如何评价模型中变量系数的显著性是统计学重点关注的前沿问题之一.文章从适应性Lasso变量选择方法的选择结果出发,在考虑实践中误差分布多样性的前提下,基于选择事件构造了模型保留变量系数的条件检验统计量,并给出了该统计量的一致收敛性质的证明过程.模拟研究显示,在多种误差分布下所提方法均可进一步优化变量选择结果,有较强的实用价值.应用此方法对CEPS学生数据进行了实证分析,最终选取了学生认知能力等10个变量作为影响中学生成绩的主要因素,为相关研究提供了有益的参考. 相似文献

2.

改进的强相关数据的变量选择方法

徐若南唐烁王旭辉《大学数学》2017,33(1):10-16

针对高维强相关数据的变量选择问题,本文提出了改进的变量选择方法.该方法先利用自适应弹性网方法(Aenet)在原始的强相关数据上建立模型,选出对响应变量起重要作用的群组变量和独立变量;再通过偏最小二乘方法(PLS)对选出的变量作模型估计;最后,将两种方法得到的估计系数做线性组合,并以此系数来建立回归模型.新模型具有精度高、解释性好的优点,数值实验验证了该方法的有效性. 相似文献

3.

空间非参回归的变量选择

《中国科学:数学》2016,(3)

空间变系数回归模型是空间线性回归模型的重要推广,在实际中有广泛的应用.然而,这个模型的变量选择问题还没有解决.本文通过一般的M型损失函数将均值回归、中位数回归、分位数回归和稳健均值回归纳入同一框架下,然后基于B样条近似,提出一个能够同时进行变量选择和函数系数估计的自适应组内(adaptive group)L_r(r≥1)范数惩罚的M型估计量.新方法有几个显著的特点:(1)对异常点和重尾分布稳健;(2)能够兼容异方差性,允许显著变量集合随所考虑的分位点不同而变化;(3)兼顾了估计量的有效性和稳健性.在较弱假设条件下,建立了变量选择的oracle性质.随机模拟和实例分析验证了所提方法在有限样本时的表现. 相似文献

4.

分位数变系数模型基于核光滑的变量选择

下载免费PDF全文

赵为华张日权刘吉彩《应用概率统计》2014,30(5):537-560

分位数变系数模型是一种稳健的非参数建模方法.使用变系数模型分析数据时,一个自然的问题是如何同时选择重要变量和从重要变量中识别常数效应变量.本文基于分位数方法研究具有稳健和有效性的估计和变量选择程序.利用局部光滑和自适应组变量选择方法,并对分位数损失函数施加双惩罚,我们获得了惩罚估计.通过BIC准则合适地选择调节参数,提出的变量选择方法具有oracle理论性质,并通过模拟研究和脂肪实例数据分析来说明新方法的有用性.数值结果表明,在不需要知道关于变量和误差分布的任何信息前提下,本文提出的方法能够识别不重要变量同时能区分出常数效应变量. 相似文献

5.

删失分位数变系数回归模型的FIC模型平均估计（英文）

《系统科学与数学》2018,(7)

考虑了删失分位数变系数回归模型的FIC准则,并基于FIC准则给出了兴趣参数的模型选择和平均估计.为了全面反映响应变量的分布信息,克服异常值和重尾模型误差,文章对响应变量的不同分位数水平进行建模,因此与普通最小二乘方法相比更为稳健.在较为一般的条件下,证明了所提估计的渐近性质,通过模拟实验研究了估计的有限样本性质,用所提方法分析了手机用户的游戏时间数据. 相似文献

6.

竞争风险数据和协变量相依权重下可加可乘的子分布风险率模型

李婉星龙永红薛清水《数学学报》2018,61(3):353-374

本文在竞争风险数据下提出一种灵活的含变系数的可加可乘的子分布风险率模型.通过对删失时间的风险函数建立Cox比例风险模型,得到调整后的与协变量相依的权重,在新权重下建立估计方程来估计模型参数,并获得了估计的大样本性质,同时提出了模型中协变量的时变效应的检验方法.通过数值模拟验证了所提方法的有限样本性质,结果表明所提方法可以大大降低估计偏差.最后,分析了一组淋巴滤泡细胞的竞争风险数据集来展示所提方法的实际应用效果. 相似文献

7.

半参数变系数部分线性模型的统计推断

下载免费PDF全文

赵培信《中国科学:数学》2013,43(7):635-646

本文在多种复杂数据下, 研究一类半参数变系数部分线性模型的统计推断理论和方法. 首先在纵向数据和测量误差数据等复杂数据下, 研究半参数变系数部分线性模型的经验似然推断问题, 分别提出分组的和纠偏的经验似然方法. 该方法可以有效地处理纵向数据的组内相关性给构造经验似然比函数所带来的困难. 其次在测量误差数据和缺失数据等复杂数据下, 研究模型的变量选择问题, 分别提出一个“纠偏” 的和基于借补值的变量选择方法. 该变量选择方法可以同时选择参数分量及非参数分量中的重要变量, 并且变量选择与回归系数的估计同时进行. 通过选择适当的惩罚参数, 证明该变量选择方法可以相合地识别出真实模型, 并且所得的正则估计具有oracle 性质. 相似文献

8.

测量误差模型的自适应LASSO变量选择方法研究

下载免费PDF全文

李锋 ;盖玉洁 ;卢一强《中国科学:数学》2014,44(9):983-1006

本文研究测量误差模型的自适应LASSO(least absolute shrinkage and selection operator)变量选择和系数估计问题.首先分别给出协变量有测量误差时的线性模型和部分线性模型自适应LASSO参数估计量,在一些正则条件下研究估计量的渐近性质,并且证明选择合适的调整参数,自适应LASSO参数估计量具有oracle性质.其次讨论估计的实现算法及惩罚参数和光滑参数的选择问题.最后通过模拟和一个实际数据分析研究了自适应LASSO变量选择方法的表现,结果表明,变量选择和参数估计效果良好. 相似文献

9.

基于工具变量的变系数测量误差模型的分位数回归估计

杨宜平林静怡赵培信《系统科学与数学》2023,(3):797-811

文章考虑协变量含有测量误差的变系数模型,为了消除测量误差的影响,在估计过程中引入工具变量,利用工具变量对含有测量误差的协变量进行校正.为了获得稳健估计,利用分位数回归方法得到不同分位点上系数函数的估计.在一些正则条件下,证明了所提出的估计的渐近正态性.模拟研究比较了Naive估计,基于工具变量校正的分位数回归估计(IVQR)以及基于工具变量校正的最小二乘估计(IVLS),模拟结果表明文章提出的方法优于已有的方法.最后采用文章提出的方法对中国农村居民的金融资产余额的影响因素进行了分析,结果表明住户债务余额系数呈现U型变化,家庭收入系数呈现倒U型变化. 相似文献

10.

我国居民医疗负担及其影响因素分析——基于弹性网方法的实证研究

王沛立李恩平《数学的实践与认识》2019,(14)

以2006-2016年31个省份的居民家庭人均医疗保健消费支出为研究对象,从人口健康、经济、卫生条件、环境、教育、医疗资源要素成本和政策七大方面选取了19个影响因素,运用弹性网对影响我国居民医疗负担的因素变量进行筛选压缩,并选用逐步回归、Lasso模型和自适应Lasso模型作为对比,最终得出9个较为重要的变量,进行参数估计,最后对模型的准确率进行预测,结果表明:政府干预程度对我国居民医疗负担的影响最大;弹性网在变量选择和模型预测方面更优. 相似文献