期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

金曼方易新赵林城《应用概率统计》2005,21(2):141-149

在一个删失回归模型("Tobit"模型)中,我们常常要研究如何选择重要的预报变量.本文提出了基于信息理论准则的两种变量选择程序,并建立了它们的相合性. 相似文献

2.

徐瑞锋方易新《应用概率统计》2004,20(4):384-392

Raoand Zhao(1992)提出了一种用随机加权的方法去逼近线性回归模型中M-估计的渐近分布。之前，Fang and zhao(2002)把这种方法推广到设计阵是随机的删失回归模型．本文，我们把这个结果推广到设计阵是非随机的删失回归模型，并证明该随机加权方法的一些大样本性质。相似文献

3.

二元选择分位回归的自适应LASSO改进

李楚进张翠霞《经济数学》2018,(2):89-97

为避免模型出现过拟合,将自适应LASSO变量选择方法引入二元选择分位回归模型,利用贝叶斯方法构建Gibbs抽样算法并在抽样中设置不影响预测结果的约束条件‖β‖=1以提高抽样值的稳定性.通过数值模拟,表明改进的模型有更为良好的参数估计效率、变量选择功能和分类能力. 相似文献

4.

半参数空间分位回归模型的估计与变量选择

胡亚南王金天田茂再《数理统计与管理》2022,(4):647-661

对于高维空间数据,利用半参数空间自回归进行建模,模型中会同时存在内生性、非线性、变量过多等问题。本文研究半参数空间分位回归模型,提出了新的估计程序:首先利用样条基函数,对模型中未知平滑函数进行逼近,解决非线性问题;然后运用特征向量空间滤波,将空间滞后因子转化为空间代理变量的线性组合,有效解决了内生性问题;利用再中心化影响函数,进行无条件分位回归建模,能够刻画不同分位水平下变量之间的关系;最后引入自适应Lasso惩罚,对高维线性部分进行变量选择,得到系数的稀疏估计,有效增强了模型的可解释性。数值模拟中对参数作不同的设置,展现了本文提出方法的有效性。最后,利用半参数空间分位回归模型分析了住房销售价格数据集。相似文献

5.

删失指标随机缺失下部分线性模型的稳健估计及变量选择

《高校应用数学学报(A辑)》2023,38(1)

相似文献

6.

右删失数据下半参数转移模型的变量选择方法研究

《数理统计与管理》2021,40(2):242-256

相似文献

7.

零膨胀泊松混合回归中的变量选择

王思洋高铭《应用数学学报》2023,(1):88-100

来源于不同总体的数据异质性较大,数据“零取值”较多且离散度大,可利用零膨胀泊松(ZIP)混合回归模型建模分析,然而混合模型中自变量较多.为了筛选出重要变量,本文利用自适应LASSO对ZIP混合回归模型进行变量选择,即在似然函数中加入惩罚项,再利用EM算法估计参数.通过模拟,验证了该方法在变量选择和参数估计中的有效性.同时,将ZIP混合回归模型应用于预测借贷失败次数的实际数据分析,筛选出对借贷失败有重要影响的因素.最后,通过比较各模型的预测效果,得到ZIP混合回归模型优于泊松(Poisson),负二项(NB)和ZIP回归模型. 相似文献

8.

缺失数据下超高维可加分位回归的变量筛选和选择

白永昕钱曼玲田茂再《数学学报》2024,(3):444-467

针对存在缺失数据的超高维可加分位回归模型,本文提出一种有效的变量筛选方法.具体而言,将典型相关分析的思想引入到最优变换的最大相关系数,通过协变量和模型残差最优变换后的最大相关系数重要变量的边际贡献进行排序,从而进行变量筛选.然后,在筛选的基础上,利用稀疏光滑惩罚进一步做变量选择.所提变量筛选方法有三点优势:(1)基于最优变换的最大相关可以更全面的反映响应变量对协变量的非线性依赖结构;(2)在迭代过程中利用残差可以获取模型的相关信息,从而提高变量筛选的准确度;(3)变量筛选过程和模型估计分开,可以避免对冗余协变量的回归.在适当的条件下,证明了变量筛选方法的确定性独立筛选性质以及稀疏光滑惩罚下估计量的稀疏性和相合性.同时,通过蒙特卡罗模拟给出了所提方法的表现并通过一组小鼠基因数据说明了所提方法的有效性. 相似文献

9.

固定效应空间自回归分位数模型的变量选择

刘宣陈建宝《数学学报》2023,(3):405-424

本文研究了固定效应空间自回归分位数模型的变量选择问题.通过惩罚压缩相关参数,达到了同时识别空间效应、估计未知参数和选择解释变量的目的.此外,给出了变量选择的实现算法并证明了惩罚估计量的大样本性质.数值模拟和实例分析均表明了所提方法的优良表现. 相似文献

10.

带有治愈亚组的区间删失数据的变量选择方法研究

蔡敏方李君李洪喜李树威《数理统计与管理》2023,(2):267-277

带有治愈亚组的区间删失数据常见于周期性随访或检查的医学研究中,此时研究总体中有一部分个体不会发生所感兴趣的事件,而对于每个发生所感兴趣事件的个体,其事件的发生时间落入某一时间区间内而非被精确地观测到。此外,在实际问题中,我们时常会遇到协变量维数较高的情形,而如何进行变量选择以识别出对疾病发生有重要影响的因素十分重要。本文研究带有治愈亚组的区间删失数据的变量选择问题,我们采用最小近似信息准则方法并提出一种惩罚期望极大化算法来同时实现变量选择和参数估计,所提出方法的一个重要优点是在变量选择过程中无须选择最优调节参数。通过数值模拟,我们比较所提出方法与一般的正则化方法如LASSO,ALASSO,以及SCAD在有限样本下的表现。结果表明,所提出方法有很高的变量选择准确率且在计算上比LASSO,ALASSO和SCAD更加快速、高效。最后,我们将所提出方法应用到一组有关于尼日利亚新生儿童死亡率的区间删失数据中。相似文献

11.

失混合效应模型的分位回归及变量选择

田玉柱李二倩田茂再罗幼喜《数学学报》2017,60(2):315-334

纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果．本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题．首先,逆删失概率加权方法被用来得到模型的参数估计．其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势．最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果．相似文献

12.

��ָ��λ��ع�ı��ѡ��

下载免费PDF全文

卢一强李锋胡斌《应用概率统计》2015,31(1):20-34

多元非参数分位数回归常常是难于估计的, 为了降低维数同时保持非参数估计的灵活性, 人们常常用单指标的方法模拟响应变量的条件分位数. 本文主要研究单指标分位数回归的变量选择. 以最小化平均损失估计为基础, 我们通过最小化具有SCAD惩罚项的平均损失进行变量选择和参数估计. 在正则条件下, 得到了单指标分位数回归SCAD变量选择的Oracle性质, 给出了SCAD变量选择的计算方法, 并通过模拟研究说明了本文所提方法变量选择的样本性质. 相似文献

13.

ɾʧ�ع�ģ��һ��LASSO�ͱ��ѡ��͹��Ʒ��

下载免费PDF全文

王占锋吴耀华赵林城《应用概率统计》2010,26(1):66-80

删失回归模型是一种很重要的模型,它在计量经济学中有着广泛的应用. 然而,它的变量选择问题在现今的参考文献中研究的比较少.本文提出了一个LASSO型变量选择和估计方法,称之为多样化惩罚$L_1$限制方法, 简称为DPLC. 另外,我们给出了非0回归系数估计的大样本渐近性质. 最后,大量的模拟研究表明了DPLC方法和一般的最优子集选择方法在变量选择和估计方面有着相同的能力. 相似文献

14.

A New Approach to Censored Quantile Regression Estimation

Xiaorong Yang Naveen Naidu Narisetty Xuming He 《Journal of computational and graphical statistics》2018,27(2):417-425

Quantile regression provides an attractive tool to the analysis of censored responses, because the conditional quantile functions are often of direct interest in regression analysis, and moreover, the quantiles are often identifiable while the conditional mean functions are not. Existing methods of estimation for censored quantiles are mostly limited to singly left- or right-censored data, with some attempts made to extend the methods to doubly censored data. In this article, we propose a new and unified approach, based on a variation of the data augmentation algorithm, to censored quantile regression estimation. The proposed method adapts easily to different forms of censoring including doubly censored and interval censored data, and somewhat surprisingly, the resulting estimates improve on the performance of the best known estimators with singly censored data. Supplementary material for this article is available online. 相似文献

15.

Composite Quantile Regression Estimation for Left Censored Response Longitudinal Data

Li-qun Xiao Zhan-feng Wang Yao-hua Wu 《应用数学学报(英文版)》2018,34(4):730-741

For left censored response longitudinal data, we propose a composite quantile regression estimator (CQR) of regression parameter. Statistical properties such as consistency and asymptotic normality of CQR are studied under relaxable assumptions of correlation structure of error terms. The performance of CQR is investigated via simulation studies and a real dataset analysis. 相似文献

16.

��Է�λ��ع�ģ�͵Ĺ��߱��

�ؾ� ��Ⱥ 《应用概率统计》2017,33(5):475-486

We extend the instrumental variable method for the mean regression models to linear quantile regression models with errors-in-variables. The proposed estimator is consistent and asymptotically normally distributed under some fairly general conditions. Moreover, this approach is practical and easy to implement. Simulation studies show that the finite sample performance of the estimator is satisfactory. The method is applied to a real data study of education and wages. 相似文献

17.

线性回归模型中变量选择方法综述 总被引：7，自引：1，他引：7

王大荣张忠占《数理统计与管理》2010,29(4)

变量选择是统计分析与推断中的重要内容,也是当今研究的热点课题。本文系统介绍了线性回归模型中变量选择的研究概况和最新进展,并指出了有待进一步研究的问题。相似文献

18.

Fast Implementation for Normal Mixed Effects Models With Censored Response

《Journal of computational and graphical statistics》2013,22(4):797-817

We propose an EM algorithm for computing the maximum likelihood and restricted maximum likelihood for linear and nonlinear mixed effects models with censored response. In contrast with previous developments, this algorithm uses closed-form expressions at the E-step, as opposed to Monte Carlo simulation. These expressions rely on formulas for the mean and variance of a truncated multinormal distribution, and can be computed using available software. This leads to an improvement in the speed of computation of up to an order of magnitude. A wide class of mixed effects models is considered, including the Laird–Ware model, and extensions to different structures for the variance components, heteroscedastic and autocorrelated errors, and multilevel models. We apply the methodology to two case studies from our own biostatistical practice, involving the analysis of longitudinal HIV viral load in two recent AIDS studies.

The proposed algorithm is implemented in the R package lmec. An appendix which includes further mathematical details, the R code, and datasets for examples and simulations are available as the online supplements. 相似文献