首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
现有对回归模型的研究大多仅限于直接观测的解释变量,忽略数据的测量误差将增加模型参数的估计偏差.目前关于测量误差模型的研究主要集中在回归误差服从正态分布的假设,这种假设不适用于研究非对称的数据.对于偏斜数据,众数的代表性优于均值和中位数.本文基于测量误差数据介绍了偏正态众数回归模型,并通过EM算法估计了模型的参数.模拟研究的结果表明,协变量带测量误差下的众数回归比均值回归有更好的表现.通过实例分析进一步表明了所提出模型和方法的有效性.  相似文献   

2.
针对现实生活中大量数据存在偏斜的情况,构建偏正态数据下的众数回归模型.又加之数据的缺失常有发生,采用插补方法处理缺失数据集,为比较插补效果,考虑对响应变量随机缺失情形进行统计推断研究.利用高斯牛顿迭代法给出众数回归模型参数的极大似然估计,比较该模型在均值插补,回归插补,众数插补三种插补条件下的插补效果.随机模拟和实例分...  相似文献   

3.
数据缺失在实际应用中普遍存在,数据缺失会降低研究效率,导致参数估计有偏.在协变量随机缺失(MAR)的假定下,本文基于众数回归和逆概率加权估计方法对线性模型进行参数估计.该方法结合参数Logistic回归和非参数Nadaraya-Watson估计两种倾向得分估计方法,分别构建IPWM-L估计量和IPWM-NW估计量.模拟研究和实例分析表明,众数回归模型比均值回归模型更具稳健性,逆概率加权众数(IPWM)估计方法在缺失数据下表现出了更好的拟合效果,与IPWM-L估计量相比, IPWM-NW估计量更稳健.  相似文献   

4.
本文给出了自适应Lasso的众数回归模型,用来对众数回归模型的变量进行选择.对比传统的均值回归模型和中位数回归模型,众数回归在解决重尾、多峰分布问题时更加稳健.众数回归模型的主要估计方法是核估计方法,当自变量的数目较大时,该方法会产生难以忽略的计算误差.本文在核估计方法的众数回归模型基础上添加惩罚项,并通过自适应Lasso方法进行参数估计,有效的剔除了贡献率低的自变量,同时提高了计算的准确性.本文详细阐述了该计算方法,并在一些正则条件下,给出了模型的参数的估计方法和估计值的渐近正态性.模拟实验和实证分析研究了所提方法在有限样本下的性质.对比均值回归模型和传统的众数回归模型,添加自适应Lasso惩罚项的众数回归模型极大地提高了参数估计的准确性.  相似文献   

5.
本文针对金融、经济、社会科学、环境科学、工程技术和生物医学等研究领域存在的不对称数据,提出偏正态数据下众数回归模型,基于牛顿-拉弗森迭代利用EM算法来估计未知参数。通过Monte Carlo模拟和BMI数据实例分析验证,表明本文所提出方法的有效性,对于偏正态数据众数回归模型的估计效果优于均值回归模型。  相似文献   

6.
数据缺失是众多影响数据质量的因素中最常见的一种.若缺失数据处理不当,将直接影响分析结果的可靠性,进而达不到分析的目的.本文针对随机缺失偏正态数据,研究了偏正态众数混合专家模型的参数估计.将众数回归插补与聚类相结合,提出分层众数回归插补方法.利用机器学习插补和统计学插补的方法,进一步比较研究三种机器学习插补方法:支持向量机插补、随机森林插补和神经网络插补,三种统计学插补方法:分层均值插补、众数回归插补和分层众数回归插补的缺失数据处理效果.通过Monte Carlo模拟和实例分析结果表明,分层众数回归插补的优良性.  相似文献   

7.
为了更好地拟合偏态数据,充分提取偏态数据的信息,针对偏正态数据建立了众数回归模型,并基于Pena距离统计量对众数回归模型进行统计断研究,得到了众数回归模型的Pena距离表达式以及高杠杆异常点的诊断方法.利用EM算法与梯度下降法给出了众数回归模型参数的极大似然估计,根据数据删除模型计算似然距离、Cook距离和Pena距离统计量,绘制诊断统计图.通过Monte Carlo模拟试验和实例分析比较,说明文章提出的方法行之有效,并在一定条件下Pena距离对异常点或强影响点的诊断优于似然距离和Cook距离.  相似文献   

8.
传统的面板数据是从均值角度进行研究,但这会受经典假设条件的约束.而考虑面板数据的分位回归模型,可以更加全面地描述响应变量条件分布的全貌.文章引入自适应惩罚函数构造了自适应惩罚的分位回归面板数据方法,并证明所提出的估计量具有大样本性质.蒙特卡洛模拟结果显示该方法相对于均值回归更具优势,是处理面板数据的有效手段.文章最后对我国居民交通通讯消费进行案例分析,得到了有利于决策的参考信息.  相似文献   

9.
参数估计是一种基本的统计推断形式,也是统计学的一个重要分支.在分析偏态数据时,我们比较关注数据的众数、中位数和均值,但是偏Laplace正态数据的众数和中位数难以精确求出,因此用位置参数来近似代替.故本文提出偏Laplace正态数据下位置和均值回归模型,并研究该模型的参数估计,模拟和实例研究结果表明本文提出的模型和方法是科学合理的.  相似文献   

10.
提出了变系数模型条件分位估计的一种新方法.变系数模型已经成为经济学、流行病学、纵向数据和医学领域处理高维数据的有力工具.该模型有助于探测数据的动态特征、降低模型偏差、避免高维灾难,同时便于解释.尽管关于变系数模型条件均值的估计已经有很多文章,但关于变系数模型条件分位的估计方面的文章相对较少.文中提出了一种有效的适应性分位回归方法来诊断出齐性邻域,进行局部自适应窗宽选择和局部线性逼近,同时给出了估计量的风险界和最优窗宽的自动选择准则.模拟研究说明了所提出估计方法的效果.  相似文献   

11.
大多数基于传统均值回归的建模方法都对非正态误差表现出不稳健的估计结果.和传统均值回归相比,复合分位回归(CQR)可以产生稳健的估计.基于一个复合反对称Laplace分布(CALD),我们建立了加权复合分位回归(WCQR)的贝叶斯分层模型.Gibbs抽样算法被发展用于WCQR的后验推断.最后,我们提供了一些模拟研究和一个实际数据分析来验证所提方法.  相似文献   

12.
已有针对平滑转换自回归模型(STAR)的研究多是将转换函数设定为Logistic函数或指数函数形式,并在均值回归框架下获得模型的估计、检验及预测结果.文章基于重心权有理插值和分位数回归方法,构建一类新的半参数平滑转换分位数自回归模型,其主要特点表现在:第一,基于重心权有理插值方法构造的平滑转换函数,形式更加灵活自由,有效减少了模型误设的风险.第二,在分位数回归框架下,利用遗传算法获得新模型在不同分位点处的平滑转换自回归系数估计,比单纯的均值回归得到的信息更为丰富.数值模拟结果显示,新模型的平滑转换自回归系数估计在无偏性、有效性和一致性方面均具有较好表现.最后,将新模型应用于上证综指日收益率的动态趋势及预测研究,细致揭示了收益率序列在不同阶段、不同分位点处的非线性和异质性变化特征.  相似文献   

13.
孙桂萍  赵目  周勇 《数学学报》2022,(4):607-624
剩余寿命是刻画个体预期寿命的一个重要度量,对剩余寿命的早期研究主要集中在剩余均值上.然而当总体生存函数偏态或厚尾时剩余均值函数可能不存在,因此统计学者建议用剩余寿命分位数来刻画预期寿命.在完全数据和右删失数据下,剩余寿命分位数的建模和理论已经很完善.但是,在实际的调查研究中经常会遇到偏差抽样数据.例如,临床医学中的左截断数据,流行病学中的病例队列抽样数据,医学大型队列研究中的长度偏差抽样数据等等.忽略抽样偏差会导致参数估计有偏和不合理的推断结果.本文考虑一般偏差右删失数据下剩余寿命分位数回归的统计推断问题.首先,我们提出了一个一般偏差右删失数据下的剩余寿命分位数回归模型,并利用一般估计方程方法对模型中的参数进行了估计.针对已有文献常用的删失变量与协变量独立性假设,本文重点考虑了删失变量依赖于协变量场合.其次,由于估计量的渐近方差中涉及非参密度函数,在估计渐近方差时,本文采用Bootstrap方法.最后,数值模拟显示本文提出的方法有限样本性质表现很好.  相似文献   

14.
本文研究了含有个体固定效应的面板数据空间误差模型,基于工具变量法给出了估计模型未知参数的分位回归方法.随机模拟结果显示,工具变量分位回归估计是处理空间面板数据的有效手段,且明显优于均值回归方法.  相似文献   

15.
风险值的估计及其周期分析   总被引:1,自引:0,他引:1  
本文提出了两种风险值的估计方法,这两种方法均是先估计出收益的分布,然后求得分布左侧p分位点作为风险值的估计.第一种方法是用核估计方法得到收益的分布估计;第二种方法则是由分布的核估计算得收益的众数,引入所谓的广义半t分布拟合众数左侧的样本.文章以上证指数为实例验证了这两种方法的可行性与精确性.最后我们利用上述两种估计方法得到了上证指数风险值的波动主周期.  相似文献   

16.
一些科研单位或者调查机构经常公布关于居民工资收入状况的数据报告,大多数居民觉得收入"被提高",并对此提出质疑.针对该问题,提出众数作为公开数据报告的补充,并给出了众数的两种估计方法.最后,采用这两种方法对中国城镇女性居民月工资收入的众数进行了估计.结果表明,要想得到全面准确的收入分布状况,众数是不可或缺的重要统计量,而且两种众数估计方法是简单而行之有效的,这为众数的推广和应用奠定了基础.  相似文献   

17.
复合分位数回归(composite quantile regression)具有稳健性好和估计效率高的优势,所以其经常被用来替代均值回归.众所周知,纵向数据具有组内相关的特点,如果估计过程中能正确地利用组内相关性,则可以显著地提高估计效率.因此,探讨纵向数据复合分位数回归中如何使用相关性是一个有意义的问题.本文首先利用copula函数方法构建纵向数据复合分位数回归的组内协方差矩阵,进而基于构建的协方差矩阵,提出一个无偏且有效的基于copula函数的复合分位数回归估计方程;进一步,为了进行变量选择,利用基于copula函数的估计方程,提出一个光滑门限(smooth-threshold)的复合分位数回归估计方程方法.本文提出的方法具有很高的灵活性,而且提高了估计的效率.理论结果以及数值模拟和实际数据分析都验证了本文的方法.  相似文献   

18.
在对统计数据的建模和分析中,数据的波动性和扰动性是人们越来越关注的一个问题.于是如何对其进行有效地识别和刻画并精确地估计出来就变得尤为重要.文章考虑一个线性异方差模型,主要的目标是将未知的刻度函数稳健地恢复出来.在传统的刻度参数的估计中,四分位距是一个稳健的估计量.文章在此基础上进一步提出"极小四分位距"及"最优分位距"两个新的稳健估计量,欲将任意分布F中的刻度参数有效地估计出来.进而为了对异方差模型中的刻度函数进行估计,将该思想推广到条件分布中,并利用分位回归技术,这样刻度函数就得以稳健的恢复出来.值得说明的是在估计过程中无需知道均值函数的任何信息,使得该方法更具优势.此外文章研究了估计量的渐近性质并与传统的四分位距方法进行比较.结果表明,不论误差分布是对称的还是非对称的,所提出的估计量都有显著的优越性.最后,为了检测所提出估计量的性能,进行了一些模拟研究,得到的结果与理论是相符的.  相似文献   

19.
本文讨论部分函数型线性可加模型参数的稳健估计,该模型由经典的可加回归模型和函数型线性模型组合而成.采用B-样条基函数对模型中斜率函数和非参数可加函数进行近似,然后通过最大化众数回归目标函数得到基于众数回归的估计.在一些正则条件下,本文给出估计的收敛速度和渐近分布.最后通过模拟计算和应用实例以表明所提方法的有效性.模拟结果表明,该方法不仅具有稳健性,即不易受污染数据或厚尾分布的影响,而且在信噪比较大时可以与最小二乘方法有相同的表现.  相似文献   

20.
传统均值角度下研究的动态面板数据模型会受经典假设条件的约束,将动态面板数据与分位回归数模型相结合,不仅可以解决约束问题,而且能更加全面地描述响应变量条件分布的全貌.文章引入自适应惩罚项,并应用工具变量构造了自适应惩罚的动态面板分位回归方法,证明了该方法得到的估计量具有大样本性质.同时蒙特卡洛模拟结果表明自适应惩罚的方法相较于传统的方法更加有效.文章最后对中国大中城市商品房销售价格与各地人均国民生产总值的关系进行案例分析,发现两者之间存在正反馈机制.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号