共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
针对现实生活中大量数据存在偏斜的情况,构建偏正态数据下的众数回归模型.又加之数据的缺失常有发生,采用插补方法处理缺失数据集,为比较插补效果,考虑对响应变量随机缺失情形进行统计推断研究.利用高斯牛顿迭代法给出众数回归模型参数的极大似然估计,比较该模型在均值插补,回归插补,众数插补三种插补条件下的插补效果.随机模拟和实例分... 相似文献
3.
数据缺失在实际应用中普遍存在,数据缺失会降低研究效率,导致参数估计有偏.在协变量随机缺失(MAR)的假定下,本文基于众数回归和逆概率加权估计方法对线性模型进行参数估计.该方法结合参数Logistic回归和非参数Nadaraya-Watson估计两种倾向得分估计方法,分别构建IPWM-L估计量和IPWM-NW估计量.模拟研究和实例分析表明,众数回归模型比均值回归模型更具稳健性,逆概率加权众数(IPWM)估计方法在缺失数据下表现出了更好的拟合效果,与IPWM-L估计量相比, IPWM-NW估计量更稳健. 相似文献
4.
本文给出了自适应Lasso的众数回归模型,用来对众数回归模型的变量进行选择.对比传统的均值回归模型和中位数回归模型,众数回归在解决重尾、多峰分布问题时更加稳健.众数回归模型的主要估计方法是核估计方法,当自变量的数目较大时,该方法会产生难以忽略的计算误差.本文在核估计方法的众数回归模型基础上添加惩罚项,并通过自适应Lasso方法进行参数估计,有效的剔除了贡献率低的自变量,同时提高了计算的准确性.本文详细阐述了该计算方法,并在一些正则条件下,给出了模型的参数的估计方法和估计值的渐近正态性.模拟实验和实证分析研究了所提方法在有限样本下的性质.对比均值回归模型和传统的众数回归模型,添加自适应Lasso惩罚项的众数回归模型极大地提高了参数估计的准确性. 相似文献
5.
6.
数据缺失是众多影响数据质量的因素中最常见的一种.若缺失数据处理不当,将直接影响分析结果的可靠性,进而达不到分析的目的.本文针对随机缺失偏正态数据,研究了偏正态众数混合专家模型的参数估计.将众数回归插补与聚类相结合,提出分层众数回归插补方法.利用机器学习插补和统计学插补的方法,进一步比较研究三种机器学习插补方法:支持向量机插补、随机森林插补和神经网络插补,三种统计学插补方法:分层均值插补、众数回归插补和分层众数回归插补的缺失数据处理效果.通过Monte Carlo模拟和实例分析结果表明,分层众数回归插补的优良性. 相似文献
7.
为了更好地拟合偏态数据,充分提取偏态数据的信息,针对偏正态数据建立了众数回归模型,并基于Pena距离统计量对众数回归模型进行统计断研究,得到了众数回归模型的Pena距离表达式以及高杠杆异常点的诊断方法.利用EM算法与梯度下降法给出了众数回归模型参数的极大似然估计,根据数据删除模型计算似然距离、Cook距离和Pena距离统计量,绘制诊断统计图.通过Monte Carlo模拟试验和实例分析比较,说明文章提出的方法行之有效,并在一定条件下Pena距离对异常点或强影响点的诊断优于似然距离和Cook距离. 相似文献
8.
9.
10.
提出了变系数模型条件分位估计的一种新方法.变系数模型已经成为经济学、流行病学、纵向数据和医学领域处理高维数据的有力工具.该模型有助于探测数据的动态特征、降低模型偏差、避免高维灾难,同时便于解释.尽管关于变系数模型条件均值的估计已经有很多文章,但关于变系数模型条件分位的估计方面的文章相对较少.文中提出了一种有效的适应性分位回归方法来诊断出齐性邻域,进行局部自适应窗宽选择和局部线性逼近,同时给出了估计量的风险界和最优窗宽的自动选择准则.模拟研究说明了所提出估计方法的效果. 相似文献
11.
12.
已有针对平滑转换自回归模型(STAR)的研究多是将转换函数设定为Logistic函数或指数函数形式,并在均值回归框架下获得模型的估计、检验及预测结果.文章基于重心权有理插值和分位数回归方法,构建一类新的半参数平滑转换分位数自回归模型,其主要特点表现在:第一,基于重心权有理插值方法构造的平滑转换函数,形式更加灵活自由,有效减少了模型误设的风险.第二,在分位数回归框架下,利用遗传算法获得新模型在不同分位点处的平滑转换自回归系数估计,比单纯的均值回归得到的信息更为丰富.数值模拟结果显示,新模型的平滑转换自回归系数估计在无偏性、有效性和一致性方面均具有较好表现.最后,将新模型应用于上证综指日收益率的动态趋势及预测研究,细致揭示了收益率序列在不同阶段、不同分位点处的非线性和异质性变化特征. 相似文献
13.
剩余寿命是刻画个体预期寿命的一个重要度量,对剩余寿命的早期研究主要集中在剩余均值上.然而当总体生存函数偏态或厚尾时剩余均值函数可能不存在,因此统计学者建议用剩余寿命分位数来刻画预期寿命.在完全数据和右删失数据下,剩余寿命分位数的建模和理论已经很完善.但是,在实际的调查研究中经常会遇到偏差抽样数据.例如,临床医学中的左截断数据,流行病学中的病例队列抽样数据,医学大型队列研究中的长度偏差抽样数据等等.忽略抽样偏差会导致参数估计有偏和不合理的推断结果.本文考虑一般偏差右删失数据下剩余寿命分位数回归的统计推断问题.首先,我们提出了一个一般偏差右删失数据下的剩余寿命分位数回归模型,并利用一般估计方程方法对模型中的参数进行了估计.针对已有文献常用的删失变量与协变量独立性假设,本文重点考虑了删失变量依赖于协变量场合.其次,由于估计量的渐近方差中涉及非参密度函数,在估计渐近方差时,本文采用Bootstrap方法.最后,数值模拟显示本文提出的方法有限样本性质表现很好. 相似文献
14.
15.
风险值的估计及其周期分析 总被引:1,自引:0,他引:1
本文提出了两种风险值的估计方法,这两种方法均是先估计出收益的分布,然后求得分布左侧p分位点作为风险值的估计.第一种方法是用核估计方法得到收益的分布估计;第二种方法则是由分布的核估计算得收益的众数,引入所谓的广义半t分布拟合众数左侧的样本.文章以上证指数为实例验证了这两种方法的可行性与精确性.最后我们利用上述两种估计方法得到了上证指数风险值的波动主周期. 相似文献
16.
《数学的实践与认识》2013,(20)
一些科研单位或者调查机构经常公布关于居民工资收入状况的数据报告,大多数居民觉得收入"被提高",并对此提出质疑.针对该问题,提出众数作为公开数据报告的补充,并给出了众数的两种估计方法.最后,采用这两种方法对中国城镇女性居民月工资收入的众数进行了估计.结果表明,要想得到全面准确的收入分布状况,众数是不可或缺的重要统计量,而且两种众数估计方法是简单而行之有效的,这为众数的推广和应用奠定了基础. 相似文献
17.
《中国科学:数学》2020,(8)
复合分位数回归(composite quantile regression)具有稳健性好和估计效率高的优势,所以其经常被用来替代均值回归.众所周知,纵向数据具有组内相关的特点,如果估计过程中能正确地利用组内相关性,则可以显著地提高估计效率.因此,探讨纵向数据复合分位数回归中如何使用相关性是一个有意义的问题.本文首先利用copula函数方法构建纵向数据复合分位数回归的组内协方差矩阵,进而基于构建的协方差矩阵,提出一个无偏且有效的基于copula函数的复合分位数回归估计方程;进一步,为了进行变量选择,利用基于copula函数的估计方程,提出一个光滑门限(smooth-threshold)的复合分位数回归估计方程方法.本文提出的方法具有很高的灵活性,而且提高了估计的效率.理论结果以及数值模拟和实际数据分析都验证了本文的方法. 相似文献
18.
《系统科学与数学》2014,(6)
在对统计数据的建模和分析中,数据的波动性和扰动性是人们越来越关注的一个问题.于是如何对其进行有效地识别和刻画并精确地估计出来就变得尤为重要.文章考虑一个线性异方差模型,主要的目标是将未知的刻度函数稳健地恢复出来.在传统的刻度参数的估计中,四分位距是一个稳健的估计量.文章在此基础上进一步提出"极小四分位距"及"最优分位距"两个新的稳健估计量,欲将任意分布F中的刻度参数有效地估计出来.进而为了对异方差模型中的刻度函数进行估计,将该思想推广到条件分布中,并利用分位回归技术,这样刻度函数就得以稳健的恢复出来.值得说明的是在估计过程中无需知道均值函数的任何信息,使得该方法更具优势.此外文章研究了估计量的渐近性质并与传统的四分位距方法进行比较.结果表明,不论误差分布是对称的还是非对称的,所提出的估计量都有显著的优越性.最后,为了检测所提出估计量的性能,进行了一些模拟研究,得到的结果与理论是相符的. 相似文献
19.