首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
数据缺失是众多影响数据质量的因素中最常见的一种.若缺失数据处理不当,将直接影响分析结果的可靠性,进而达不到分析的目的.本文针对随机缺失偏正态数据,研究了偏正态众数混合专家模型的参数估计.将众数回归插补与聚类相结合,提出分层众数回归插补方法.利用机器学习插补和统计学插补的方法,进一步比较研究三种机器学习插补方法:支持向量机插补、随机森林插补和神经网络插补,三种统计学插补方法:分层均值插补、众数回归插补和分层众数回归插补的缺失数据处理效果.通过Monte Carlo模拟和实例分析结果表明,分层众数回归插补的优良性.  相似文献   

2.
本文研究缺失偏t正态数据下线性回归模型的参数估计问题,针对缺失偏t正态数据,为使样本分布更加接近真实分布,改善模型的回归系数、尺度参数、偏度参数和自由度参数的估计效果,提高参数估计的稳定性,提出一种适合缺失偏t正态数据下线性回归模型的修正随机回归插补方法.通过随机模拟和实例研究,同随机回归插补,多重随机回归插补方法比较,结果表明所提出的修正随机回归插补方法是有效可行的.  相似文献   

3.
现有对回归模型的研究大多仅限于直接观测的解释变量,忽略数据的测量误差将增加模型参数的估计偏差.目前关于测量误差模型的研究主要集中在回归误差服从正态分布的假设,这种假设不适用于研究非对称的数据.对于偏斜数据,众数的代表性优于均值和中位数.本文基于测量误差数据介绍了偏正态众数回归模型,并通过EM算法估计了模型的参数.模拟研究的结果表明,协变量带测量误差下的众数回归比均值回归有更好的表现.通过实例分析进一步表明了所提出模型和方法的有效性.  相似文献   

4.
本文针对金融、经济、社会科学、环境科学、工程技术和生物医学等研究领域存在的不对称数据,提出偏正态数据下众数回归模型,基于牛顿-拉弗森迭代利用EM算法来估计未知参数。通过Monte Carlo模拟和BMI数据实例分析验证,表明本文所提出方法的有效性,对于偏正态数据众数回归模型的估计效果优于均值回归模型。  相似文献   

5.
混合专家模型是对异质总体数据进行回归、分类和聚类的异构性建模的流行框架.研究基于偏正态分布,提出了众数混合专家回归模型,该模型既对混合偏态数据分类后进行众数建模,同时又对混合比例建模,相比单纯的众数回归模型具有更大的适应性,可以概括和描述众多的实际问题.采用了一种有效的模式识别聚类方法来选择子聚类的数量.分别应用MM算...  相似文献   

6.
基于空间自回归模型的缺失值插补方法   总被引:2,自引:0,他引:2  
本文研究来自于区域的截面数据中缺失值的插补问题,讨论了当数据中存在空间相关时,空间自回归模型的建立以及利用其对缺失值进行插补的方法,并根据实际数据,通过建立模型给出插补结果。  相似文献   

7.
针对响应变量随机缺失的变系数部分非线性模型,提出了一种稳健的基于众数回归的估计方法.采取逆概率加权方法,利用QR正交分解技术,分别得到了未知参数和变系数函数的众数回归估计量.在一定条件下,证明了估计量的渐近性质.通过数值模拟和实际数据分析,说明了所提估计方法的有效性.  相似文献   

8.
含缺失数据线性模型的线性不等式约束EM算法   总被引:4,自引:0,他引:4       下载免费PDF全文
研究具有缺失数据的线性模型的回归参数在一般线性不等式A0βa约束下的极大似然估计问题;提出了一般线性不等式约束下的EM算法并且证明了此算法的收敛性.  相似文献   

9.
为了更好地拟合偏态数据,充分提取偏态数据的信息,针对偏正态数据建立了众数回归模型,并基于Pena距离统计量对众数回归模型进行统计断研究,得到了众数回归模型的Pena距离表达式以及高杠杆异常点的诊断方法.利用EM算法与梯度下降法给出了众数回归模型参数的极大似然估计,根据数据删除模型计算似然距离、Cook距离和Pena距离统计量,绘制诊断统计图.通过Monte Carlo模拟试验和实例分析比较,说明文章提出的方法行之有效,并在一定条件下Pena距离对异常点或强影响点的诊断优于似然距离和Cook距离.  相似文献   

10.
《数理统计与管理》2015,(4):621-627
基于正态分布提出了缺失数据下联合均值与方差模型,在响应变量随机缺失下研究了该模型均值插补、回归插补和随机回归插补三种插补方法的参数估计,通过数据模拟和实例研究结果比较表明,随机回归插补方法是三种插补方法中最有用和有效的。  相似文献   

11.
This paper discusses the maximum likelihood estimate of βunder linear inequalities A0β≥a in a linear model with missing data, proposes the restricted EM algorithm and proves the convergence.  相似文献   

12.
主要在数据缺失的情况下研究了伽马分布的参数估计与假设检验,位置参数已知的条件下,给出形状参数的极大似然估计,并证明了形状参数估计的强相合性与渐进正态性,并对两总体参数之差的置信区间和假设检验做出分析,最后做随机模拟验证了其合理性.  相似文献   

13.
带一个插值点的回归模型的参数分析   总被引:1,自引:0,他引:1  
一般的回归模型中认为所有的数据点的重要程度是相同的,但有的实际问题中可能由于种种原因,其中有某个数据特别重要,针对这种情况,提出一种带一个插值点的回归模型,并得到这种回归模型三个参数的最大似然估计.  相似文献   

14.
The parameter estimation and the coefficient of contamination for the regression models with repeated measures are studied when its response variables are contaminated by another random variable sequence. Under the suitable conditions it is proved that the estimators which are established in the paper are strongly consistent estimators.  相似文献   

15.
A clustering method is presented for analysing multivariate binary data with missing values. When not all values are observed, Govaert3 has studied the relations between clustering methods and statistical models. The author has shown how the identification of a mixture of Bernoulli distributions with the same parameter for all clusters and for all variables corresponds to a clustering criterion which uses L1 distance characterizing the MNDBIN method (Marchetti8). He first generalized this model by selecting parameters which can depend on variables and finally by selecting parameters which can depend both on variables and on clusters. We use the previous models to derive a clustering method adapted to missing data. This method optimizes a criterion by a standard iterative partitioning algorithm which removes the necessity either to ignore objects or to substitute the missing data. We study several versions of this algorithm and, finally, a brief account is given of the application of this method to some simulated data.  相似文献   

16.
利用局部多项式方法研究了误差具有异方差结构的非参数回归模型,在左截断数据下构造了回归函数的复合分位数回归估计,并得到了该估计的渐近正态性结果,最后通过模拟,在服从一些非正态分布的误差下,得到该估计比局部线性估计更有效.  相似文献   

17.
In this paper, we consider the semiparametric regression model for longitudinal data. Due to the correlation within groups, a generalized empirical log-likelihood ratio statistic for the unknown parameters in the model is suggested by introducing the working covariance matrix. It is proved that the proposed statistic is asymptotically standard chi-squared under some suitable conditions, and hence it can be used to construct the confidence regions of the parameters. A simulation study is conducted to compare the proposed method with the generalized least squares method in terms of coverage accuracy and average lengths of the confidence intervals.  相似文献   

18.
偏t正态分布是分析尖峰,厚尾数据的重要统计工具之一.研究提出了偏t正态数据下混合线性联合位置与尺度模型,通过EM算法和Newton-Raphson方法研究了该模型参数的极大似然估计.并通过随机模拟试验验证了所提出方法的有效性.最后,结合实际数据验证了该模型和方法具有实用性和可行性.  相似文献   

19.
Empirical likelihood(EL) ratio statistic on θ = g(x) is constructed based on the inverse probability weighted imputation approach in a nonparametric regression model Y = g(x) + ε(x ∈ [0,1]p) with fixed designs and missing responses,which asymptotically has χ12 distribution.This result is used to obtain a EL based confidence interval on θ.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号