共查询到19条相似文献,搜索用时 62 毫秒
1.
数据缺失是众多影响数据质量的因素中最常见的一种.若缺失数据处理不当,将直接影响分析结果的可靠性,进而达不到分析的目的.本文针对随机缺失偏正态数据,研究了偏正态众数混合专家模型的参数估计.将众数回归插补与聚类相结合,提出分层众数回归插补方法.利用机器学习插补和统计学插补的方法,进一步比较研究三种机器学习插补方法:支持向量机插补、随机森林插补和神经网络插补,三种统计学插补方法:分层均值插补、众数回归插补和分层众数回归插补的缺失数据处理效果.通过Monte Carlo模拟和实例分析结果表明,分层众数回归插补的优良性. 相似文献
2.
本文研究缺失偏t正态数据下线性回归模型的参数估计问题,针对缺失偏t正态数据,为使样本分布更加接近真实分布,改善模型的回归系数、尺度参数、偏度参数和自由度参数的估计效果,提高参数估计的稳定性,提出一种适合缺失偏t正态数据下线性回归模型的修正随机回归插补方法.通过随机模拟和实例研究,同随机回归插补,多重随机回归插补方法比较,结果表明所提出的修正随机回归插补方法是有效可行的. 相似文献
3.
4.
5.
6.
基于空间自回归模型的缺失值插补方法 总被引:2,自引:0,他引:2
本文研究来自于区域的截面数据中缺失值的插补问题,讨论了当数据中存在空间相关时,空间自回归模型的建立以及利用其对缺失值进行插补的方法,并根据实际数据,通过建立模型给出插补结果。 相似文献
7.
针对响应变量随机缺失的变系数部分非线性模型,提出了一种稳健的基于众数回归的估计方法.采取逆概率加权方法,利用QR正交分解技术,分别得到了未知参数和变系数函数的众数回归估计量.在一定条件下,证明了估计量的渐近性质.通过数值模拟和实际数据分析,说明了所提估计方法的有效性. 相似文献
8.
9.
为了更好地拟合偏态数据,充分提取偏态数据的信息,针对偏正态数据建立了众数回归模型,并基于Pena距离统计量对众数回归模型进行统计断研究,得到了众数回归模型的Pena距离表达式以及高杠杆异常点的诊断方法.利用EM算法与梯度下降法给出了众数回归模型参数的极大似然估计,根据数据删除模型计算似然距离、Cook距离和Pena距离统计量,绘制诊断统计图.通过Monte Carlo模拟试验和实例分析比较,说明文章提出的方法行之有效,并在一定条件下Pena距离对异常点或强影响点的诊断优于似然距离和Cook距离. 相似文献
10.
11.
The restricted EM algorithm under linear inequalities in a linear model with missing data 总被引:1,自引:0,他引:1
ZHENG Shurong SHI Ningzhong & GUO Jianhua School of Mathematics Statistics Northeast Normal University Changchun China Institute of Mathematics Jilin University Changchun China 《中国科学A辑(英文版)》2005,48(6):819-828
This paper discusses the maximum likelihood estimate of βunder linear inequalities A0β≥a in a linear model with missing data, proposes the restricted EM algorithm and proves the convergence. 相似文献
12.
主要在数据缺失的情况下研究了伽马分布的参数估计与假设检验,位置参数已知的条件下,给出形状参数的极大似然估计,并证明了形状参数估计的强相合性与渐进正态性,并对两总体参数之差的置信区间和假设检验做出分析,最后做随机模拟验证了其合理性. 相似文献
13.
带一个插值点的回归模型的参数分析 总被引:1,自引:0,他引:1
一般的回归模型中认为所有的数据点的重要程度是相同的,但有的实际问题中可能由于种种原因,其中有某个数据特别重要,针对这种情况,提出一种带一个插值点的回归模型,并得到这种回归模型三个参数的最大似然估计. 相似文献
14.
QianWeimin LiYumei 《高校应用数学学报(英文版)》2005,20(1):64-74
The parameter estimation and the coefficient of contamination for the regression models with repeated measures are studied when its response variables are contaminated by another random variable sequence. Under the suitable conditions it is proved that the estimators which are established in the paper are strongly consistent estimators. 相似文献
15.
A clustering method is presented for analysing multivariate binary data with missing values. When not all values are observed, Govaert3 has studied the relations between clustering methods and statistical models. The author has shown how the identification of a mixture of Bernoulli distributions with the same parameter for all clusters and for all variables corresponds to a clustering criterion which uses L1 distance characterizing the MNDBIN method (Marchetti8). He first generalized this model by selecting parameters which can depend on variables and finally by selecting parameters which can depend both on variables and on clusters. We use the previous models to derive a clustering method adapted to missing data. This method optimizes a criterion by a standard iterative partitioning algorithm which removes the necessity either to ignore objects or to substitute the missing data. We study several versions of this algorithm and, finally, a brief account is given of the application of this method to some simulated data. 相似文献
16.
利用局部多项式方法研究了误差具有异方差结构的非参数回归模型,在左截断数据下构造了回归函数的复合分位数回归估计,并得到了该估计的渐近正态性结果,最后通过模拟,在服从一些非正态分布的误差下,得到该估计比局部线性估计更有效. 相似文献
17.
In this paper, we consider the semiparametric regression model for longitudinal data. Due to the correlation within groups, a generalized empirical log-likelihood ratio statistic for the unknown parameters in the model is suggested by introducing the working covariance matrix. It is proved that the proposed statistic is asymptotically standard chi-squared under some suitable conditions, and hence it can be used to construct the confidence regions of the parameters. A simulation study is conducted to compare the proposed method with the generalized least squares method in terms of coverage accuracy and average lengths of the confidence intervals. 相似文献
18.
偏t正态分布是分析尖峰,厚尾数据的重要统计工具之一.研究提出了偏t正态数据下混合线性联合位置与尺度模型,通过EM算法和Newton-Raphson方法研究了该模型参数的极大似然估计.并通过随机模拟试验验证了所提出方法的有效性.最后,结合实际数据验证了该模型和方法具有实用性和可行性. 相似文献
19.
Empirical likelihood(EL) ratio statistic on θ = g(x) is constructed based on the inverse probability weighted imputation approach in a nonparametric regression model Y = g(x) + ε(x ∈ [0,1]p) with fixed designs and missing responses,which asymptotically has χ12 distribution.This result is used to obtain a EL based confidence interval on θ. 相似文献