首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
在社会学、心理学、生态学、保险学、医学、流行病学等领域,人们经常收集到各种各样的计数资料以研究它们的规律和特征.往往会出现计数数据不包含零观测值或零观测值过多的情形.一系列零截断和零膨胀离散模型也由此提出用于分析这一类数据,如零截断/零膨胀泊松分布、零截断/零膨胀负二项分布等.在利用这一类模型进行拟合时,对未知参数进行...  相似文献   

2.
随着我国足球博彩产业的发展,与足球赛事相关的数据分析和统计工作也越来越受重视.通过双变量Poisson模型及其拓展的几种对角膨胀模型来拟合2015赛季中超联赛各场比赛进球数据.结果表明只用双变量Poisson模型不能很好拟合比赛进球得分数据,用对角膨胀双变量Poisson模型能较好估计各支球队在整个赛季过程中主场和客场的进攻和防守实力,预测每场比赛进球数,提高模型拟合度,并且解决了以往模型在预测低比分或高比分平局时出现的偏差.因此,对角膨胀双变量Poisson回归模型适用性强,对预测足球等项目比赛的进球数是较好的模型.  相似文献   

3.
零膨胀Poisson回归模型是研究零观测值过多的计数数据的常用工具,本文提出了一类拟合具有这类特征的集群数据的层次零膨胀泊松回归模型,并给出了相应的贝叶斯推断方法,参数估计通过Gibbs抽样获得,模型比较与选择则通过拟合优度检验与BIC准则实现.最后,利用一个船舶受损事故数据来展示本文方法的实现及应用.  相似文献   

4.
过离散次数分布模型的尾部特征   总被引:1,自引:0,他引:1  
在保险精算和生物统计等领域,离散型次数分布模型的应用十分广泛.当实际数据的尾部较长(即过离散),且零点的概率较大时,许多模型的拟合效果往往欠佳.本文通过计算概率之比的极限和偏度系数,对混合泊松分布和复合泊松分布的右尾特征和零点概率进行了比较,给出了它们的尾部排列顺序,以及尾部长短与零点概率的关系,从而为模型的构造或选择提供了一种指导.本文最后应用一组实际数据说明了在构造或选择次数分布模型时如何考虑尾部特征,从而改善对实际数据的拟合效果.  相似文献   

5.
车险事故总体预测问题一直是车辆保险公司研究的重点内容之一,目前最为常用的方法是与泊松分布相关的模型.基于车辆保险中索赔数据的结构特征,构建了Capture-Recapture模型,并使用一组车辆保险数据,利用Capture-Recapture及常用的零膨胀泊松等模型分别建模分析,得出了一些新的结论,即Capture-Recapture模型拟合效果整体较优,从而为车辆保险公司更好预测事故总体提供一定的理论依据.  相似文献   

6.
零膨胀广义泊松回归模型与保险费率厘定   总被引:1,自引:0,他引:1  
在保险产品的分类费率厘定中,最常使用的模型之一是泊松回归模型.当损失数据存在零膨胀(zero-in flated)特征时,通常会采用零膨胀泊松回归模型.在零膨胀泊松回归模型中,一般假设结构零的比例参数φ为常数,不受费率因子的影响,这有可能背离实际情况.假设参数φ与费率因子之间存在一定关系,并在此基础上建立了零膨胀广义泊松回归模型,即Z IGP(τ)回归模型.通过对一组汽车保险损失数据的拟合表明,Z IGP(τ)回归模型可以有效地改善对实际数据的拟合效果,从而提高费率厘定结果的合理性.  相似文献   

7.
PH分布具有良好的解析性质,重尾数据的PH近似是随机模型分析中的重要课题.混合Erlang分布是一种常见的PH分布,本文利用EM方法给出了重尾数据的混合Erlang分布拟合算法,通过Matlab软件对两类常见重尾数据进行实验,结果令人满意.最后,文章对混合Erlang分布拟合算法的进一步改进做了总结.  相似文献   

8.
《数理统计与管理》2019,(2):235-246
零膨胀计数数据是当今数据分析的热点问题之一,该类数据的特点是零点过多,目前对这类数据的研究已经比较全面。另外还有些计数数据不仅会出现零点过多的现象,也会同时存在零、一点都过多的情形,如果再用零膨胀计数数据的统计方法去研究,产生的误差较大。目前国内外对零和一都膨胀的数据的研究还比较少,针对这种现象,本文引入零一膨胀泊松回归模型,并用局部多项式核回归法这种非参数统计分析方法对零一膨胀泊松回归模型进行参数估计,这是本文的创新点也是难点,并在求解参数的过程中引进了EM算法和Newton-Raphson迭代对参数近似求解。通过模拟结果可以得出此方法的可行性,最后通过对糖尿病患者数据的实例分析,可以验证此方法的有效性。  相似文献   

9.
恒应力加速寿命试验中无失效数据的处理   总被引:1,自引:0,他引:1  
对恒应力加速寿命试验中W eibu ll分布无失效数据,合理地构造了失效概率的两种先验分布,并结合现场试验数据,利用极大似然方法和Bayes方法对该组无失效数据进行了处理,所得结果表明本文给出的方法是正确可行的.  相似文献   

10.
本文通过国内的二组、韩国一组新型冠状病毒肺炎潜伏期数据,通过两种方法对这三组数据进行了拟合检验,认为都服从两参数BS疲劳寿命分布。针对多组两参数BS疲劳寿命分布,给出了参数相等的近似检验方法,就本文的三组潜伏期数据可以认为其参数是相同的,并得到了刻度参数β与形状参数α的点估计,进而求得了确诊病例在其暴露开始后的14天和21天内出现临床症状或检测试剂呈阳性的概率分别达到0.950213和0.993651,通过与已有文献相应结果的比较,发现两参数BS疲劳寿命分布来拟合潜伏期比Weibull分布与对数正态分布更合适、更具有优势,这与当前的防控策略比较吻合。  相似文献   

11.
OWA算子赋权新方法   总被引:15,自引:1,他引:14  
对于如何对决策数据给出合理的权重,介绍基于OWA算子理论的两种赋权的方法.提出两种赋权的方法.由于组合数和整数联系相关的,提出一种新颖的基于组合数给出OWA算子权重的方法;由于正态分布的良好性质,从已知的OWA算子赋权方法出发,提出一种与决策数据关联紧密的赋权的方法,也给出这两种方法的简单分析.最后通过算例对该法进行说明和分析.  相似文献   

12.
提出了商业销售中企业售后服务数据分析这个国际上尚未完全解决的难题的初步解决办法.首先分析了该表中存在的不合理数据,有两类不合理的数据,包括:使用了的轿车数据还没有反馈,轿车销售需要一定时间.再对该表的制作方法提出建议.第二问中,对于0205批次使用月数18时的千车故障数预测,我们假设该模型服从WeibullDistribution函数,根据该批次使用月数0至12的数据,利用WeibullDistribu-tion函数进行拟合,得到拟合函数,再由拟合函数得到0205使用18个月的千车故障数,为44.08.而对于0306批次使用月数为9时千车故障数的预测,因为每批次的千车故障数符合WeibullDistribution,所以多元线性回归模型,利用前面使用了1,2个月的数据对后面的9月的故障数进行回归计算,结果为:18.1114.对于0310使用月数12的预测,则根据数据反馈的滞后与质量管理关系模型从纵向上对其进行预测,得结果为:6.44.第3问,从销售服务过程质量管理的角度,提出7个方面的质量管理决策与咨询,并给出相应的数学模型.第4问,分别从生产组织管理和配送及物流链管理两个方面提出了想法和建议.  相似文献   

13.
50年代以来,许多统计工作者对单参数指数分布族中参数的可容许性(平方损失下)作了较多讨论,给出了一些线性和非线性(主要的是有理函数)的可容许估计.这些内容可参看文献[1—8].文献[9—11]分别在前面的基础上给出了在平方损失下关于 L 测度几乎可容许估计的一般性定理.这些文献所讨论的参数空间是实数空间上有限或无限的连续区间.本文将讨论离散参数空间(?)={θ_k:θ_k∈R~1,k=1,2,…}.第二节对离散参数空间在平方损失函数 L(g(θ),d)=λ(θ)(d-g(θ))~2下,给出参数函数 g(θ)的估计是可容许的充分条件,第三节以二项分布与爱尔兰分布为例说明了该定理的应用.  相似文献   

14.
The term grouped data refers to the case where the exact value of the characteristic of interest is either unknown or difficult to register. In the present article we study a model that can be used for the simultaneous control of two (possibly correlated) variables whose values have been registered in the form of grouped data. The exact distribution of the waiting time for an out of control signal through the suggested scheme and its ARL are investigated by using a Markov Chain embedding methodology and by establishing a recurrence scheme for the respective tail probabilities. A detailed study of the performance of the scheme is also carried out when the characteristics of interest follow the Marsall–Olkin’s bivariate Exponential Distribution.  相似文献   

15.
In many database applications in telecommunication, environmental and health sciences, bioinformatics, physics, and econometrics, real-world data are uncertain and subjected to errors. These data are processed, transmitted and stored in large databases. We consider stochastic modelling for databases with uncertain data and for some basic database operations (for example, join, selection) with exact and approximate matching. Approximate join is used for merging or data deduplication in large databases. Distribution and mean of the join sizes are studied for random databases. A random database is treated as a table with independent random records with a common distribution (or a set of random tables). These results can be used for integration of information from different databases, multiple join optimization, and various probabilistic algorithms for structured random data.  相似文献   

16.
基于正则逆Gamma分布和广义极值分布的VaR计算   总被引:1,自引:0,他引:1  
股指收益率的分布和风险价值(VaR)的计算是证券市场研究的热点问题.本文对来自上证指数和深证成指日收益率采用正则逆Gamma分布和偏T分布(SST)分别进行拟合,对极值序列(周、月极大值和极小值)建立广义极值分布函数。并由此计算VaR值,度量这几种序列的风险价值.结果表明正则逆Gamma分布能更好地拟合日收益率的分布,以及采用周极值收益率的广义极值分布计算VaR值来估计风险较为合理.  相似文献   

17.
In this paper, we present two classification approaches based on Rough Sets (RS) that are able to learn decision rules from uncertain data. We assume that the uncertainty exists only in the decision attribute values of the Decision Table (DT) and is represented by the belief functions. The first technique, named Belief Rough Set Classifier (BRSC), is based only on the basic concepts of the Rough Sets (RS). The second, called Belief Rough Set Classifier, is more sophisticated. It is based on Generalization Distribution Table (BRSC-GDT), which is a hybridization of the Generalization Distribution Table and the Rough Sets (GDT-RS). The two classifiers aim at simplifying the Uncertain Decision Table (UDT) in order to generate significant decision rules for classification process. Furthermore, to improve the time complexity of the construction procedure of the two classifiers, we apply a heuristic method of attribute selection based on rough sets. To evaluate the performance of each classification approach, we carry experiments on a number of standard real-world databases by artificially introducing uncertainty in the decision attribute values. In addition, we test our classifiers on a naturally uncertain web usage database. We compare our belief rough set classifiers with traditional classification methods only for the certain case. Besides, we compare the results relative to the uncertain case with those given by another similar classifier, called the Belief Decision Tree (BDT), which also deals with uncertain decision attribute values.  相似文献   

18.
为了集中管理, 降低成本, 增强竞争优势, 供应商通常只负责生产,而把产品的配送业务外包给某个配送中心, 由配送中心按照零售商的需求决定发货运输的方式和时间.这样供应商, 配送中心和零售商就构成了二级供应链系统.本文研究的是运输方式为不同参数的全单位数量折扣结构时, 二级供应链系统的经济批量问题.分析了最优解的性质,并对此问题的一种特殊情形给出一个多项式时间算法.  相似文献   

19.
针对目前常用的Phase-Type分布稠密子集存在的问题,对Hyper-Erlang分布进行扩展,给出了Phase-Type分布一个新的稠密子集E-HErD,证明了该新稠密子集的稠密性,并给出了其若干相关性质.  相似文献   

20.
Bayesian optimization has become a widely used tool in the optimization and machine learning communities. It is suitable to problems as simulation/optimization and/or with an objective function computationally expensive to evaluate. Bayesian optimization is based on a surrogate probabilistic model of the objective whose mean and variance are sequentially updated using the observations and an “acquisition” function based on the model, which sets the next observation at the most “promising” point. The most used surrogate model is the Gaussian Process which is the basis of well-known Kriging algorithms. In this paper, the authors consider the pump scheduling optimization problem in a Water Distribution Network with both ON/OFF and variable speed pumps. In a global optimization model, accounting for time patterns of demand and energy price allows significant cost savings. Nonlinearities, and binary decisions in the case of ON/OFF pumps, make pump scheduling optimization computationally challenging, even for small Water Distribution Networks. The well-known EPANET simulator is used to compute the energy cost associated to a pump schedule and to verify that hydraulic constraints are not violated and demand is met. Two Bayesian Optimization approaches are proposed in this paper, where the surrogate model is based on a Gaussian Process and a Random Forest, respectively. Both approaches are tested with different acquisition functions on a set of test functions, a benchmark Water Distribution Network from the literature and a large-scale real-life Water Distribution Network in Milan, Italy.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号