共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
《数学的实践与认识》2015,(10)
通过对常替代弹性资本资产定价模型中投资标度问题的分析,提出了Copula贝叶斯估计方法用以获得系统风险β与投资标度比λ的联合后验分布.Copula贝叶斯估计方法针对数据非正态特征及强相关性特征而构建,采用Copula函数取代原有普通贝叶斯估计方法中的正态假设.传统贝叶斯估计方法假设了正态的似然函数,忽略了数据可能存在尖峰后尾等在金融实证数据分析中普遍存在的非正态情况.Copula贝叶斯估计算法采用半相依回归法处理数据的强相关性问题,将原有函数依照数据形式假设为非正态结构.针对来自6个工业产业24组公司数据的系统风险参数β与其对应的投资标度参数比λ进行估计,获得不同行业中系统风险参数与投资标度之间的动态关系并进行分析,为业界投资及相关研究提供有效参考建议. 相似文献
3.
高可靠性产品在加速寿命试验中其失效数据经常比较少,利用步进应力加速退化试验来评估产品寿命分布是一种非常好的方法.本文基于维纳过程的步进应力加速退化试验模型利用客观贝叶斯方法获得了其模型参数的无信息先验(Jefferys先验和Reference先验).并证明了对应的后验分布都是正常的.对于Jefferys先验和Reference先验下的后验提出相应的Gibbs抽样算法.最后,我们模拟对比了客观贝叶斯估计、贝叶斯估计和极大似然估计,模拟结果揭示了客观贝叶斯方法的优良性. 相似文献
4.
基于贝叶斯统计方法的两总体基因表达数据分类 总被引:1,自引:0,他引:1
在疾病的诊断过程中,对疾病的精确分类是提高诊断准确率和疾病治愈率至 关重要的一个环节,DNA芯片技术的出现使得我们从微观的层次获得与疾病分类及诊断 密切相关的基因功能信息.但是DNA芯片技术得到的基因的表达模式数据具有多变量小 样本特点,使得分类过程极不稳定,因此我们首先筛选出表达模式发生显著性变化的基因 作为特征基因集合以减少变量个数,然后再根据此特征基因集合建立分类器对样本进行分 类.本文运用似然比检验筛选出特征基因,然后基于贝叶斯方法建立了统计分类模型,并 应用马尔科夫链蒙特卡罗(MCMC)抽样方法计算样本归类后验概率.最后我们将此模型 应用到两组真实的DNA芯片数据上,并将样本成功分类. 相似文献
5.
6.
7.
《应用概率统计》2021,(4)
回归模型一般采取传统的最小二乘估计(LSE)方法,然而当数据包含非正态特征或异常值时该估计方法会导致不稳健的参数估计.与LSE方法相比,即使出现非正态误差或异常数据,复合分位回归(CQR)方法也能提供更稳健的估计结果.基于复合反对称拉普拉斯分布(CALD),本文提出了贝叶斯框架下的加权复合分量回归(WCQR)方法.正则化方法已经被验证可以有效处理高维稀疏回归模型,它可以同时进行变量选择和参数估计.本文结合贝叶斯LASSO正则化方法和WCQR方法来拟合线性回归模型,建立了 WCQR的贝叶斯LASSO正则化分层模型,并导出了所有参数的条件后验分布以进行统计推断.最后,通过蒙特卡罗模拟和实际数据分析演示了所提出方法. 相似文献
8.
两部分回归模型在刻画半连续型数据的概率发生机制具有重要作用.本文将经典的两部分回归模型推广到两部分有限混合模型,通过假定多条回归直线的混合来解释分布的不齐一性.在贝叶斯框架内,运用马尔可夫链蒙特卡洛(MCMC)方法来进行后验分析.Polya-Gamma先验被用来对logistic模型进行拟合,同时,Stick-breaking先验用于随机权.这些有助于加速后验抽样.本文对可卡因数据展开实证分析. 相似文献
9.
10.
学者往往用单一的分布模拟和拟合杂波,如正态分布、瑞利分布和威布尔分布等。然而在实际中,雷达杂波由多种类型的杂波组成,单一分布通常不能精确刻画雷达杂波规律,因此,应用混合分布模型对雷达杂波数据建模更准确。本文考虑用正态分布和瑞利分布的混合分布拟合杂波,并应用矩估计方法和基于EM算法的极大似然估计方法估计模型参数,最后,应用最大后验概率分类准则验证2种估计方法的分类准确率。通过数据模拟,得出极大似然估计的效果和分类准确率都要优于矩估计的估计效果和分类准确率。 相似文献
11.
12.
Boosting是一种有效的分类器组合方法,它能够提高不稳定学习算法的分类性能,但对稳定的学习算法效果不明显.BAN(BN augmented Naive-Bayes)是一种增强的贝叶斯网络分类器,通过Boosting很容易提高其分类性能.比较了GBN(general BN)和BAN的打包分类器Wrapping-BAN-GBN与基于Boosting的BAN组合分类器Boosting-BAN.最后通过实验结果显示了在大多数实验数据上,Boosting-BAN分类器显示出较高的分类正确率. 相似文献
13.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果. 相似文献
14.
机器算法中存在许多不同类型和方式的运行模式,而在诸多算法之中,集成学习的算法是一种基于统计理论以计算机实现的良好机器学习方法.阐述了集成学习的基本思想和实现步骤,运用Bagging集成学习算法试图建立一个个人信用评估模型,以期取得更好的预测结果.运用信息增益法筛选指标,采用V折交叉确认法,利用UCI的信用数据对单个分类器、Bagging集成分类器模型的分类精度和稳健性进行试验比较.结果表明,Bagging-决策树有效的提高了样本的精确性,在个人信用评估的分析中占有较强的优势. 相似文献
15.
本文讨论了中文文本挖掘的三个问题:分词、关键词提取和文本分类。对分词问题,介绍了基于层叠隐马尔可夫模型的ICTCLAS分词法,以及将词与词之间的分隔视为缺失数据并用EM算法求解的WDM方法;对关键词提取问题,提出了贝叶斯因子法,并介绍了使用稀疏回归的CCS方法;对文本分类问题,介绍了根据关键词频率建立分类器的方法,以及先建立主题模型再根据主题概率建立分类器的方法。本文通过两组文本数据对上述方法进行比较,并给出使用建议。 相似文献
16.
17.
《系统科学与数学》2020,(4)
为提高推荐结果的精度和个性化程度,文章有效利用多种信息源,将贝叶斯方法和深度学习结合,提出一种基于贝叶斯自编码器的社会化推荐算法.算法首先利用混合隶属度随机块模型MMSB (Mixed membership stochastic block)对用户间交互关系建模,结合用户的属性特征,利用自编码器学习用户的隐含特征向量;然后利用主题模型结合自编码模块学习物品特征向量;最后利用概率框架将物品和用户间的各种属性统一起来,共同学习矩阵分解模型中的关系矩阵.模型中的参数利用变分EM算法进行推理.实验结果表明与同类算法比较,算法在精确度和覆盖率上有不同程度的提升,且能够得到比较个性化的推荐结果. 相似文献
18.
19.
虚假评论是电商发展过程中一个无法避免的难题. 针对在线评论数据中样本类别不平衡情况,提出基于BalanceCascade-GBDT算法的虚假评论识别方法. BalanceCascade算法通过设置分类器的误报率逐步缩小大类样本空间,然后集成所有基分类器构建最终分类器. GBDT以其高准确性和可解释性被广泛应用于分类问题中,并且作为样本扰动不稳定算法,是十分合适的基分类模型. 模型基于Yelp评论数据集,采用AUC值作为评价指标,并与逻辑回归、随机森林以及神经网络算法进行对比,实验证明了该方法的有效性. 相似文献
20.
《数理统计与管理》2019,(6):1014-1025
贝叶斯网络模型作为一种传统有效的大数据图模型,因其具有因果和概率性语义等特点受到学者们的广泛研究。为了解决基于高维数据构建贝叶斯网络的难题,本文提出了一种适用于高维数据的贝叶斯网络结构学习算法—LTB算法,该算法由Lasso、Tabu Search算法和BIC结合。首先,运用Lasso降低协变量的维数,筛选出与目标变量关系密切的协变量将作为贝叶斯网络的顶点。然后,选择Tabu Search作为元启发式算法,选择BIC作为计算得分的方法,两者结合构建全局最优的贝叶斯网络结构。实证分析表明,LTB算法应用于上证综指影响因素的研究,既可以获得上证综指与其影响因素间的因果关系,也可以利用条件概率得到上证综指影响因素间的组合方式。 相似文献