首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
《数理统计与管理》2013,(5):941-950
财务危机预测是金融管理决策中的重要问题,其实质是对未来财务状况的预报和分类。鉴于目前单一分类器预测性能不稳定,本文运用分类器集成技术,以BP神经网络为分类学习算法,建立基于RS-Bag算法的神经网络分类器集成模型。然后,以我国上市公司财务数据为例进行财务危机预测实证研究,结果表明,基于RS-Bag算法的神经网络分类器集成预测精度和泛化性能优于单一神经网络分类器,也优于Bagging分类器集成和RS分类器集成。  相似文献   

2.
机器算法中存在许多不同类型和方式的运行模式,而在诸多算法之中,集成学习的算法是一种基于统计理论以计算机实现的良好机器学习方法.阐述了集成学习的基本思想和实现步骤,运用Bagging集成学习算法试图建立一个个人信用评估模型,以期取得更好的预测结果.运用信息增益法筛选指标,采用V折交叉确认法,利用UCI的信用数据对单个分类器、Bagging集成分类器模型的分类精度和稳健性进行试验比较.结果表明,Bagging-决策树有效的提高了样本的精确性,在个人信用评估的分析中占有较强的优势.  相似文献   

3.
利用集成算法中的Bagging、Boosting和Random Forest三个方法,选取股票指数中的中小板指数、深证成指数、上证指数、创业板指数4组数据进行分析,得出Random Forest对上证指数、中小板指预测结果较好;Boosting对创业板指预测结果较好;Bagging对深证成指预测较好.并在4个板指中,随机选取了4支股票数据(分别为大连重工、中南建设、中国医药、东方国信)进行分析,得出集成算法在数据为200个的情况下,预测结果较为准确,其中不同方法对不同股票的适宜程度有所不同.  相似文献   

4.
神经网络集成技术能有效地提高神经网络的预测精度和泛化能力,已经成为机器学习和神经计算领域的一个研究热点.利用Bagging技术和不同的神经网络算法生成集成个体,并用偏最小二乘回归方法从中提取集成因子,再利用贝叶斯正则化神经网络对其集成,以此建立上证指数预测模型.通过上证指数开、收盘价进行实例分析,计算结果表明该方法预测精度高、稳定性好.  相似文献   

5.
提出一种基于数据集分割的极限学习机集成算法——DS-E-ELM.该算法主要包含以下3个步骤:首先,将数据集分成互不相关的κ个子集,选择κ一1个子集组合成一个训练集,这样可以得到κ个不同的数据集;然后将新得到的κ个数据集利用极限学习机训练得到κ个分类器;最后对κ个分类器预测得到的结果通过多数投票的方法决定预测结果.通过对6个肿瘤数据集的实验证明,DS-E-ELM与单独的ELM、Bagging、Boosting等算法相比,具有更高的分类精度,且稳定性更好.  相似文献   

6.
陶朝杰  杨进 《经济数学》2020,37(3):214-220
虚假评论是电商发展过程中一个无法避免的难题. 针对在线评论数据中样本类别不平衡情况,提出基于BalanceCascade-GBDT算法的虚假评论识别方法. BalanceCascade算法通过设置分类器的误报率逐步缩小大类样本空间,然后集成所有基分类器构建最终分类器. GBDT以其高准确性和可解释性被广泛应用于分类问题中,并且作为样本扰动不稳定算法,是十分合适的基分类模型. 模型基于Yelp评论数据集,采用AUC值作为评价指标,并与逻辑回归、随机森林以及神经网络算法进行对比,实验证明了该方法的有效性.  相似文献   

7.
针对信用评分的特点,首先对传统的Bagging算法进行改进,然后基于不同的基分类器构建多个改进的Bagging组合模型,最后根据一种全新的方式将其组合,得到双层组合模型.通过实证分析得出以下结论:一、与原Bagging算法相比,改进算法能有效降低第二类错误率;二、与单层组合模型相比,多层组合模型能进一步降低第二类错误率和损失率.  相似文献   

8.
近年来,基于深度神经网络的图像识别技术表现出良好的性能,然而研究表明神经网络容易受到对抗扰动攻击而发生分类错误,施加一个小的通用扰动就能使神经网络在整个数据集上失效.为构建更加健壮的神经网络,对通用扰动生成的研究显得至关重要.通用扰动生成问题要求得到一个扰动向量对整个数据集产生指定扰动率的攻击效果,相较于单张图片扰动生成问题其约束条件更严格,计算难度更大.目前已有算法得到的通用扰动范数较大,容易被人眼识别.文章基于优化理论提出新的通用扰动生成算法,在达到指定扰动率的同时能产生更小的通用扰动.算法结合PCA降维思想克服了问题的规模性带来的困难;然后利用单张对抗扰动向量的均值叠加随机噪声,得到满足扰动率的初始通用扰动;最后改进梯度下降方法在保证扰动率的同时得到更小的通用扰动.实验表明,该方法可有效攻击各类先进神经网络:在达到相同扰动率的情况下,所得通用扰动的范数较Uni.Perturbation算法的结果平均降低了54%.  相似文献   

9.
解决不平衡数据分类问题,在现实中有着深远的意义。马田系统利用单一的正常类别构建基准空间和测量基准尺度,并由此建立数据分类模型,十分适合不平衡数据分类问题的处理。本文以传统马田系统方法为基础,结合信噪比及F-value、G-mean等分类精度,建立了基于遗传算法的基准空间优化模型,同时运用Bagging集成化算法,构造了改进马田系统模型算法GBMTS。通过对不同分类方法及相关数据集的实验分析,表明:GBMTS算法较其他分类算法,更能够有效的处理不平衡数据的分类问题。  相似文献   

10.
针对烟草化学成分与卷烟制品香级之间确定的数学模型难以建立的问题.提出了一种基于萤火虫群优化算法的烟草香级集成分类方法.方法首先使用混合核SVM独立训练多个个体支持向量机,然后利用改进的离散型萤火虫群优化算法选择部分精度较高、差异度较大的个体分类器参与集成,最后通过多数投票法得到最终的分类预测结果.对比实验结果表明,算法在分类准确度上具有较大的优势,证明了算法的有效性·从而为烟草的香级分类提供了可靠依据.  相似文献   

11.
Previous studies on financial distress prediction (FDP) almost construct FDP models based on a balanced data set, or only use traditional classification methods for FDP modelling based on an imbalanced data set, which often results in an overestimation of an FDP model’s recognition ability for distressed companies. Our study focuses on support vector machine (SVM) methods for FDP based on imbalanced data sets. We propose a new imbalance-oriented SVM method that combines the synthetic minority over-sampling technique (SMOTE) with the Bagging ensemble learning algorithm and uses SVM as the base classifier. It is named as SMOTE-Bagging-based SVM-ensemble (SB-SVM-ensemble), which is theoretically more effective for FDP modelling based on imbalanced data sets with limited number of samples. For comparative study, the traditional SVM method as well as three classical imbalance-oriented SVM methods such as cost-sensitive SVM, SMOTE-SVM, and data-set-partition-based SVM-ensemble are also introduced. We collect an imbalanced data set for FDP from the Chinese publicly traded companies, and carry out 100 experiments to empirically test its effectiveness. The experimental results indicate that the new SB-SVM-ensemble method outperforms the traditional methods and is a useful tool for imbalanced FDP modelling.  相似文献   

12.
根据有界差分条件,提出了学习算法的有界差分稳定框架.依据新框架,研究了机器学习阈值选择算法,再生核Hilbert空间中的正则化学习算法,Ranking学习算法和Bagging算法,证明了对应学习算法的有界差分稳定性.所获结果断言了这些算法均具有有界差分稳定性,从而为这些算法的应用奠定了理论基础.  相似文献   

13.
The support vector machine (SVM) represents a new and very promising technique for machine learning tasks involving classification, regression or novelty detection. Improvements of its generalization ability can be achieved by incorporating prior knowledge of the task at hand.We propose a new hybrid algorithm consisting of signal-adapted wavelet decompositions and hard margin SVMs for waveform classification. The adaptation of the wavelet decompositions is tailored for hard margin SV classifiers with radial basis functions as kernels. It allows the optimization of the representation of the data before training the SVM and does not suffer from computationally expensive validation techniques.We assess the performance of our algorithm against the background of current concerns in medical diagnostics, namely the classification of endocardial electrograms and the detection of otoacoustic emissions. Here the performance of hard margin SVMs can significantly be improved by our adapted preprocessing step.  相似文献   

14.
现有一类分类算法通常采用经典欧氏测度描述样本间相似关系,然而欧氏测度不能较好地反映一些数据集样本的内在分布结构,从而影响这些方法对数据的描述能力.提出一种用于改善一类分类器描述性能的高维空间一类数据距离测度学习算法,与已有距离测度学习算法相比,该算法只需提供目标类数据,通过引入样本先验分布正则化项和L1范数惩罚的距离测度稀疏性约束,能有效解决高维空间小样本情况下的一类数据距离测度学习问题,并通过采用分块协调下降算法高效的解决距离测度学习的优化问题.学习的距离测度能容易的嵌入到一类分类器中,仿真实验结果表明采用学习的距离测度能有效改善一类分类器的描述性能,特别能够改善SVDD的描述能力,从而使得一类分类器具有更强的推广能力.  相似文献   

15.
上证指数预测是一个非常复杂的非线性问题,为了提高对上证指数预测的准确性,本文采用基于混沌粒子群(CPSO)算法对BP神经网络算法改进的方法来进行预测.BP神经网络算法目前已经应用到预测、聚类、分类等许多领域,取得了不少的成果.但自身也有明显的缺点,比如易陷入局部极小值、收敛速度慢等.用混沌粒子群算法改进BP神经网络算法的基本思想是用混沌粒子群算法优化BP神经网络算法的权值和阈值,在粒子群算法中加入混沌元素,提高粒子群算法的全局搜索能力.对上证指数预测的结果表明改进后的预测方法,具有更好的准确性.  相似文献   

16.
股票时间序列预测在经济和管理领域具有重要的应用前景,也是很多商业和金融机构成功的基础.首先利用奇异谱分析对股市时间序列重构,降低噪声并提取趋势序列.再利用C-C算法确定股市时间序列的嵌入维数和延迟阶数,对股市时间序列进行相空间重构,生成神经网络的学习矩阵.进一步利用Boosting技术和不同的神经网络模型,生成神经网络集成个体.最后采用带有惩罚项的半参数回归模型进行集成,并利用遗传算法选择最优的光滑参数,以此建立遗传算法和半参数回归的神经网络集成股市预测模型.通过上证指数开盘价进行实例分析,与传统的时间序列分析和其他集成方法对比,发现该方法能获得更准确的预测结果.计算结果表明该方法能充分反映股票价格时间序列趋势,为金融时间序列预测提供一个有效方法.  相似文献   

17.
赵慧  肖明 《应用概率统计》2005,21(3):278-284
本文通过分析Bagging算法在混合适应性样条估计中的作用,提出了一种新的空间适应性非参数函数估计算法.模拟研究表明该算法在空间适应性上具有明显优势,在估计精度和稳定性方面也可与其他同类方法相媲美,并且易于推广到多元情形.  相似文献   

18.
支持向量机中的参数直接影响其推广能力,针对参数选取的主观性,提出基于改进的遗传算法优化其参数,并将其应用于银行个人信用的五等级分类问题中,针对多分类问题,设计了3个二值分类器,不同分类的参数不同,通过实验证实可以达到更精细的分类效果.  相似文献   

19.
Multiple classifier systems combine several individual classifiers to deliver a final classification decision. In this paper the performance of several multiple classifier systems are evaluated in terms of their ability to correctly classify consumers as good or bad credit risks. Empirical results suggest that some multiple classifier systems deliver significantly better performance than the single best classifier, but many do not. Overall, bagging and boosting outperform other multi-classifier systems, and a new boosting algorithm, Error Trimmed Boosting, outperforms bagging and AdaBoost by a significant margin.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号