首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
高光谱遥感数据波段数目较多,且波段之间的相关性高,影响到敏感波段在地物识别中的作用,并造成大量冗余计算,降低时效.提出了一种随机森林结合递归特征消除的敏感特征选择方案,以提高高光谱遥感地物识别的精度与效率.通过RF-RFE特征选择方法得到最优特征组合,并运用LightGBM和XGBoost等提升算法来提高分类精度.在江苏省常州的茶树数据集上进行分类实验时,在原始数据上的分类精度达到了94.27%和94.45%;在特征选择出的最优特征子集上进行实验时,分类精度达到了94.40%和94.36%.实验结果表明,该方案的分类精度要优于决策树和朴素贝叶斯等传统分类算法,同时大幅减少了运算量,取得了较好的识别效果,具有一定的推广和应用价值.  相似文献   

2.
信用评估是商业银行控制和防范信贷风险的关键途径.决策树模型较好的直观解释性使其成为当前个人信用评估中的常用模型,但决策树模型存在容易导致过拟合且预测精度有限的问题.通过在决策树模型算法中引入类随机森林随机有放回的抽样模式,运用机器自动循环迭代寻求最优树的建模思想,建立了自适应最优C5.0决策树个人信用评估模型.该模型具有快速收敛特征变量、较好的泛化能力和高预测精度的特点,在实证分析中对商业银行个人信用评估模型质量提升带来比较明显的改进效果.  相似文献   

3.
在垃圾短信用户的识别问题中,参与建模的用户行为消费数据存在极强的相关性,直接使用朴素贝叶斯算法建模准确率极低.为满足朴素贝叶斯算法要求建模属性条件独立的基本假定,利用主成分分析对数据进行处理,从而达到降维和属性独立的双重目的,继而利用朴素贝叶斯算法进行建模.结果表明,基于主成分分析和朴素贝叶斯算法的组合模型效果显著.可见在垃圾短信算法的识别中具有一定的实用价值和现实意义.  相似文献   

4.
通过对2014~2019年我国信用债违约案例的原因分析及相关文献综述,从债券资质、债务主体、财务数据、宏观因素四个维度构建债券违约的指标体系,利用随机森林算法优化,研究发现当影响因素选择18项与37项时,样本内外预测结果达到均衡。基于不同角度的七种算法对比分析,择优选取三种作为底层算法:随机森林算法、梯度提升决策树算法与贝叶斯算法,并结合逻辑回归算法为次级训练算法融合构建基于Stacking算法集成的债券违约预测模型。实证结果表明,第一,Stacking算法的双重集成作用相对底层的单次集成总体精确度提升了1%到8%;第二,对不同指标数量的Stacking算法集成模型的评估表明所构建的指标体系提高了预测水平;第三,基于样本内外预测均衡的底层算法选择方法有效可取,分别纳入相对劣势的底层算法时,会逐渐影响模型稳定性。研究成果可以为我国债券市场风险管理提供技术支持与参考。  相似文献   

5.
针对在线教育中试题知识点自动标注问题,本文提出了一种基于二部图的试题知识点标注方法。首先,为了合理划分知识点粒度,本文构建了知识点知识图谱来融合知识点;其次,基于教材等语料抽取知识点与特征词二部图和试题与特征词二部图,并利用TF-IDF公式计算知识点与特征词、试题与特征词之间的边权,以构建试题-知识点二部图模型;再次,提出词频加权的相似性度量方法计算试题和知识点之间的相似度,将相似度最高的知识点作为试题知识点标签。最后,以某在线教育平台提供的高中历史试题为实验数据集进行数值实验,实验结果表明该方法的效果显著优于朴素贝叶斯、K最近邻、随机森林以及支持向量机。  相似文献   

6.
本文探讨商业银行如何利用贝叶斯分类技术构建企业客户财务危机预测模型。本文使用财务比率作为评价企业绩效的特征属性,并考察两个不同的贝叶斯模型在估计企业客户发生财务危机的后验概率方面的有效性。一个比较简单但有较多的假设,即朴素贝叶斯模型;另一个某种程度上更为复杂但有更少的假设,即组合属性贝叶斯模型。研究发现,与朴素贝叶斯模型相比,由于组合属性贝叶斯模型更好地反映了变量之间潜在的联合分布,因此它能在历史数据支持下估计所要求的概率并做出更精确的预测。所提出的模型可以作为辅助银行审核者做出正确而快速决策的有用工具。  相似文献   

7.
运用贡献度随机森林方法(CRF)方法探讨公司债财务指标比率与其违约率的关系.运用连续属性离散化方法(OB)进行财务指标最优降维;运用WOE变换进行模型变量约简.研究表明,CRF模型的分类性能显著优于其他模型,测试集评估总体正确率达90.47%,AUC统计量、AR比率及K-S值分别提升了2.6%、7.6%、4.38%,变量贡献度量化了各财务指标对违约率影响,为诠释随机森林预测机制提供了依据.  相似文献   

8.
文章针对民营企业中的信息技术业,建立包含盈利能力、营运能力、偿债能力、扩张能力、创新能力与公司规模6个方面的指标体系,采用整合改进遗传算法和神经网络的GA-BP算法,对企业的成长性建立模型进行预测与分析.进一步,为验证模型性能,从WIND金融数据库获取数据并进行预处理后,测试集上可决系数R2为0.9990,性能优于其他五种机器学习算法.通过公司市值增长率进行相关系数分析,对建立的模型进行有效性检验,结果表明所选特征的有效性与合理性.最后通过随机森林进行封装特征重要性排序,对指标模型进行简化,选出的8个特征在测试集上改进GA-BP算法的R2为0.8927,再次证明了最初指标选择的合理性.  相似文献   

9.
首先构建了行业间中小企业信用评估指标体系,然后利用安徽省不同行业的800家中小企业调查数据,将其分为训练样本集和测试样本集,对BP神经网络的构造进行讨论,确定BP神经网络的算法,建立起基于BP神经网络的行业间信用评估模型,并代入2003年度全国农业和工业的部分分行业数据进行实证,并对仿真结果做出分析,指出造成农、工行业信用较大差距的原因,并提出加强农业行业信用建设的建议.  相似文献   

10.
在统计学与机器学习中,交叉验证被广泛应用于评估模型的好坏.但交叉验证法的表现一般不稳定,因此评估时通常需要进行多次交叉验证并通过求均值以提高交叉验证算法的稳定性.文章提出了一种基于空间填充准则改进的k折交叉验证方法,它的思想是每一次划分的训练集和测试集均具有较好的均匀性.模拟结果表明,文章所提方法在五种分类模型(k近邻,决策树,随机森林,支持向量机和Adaboost)上对预测精度的估计均比普通k折交叉验证的高.将所提方法应用于骨质疏松实际数据分析中,根据对预测精度的估计选择了最优的模型进行骨质疏松患者的分类预测.  相似文献   

11.
基于BP神经网络的企业信用评估模型   总被引:3,自引:0,他引:3  
本文研究了企业信用评估中的模型问题.以商业企业为例,阐述了基于BP神经网络的信用评估模型的原理,通过建立指标体系,讨论基于BP神经网络的评价模型的实现,对模型的不足进行了分析,并提出改进建议.  相似文献   

12.
Direct mailing is one of the tools of business marketing. Itcan stimulate the purchase of mail-order products or financialservices. When selecting a mailing list, we hope to obtain ahigher mailing response; on the other hand, we also have toconsider the risk of defaulting. In the case of selling financialservices, customers who respond must be examined for credit.In order to avoid jeopardizing the existing relations with suchcustomers, companies try to reduce their rate of declining suchapplicants by controlling, at the mailing stage, for the riskof choosing customers who will default. In this article, a two-stage screening procedure is constructedto solve a problem of mailing credit assessment with mailingand credit-assessment stages;A screening method can be appliedto select a mailing list at the mailing stage, while the needfor a credit assessment depends on the types of product or service.Therefore, this problem may include four possible models: screeningwith or without credit assessment and random sampling with orwithout credit assessment. Moreover, the optimal cutoff scoresare determined by maximizing total profit. A mailing exampleis then given to illustrate the use of the proposed models formailing credit assessment. Compared with a random sampling method,a screening method has a significant improvement in terms ofresponse rate, decline rate, bad rate, and total profit.  相似文献   

13.
目前多数研究利用美国旧金山市KMV公司于1997年建立的模型(KMV模型)计算企业年违约距离来评估具体企业的信用风险,但缺乏信贷行业的信用风险评估方法,也不能给出随时间变化的信用风险.首先提出基于数据的信贷行业随时间动态演化的信用风险评估模型,然后利用2016年18个行业的数据得到了中国信贷行业动态演化的信用风险,该信用风险随时间演化特征可分为波动上升、下降后波动、下降后稳定、稳定四种类型.进一步研究发现金融业、科学研究和技术服务业、信息传输软件和技术服务业这三个行业动态演化的信用风险平均值高且不稳定,住宿和餐饮业的信用风险很高但是比较平稳,其他行业的信用风险较低且较平稳.  相似文献   

14.
本文对于信用资产组合的优化问题给出了一个稳健的模型,所建模型涉及了条件在险值(CVaR)风险度量以及具有补偿限制的随机线性规划框架,其思想是在CVaR与信用资产组合的重构费用之间进行权衡,并降低解对于随机参数的实现的敏感性.为求解相应的非线性规划,本文将基本模型转化为一系列的线性规划的求解问题.  相似文献   

15.
构建农村信用社信用风险模型对完善农村金融风险管理体系、提高农村信用社经营管理意义重大.基于还款意愿和还款能力两方面,系统分析了影响农信社贷款债务人违约率的主要因素,在此基础上应用logistic方法建立农信社债务人违约率预测模型,并通过Gini系数对模型区分能力和识别能力进行验证评估.实证结果表明,模型中债务人年龄、所在地区、贷款额所占家庭收入比例、与信用社信贷关系密切程度以及户口状况等因素都表现显著;违约率预测模型在样本内和样本外均有较好的违约识别能力,从而可为农信社放贷前的债务人信用评估、贷款发放和风险管理提供有力参考.  相似文献   

16.
This study considers a decentralized supply chain where a retailer has an opportunity to order a product from a supplier prior to the sales season to satisfy uncertain demand. The retailer provides trade credit to end customers and makes credit period and order quantity decisions to maximize profits. The end demand is both random and credit period-dependent. On the basis of the newsvendor model, this paper focuses on channel coordination when a retailer provides trade credit to end customers. When the supplier also provides trade credit to the retailer, we show that the traditional trade credit contract cannot coordinate the channel. Four composite contracts based on trade credit (trade credit cost sharing with buy back or quantity flexibility; modified trade credit with buy back or quantity flexibility) are provided to induce the retailer to make decisions while optimizing the channel profit. This paper shows that the retailer provides a longer credit period to its customers and orders a larger quantity from the supplier under the composite contracts. With these contracts, the profit sharing between both parties depends on the wholesale price (Pareto improvement) for the fixed retail price and the purchasing cost.  相似文献   

17.
遵照国际银行业大多数银行的做法,信用风险评估包括对债务人和债项两个方面.以模糊集理论为基础,通过试算与比较,构造隶属函数,对各指标进行无量纲化处理,建立距离判别函数,评估债务人信用风险.根据债项特征,考察风险四因素:违约概率,特定违约损失,违约敞口,期限,建立0-1整数规划模型,对债项进行风险评估,确定最佳贷款组合,以解决组合贷款的优化决策问题.  相似文献   

18.
Unsupervised classification is a highly important task of machine learning methods. Although achieving great success in supervised classification, support vector machine (SVM) is much less utilized to classify unlabeled data points, which also induces many drawbacks including sensitive to nonlinear kernels and random initializations, high computational cost, unsuitable for imbalanced datasets. In this paper, to utilize the advantages of SVM and overcome the drawbacks of SVM-based clustering methods, we propose a completely new two-stage unsupervised classification method with no initialization: a new unsupervised kernel-free quadratic surface SVM (QSSVM) model is proposed to avoid selecting kernels and related kernel parameters, then a golden-section algorithm is designed to generate the appropriate classifier for balanced and imbalanced data. By studying certain properties of proposed model, a convergent decomposition algorithm is developed to implement this non-covex QSSVM model effectively and efficiently (in terms of computational cost). Numerical tests on artificial and public benchmark data indicate that the proposed unsupervised QSSVM method outperforms well-known clustering methods (including SVM-based and other state-of-the-art methods), particularly in terms of classification accuracy. Moreover, we extend and apply the proposed method to credit risk assessment by incorporating the T-test based feature weights. The promising numerical results on benchmark personal credit data and real-world corporate credit data strongly demonstrate the effectiveness, efficiency and interpretability of proposed method, as well as indicate its significant potential in certain real-world applications.  相似文献   

19.
Within the new bank regulatory context, the assessment of the credit risk of financial institutions is an important issue for supervising authorities and investors. This study explores the possibility of a developing risk assessment model for financial institutions using a multicriteria classification method. The analysis is based on publicly available financial data for UK firms. The results indicate that the proposed multicriteria methodology provides promising results compared to well known statistical methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号