首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
客户信用评估是银行等金融企业日常经营活动中的重要组成部分。一般违约样本在客户总体中只占少数,而能按时还款客户样本占多数,这就是客户信用评估中常见的类别不平衡问题。目前,用于客户信用评估的方法尚不能有效解决少数类样本稀缺带来的类别不平衡。本研究引入迁移学习技术整合系统内外部信息,以解决少数类样本稀缺带来的类别不平衡问题。为了提高对来自系统外部少数类样本信息的使用效率,构建了一种新的迁移学习模型:以基于集成技术的迁移装袋模型为基础,使用两阶段抽样和数据分组处理技术分别对其基模型生成和集成策略进行改进。运用重庆某商业银行信用卡客户数据进行的实证研究结果表明:与目前客户信用评估的常用方法相比,新模型能更好地处理绝对稀缺条件下类别不平衡对客户信用评估的影响,特别对占少数的违约客户有更好的预测精度。  相似文献   

2.
数据挖掘——电信客户流失分析预测   总被引:6,自引:0,他引:6  
从历史数据中挖掘有效信息从而运用到商业决策中已经成为统计的一个重要应用方向。本文主要是对电信行业客户流失情况进行数据挖掘,针对某运营商的历史数据资料,通过对已流失的客户和在网客户的自然属性和行为属性进行统计分析、挖掘,建立客户流失的预测模型,模型分析导致客户流失的主要因素,预测在网客户在一定时间内流失的可能性。本文中采用IBM的db2平台中的IM(Intelligent Miner)中的决策树和径向基函数进行建模和测试模型,再用IM Scoring进行预测。  相似文献   

3.
郑健  刘人境 《运筹与管理》2022,31(9):210-216
在电力体制改革全面深化的背景下,我国西部偏远地区的电力企业面临较为严重的人员流失问题。员工离职预测越来越受到电力企业关注,然而传统预测算法无法有效解决电力企业员工离职数据集的不平衡问题。基于此,本文提出一种基于区间变量的随机森林算法,采用青海省电力公司2009~2017年人力资源数据集进行实证分析,并与决策树、支持向量机、随机森林算法的预测效果进行对比。结果表明,该算法更适合解决数据不平衡问题,具有更高的预测精度;同时分析得到员工离职的重要特征,为相关电力企业人力资源管理提供决策依据。  相似文献   

4.
上市公司财务造假是一种违规行为,对其精确、有依据的预测有一定的研究价值.使用多种统计方法提取特征,并结合经济学意义得到了最终特征集.针对数据的不平衡问题,采用过采样、欠采样以及SMOTE采样等方法进行处理.最后采用3种神经网络模型融合的方法,以AUC值为评价指标来预测财务造假的上市公司.  相似文献   

5.
银行信用卡业务属于高收益、高风险的业务,如何实现对信用卡的客户流失控制是发卡银行迫切需要解决的问题.目前,随着银行积累了大量的数据,并建立了数据仓库,使得采用数据挖掘技术来实现信用卡客户流失分析成为了可能.利用双子支持向量机,基于某商业银行的信用卡数据,建立了信用卡流失分析模型,实验结果证明了方法的有效性.  相似文献   

6.
基于非平衡数据集的支持向量域分类模型,提出了一种银行客户个人信用预测方法.首先分析了信用预测的主要方法及其不足,然后研究了支持向量域分类模型及其参数的非负二次规划乘性更新算法,进而提出基于支持向量域分类模型的银行客户个人信用预测方法,最后使用人工数据和实际数据对提出方法与支持向量机预测方法进行对比实验.实验结果表明对于银行客户个人信用预测的非平衡数据分析问题,基于支持向量域模型的分类预测方法更有效.  相似文献   

7.
数据挖掘技术能有效地挖掘出潜在的银行客户,能够大大提高银行的竞争力.介绍了数据挖掘技术中常用的三种模型:逻辑回归模型、BP神经网络模型和决策树模型,同时构造了一种新模型——逻辑回归与BP神经网络混合的模型,然后分别采用这四种模型对可能影响银行客户是否认购定期存款的影响因素进行数据挖掘分析,分别构建了基于逻辑回归模型、BP神经网络模型、逻辑回归与BP神经网络的新模型、决策树模型的银行客户定期存款认购的四种模型,同时利用R语言分别对这四种模型进行分析,分别用ROC曲线的AUC值和正确率比较这四种模型的功效强弱以及稳定性,研究结果表明,给出的新模型——逻辑回归与BP神经网络的新模型的预测效果更好,训练集和测试集预测的准确率分别为0.936和0.931,训练集和测试集ROC曲线的AUC值分别为0.998和0.987,这可以大大缩小银行推送认购定期存款的客户范围,有效地挖掘出潜在的银行客户,可以大大提高银行的效率.  相似文献   

8.
陶朝杰  杨进 《经济数学》2020,37(3):214-220
虚假评论是电商发展过程中一个无法避免的难题. 针对在线评论数据中样本类别不平衡情况,提出基于BalanceCascade-GBDT算法的虚假评论识别方法. BalanceCascade算法通过设置分类器的误报率逐步缩小大类样本空间,然后集成所有基分类器构建最终分类器. GBDT以其高准确性和可解释性被广泛应用于分类问题中,并且作为样本扰动不稳定算法,是十分合适的基分类模型. 模型基于Yelp评论数据集,采用AUC值作为评价指标,并与逻辑回归、随机森林以及神经网络算法进行对比,实验证明了该方法的有效性.  相似文献   

9.
由于高维数据的稀疏性,导致高维空间中的数据处理方法与低维空间中存在显著差异,合理的变量选择方法是解决高维数据问题的一个前提.从理论方面探讨Logistic模型中参数的MCP方法的Oracle性质,证明了MCP估计具有良好的理论性质.在搜索引擎广告转化率预测模型中,对比了几种不同变量选择方法的预测效果.结果表明MCP方法在处理高维稀疏数据时,准确率最高.通过方法筛选出若干显著影响广告转化率的特征变量,为广告主制定广告策略提供相应的理论依据.  相似文献   

10.
违约判别临界点是金融机构是否接受客户贷款申请的重要参考,合适的违约判别临界点对减少金融机构贷款损失实现稳健经营具有重要意义。本文研究的问题是如何保证计算客户违约概率的准确性,并找到利润最大化的违约判别临界点。本文的创新与特色:一是通过将多个不同类型的违约判别模型计算的客户违约概率进行加权平均,保证了计算客户违约概率的的整体准确性,避免了使用单一模型计算客户违约概率不准确的弊端;二是通过定义金融机构从贷款中获得利润的计算公式,以利润最大为目标,求解违约判别临界点,避免了现有计算临界点的方法如广义对称点估计和经验似然法等方法得到的临界点利润不是最大的弊端。研究发现:混合模型比单一模型的准确性高,AUC值显著提高;在人人贷数据集中本文的违约判别临界点下贷款利润远高于其他方法下临界点的利润。  相似文献   

11.
基于学习—遗忘效应的生产率降低损失索赔研究   总被引:1,自引:0,他引:1  
建设工程项目很多具有重复性施工的特点,本文利用这种特点将学习-遗忘效应应用到平衡作业线(LOB)方法中,分析因为工程中断造成生产率的降低的现象,认为因生产率降低而导致工程工期的延长实际上超过工程实际中断的时间,最后以一个工程案例来说明分析过程.  相似文献   

12.
13.
Communicated by D.R.Brown  相似文献   

14.
We give a treatment of the Weiertrass points of curves which is a little different from the treatment by Laksov. We introduce the notion of theith weight which makes the treatment easier and gives an algorithm for computing the gap sequence of an effective divisor and the weight at a point. Supported in part by NNSF of China.  相似文献   

15.
16.
17.
Rendiconti del Circolo Matematico di Palermo Series 2 - A closed densely defined operatorT on a Banach spaceX is called normal, iff $$T \in [C^0 (\hat \not C)]$$ , i.e. there is a homomorphism...  相似文献   

18.
Every c-finite measure Μ on the set G of the lines on the plane such that $$(0){\text{ }}\mu {\text{(\{ g}} \in G:{\text{ }}P \in {\text{g\} ) = 0}}$$ for every point P?R 2 generates a pseudo-metric F on the plane when one puts F P 1, P 2= \(\tfrac{1}{2}\) μ({gG:g separates the points P 1 and P 2}) The pseudo-metrics which are generated in this way possess the property of linear additivity, that is F(P 1,P 3)=F(P 1,P 2)+F(P 2,P 3) for P 1,P 2,P 3 on a line, P 2 between P 1 and P 3, and are continuous with respect to the Euclidean topology in R 2 × R 2. In this paper we prove the converse: every linear additive and continuous pseudo-metric F is generated as above by some c-finite measure Μ on G for which (0) holds. The method of proof shows that values of linearly additive and continuous pseudo-metric F inside every bounded convex polygon C are determined completely by the values of F on (δC)2. The representation of pseudo-metrics by measures is useful in derivation of inequalities for the former.  相似文献   

19.
基于SMMC模型的数据多流形结构分析研究   总被引:1,自引:0,他引:1  
采用混合多流形谱聚类模型(SMMC)对独立子空间、非独立子空间,非线性良分离及非线性交叉等流形聚类中的四种典型数据进行聚类,并与其他流形聚类方法进行比较,发现SMMC模型聚类效果良好且具有强鲁棒性和泛化能力.将SMMC模型运用于具有混合多流形结构的工件外部边缘轮廓进行聚类,结果显示SMMC模型能够很好的将其分为三类.针对SMMC模型复杂度高、选取参数困难及运行时间长的问题,提出了基于模拟退火遗传算法SMMC模型,结果发现改进后的模型能够大大缩短运行时间.  相似文献   

20.
《Discrete Mathematics》2020,343(8):111915
Ivashchenko proposed the study of contractible transformations on graphs because of their applications to computer image analysis, theory of molecular spaces, and digital topology. He published five papers on this subject. Contractible transformations have recently been applied to topological data analysis. This paper presents a counterexample to several results that appeared in one of Ivashchenko’s works.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号