首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 642 毫秒
1.
针对数据产品呈现双边价值不确定,数据交易平台单方面定价容易造成不公平,如何设定交易双方满意的价格成为推动数据交易平台健康发展的关键问题。通过分析数据交易平台与潜在数据需求者间的交易行为,结合数据产品的特征,构建数据交易双方的收益模型。考虑数据交易双方间存在需求信息不对称及利益冲突,依据机制设计理论和拍卖理论,通过设计拍卖机制来决策最优的数据交易价格。研究发现:拍卖定价机制的信息空间是关于数据交易价格连续单调递减的函数空间,结果函数是由数据需求者投标的需求函数和平台的最大供给量决定。最后,通过算例实验进一步验证了所设计的拍卖定价机制有效性。本文的研究结论可为进行所有权交易的数据产品的价格设定及交易量分配提供理论指导。  相似文献   

2.
基于非平衡数据集的支持向量域分类模型,提出了一种银行客户个人信用预测方法.首先分析了信用预测的主要方法及其不足,然后研究了支持向量域分类模型及其参数的非负二次规划乘性更新算法,进而提出基于支持向量域分类模型的银行客户个人信用预测方法,最后使用人工数据和实际数据对提出方法与支持向量机预测方法进行对比实验.实验结果表明对于银行客户个人信用预测的非平衡数据分析问题,基于支持向量域模型的分类预测方法更有效.  相似文献   

3.
基于SVM理论的一种新的数据分类方法   总被引:2,自引:0,他引:2  
基于 SVM分类器在模式识别问题中有独特的优势 ,本文通过对标准 SVM模型的改造 ,提出了一种新的简单的数据分类方法 .理论分析和实验表明 ,该方法与标准 SVM分类方法相比具有处理大规模数据识别的能力且保持较高的样本识别率 ,节省存储空间等优势 .  相似文献   

4.
本文提出了一个新的部分线性函数多项式回归模型,该模型中响应变量依赖于一个p阶函数多项式和一些非函数型数据的协变量.函数多项式模型、函数线性模型和部分函数线性模型是该模型的特殊情形.本文提出了一个模型探测方法,它能同时探测部分线性函数多项式回归模型中哪些阶是重要的以及哪些非函数型变量是重要的.提出的方法能相合地识别真实的模型并有好的预测表现.数值模拟能清晰地证实我们的理论结果.  相似文献   

5.
基于高频数据度量日内交易活动的风险是目前日内金融数据与风险管理中极具挑战性的研究课题之一。本文从实时交易的角度,使用中国股市分笔交易数据,基于价格持续时间的自回归条件持续时间(ACD)模型,研究日内不规则交易数据的风险测度,利用日内不等间隔波动模型估计了日内交易的即时条件波动率,对日内不等间隔风险价值进行了预测和检验。实证结果发现日内不等间隔风险价值模型能够比较好的刻画日内交易风险,股票投资者和市场监管者可以基于该工具对日内风险做出合理的预测,达到止损避险和控制风险的目的。  相似文献   

6.
基于主题模型的半监督网络文本情感分类研究   总被引:1,自引:0,他引:1  
针对网络评论文本的情感分类问题中存在的数据的不平衡性、无标记性和不规范性问题,提出一种基于主题的闽值调整的半监督学习模型,通过从非结构化文本中提取主题特征,对少量标注情感的文本训练分类器并优化指标调整闽值,达到识别用户评论的情感倾向的目的。仿真研究证明阈值调整的半监督模型对数据非平衡性和无标记性具有较强的适应能力。在实证研究中,对酒店评论文本数据构建的文本情感分类器显示该模型可以有效预测少数类评论样本的情感极性,证实了基于主题模型的闽值调整半监督网络评论文本情感分类模型在实际问题中的适用性与可行性。  相似文献   

7.
识别和预测SNS中某一话题中有影响力的用户,对于营销战略的精准实施和营销成本的节约具有重要意义.已有相关研究大都聚焦于静态情境下的用户影响力识别,而对于用户影响力预测问题的探讨还非常少.因此,本研究提出了一个综合的预测研究框架,结合不同的预测指标选取策略、属性选择方法和数据采样处理流程,并应用多种分类预测算法,对微博平台的用户影响力进行了实证分析.通过多种预测效果评价指标进行验证,表明本文提出的方法在用户影响力预测上具有较高的精度,显著提高了在个人层面的预测效果,在用户影响力预测方面具有较好的应用价值.  相似文献   

8.
分类数据在企业当中常见、易获取.如何利用分类数据进行过程控制、提升质量水平是当前值得关注的课题.本文基于半导体制造背景,建立了硅片研磨过程模型,在前馈控制系统中引入分类数据,提出了一种基于分类数据的前馈控制算法,并以均方误作为指标,通过理论推导及仿真来研究其性能.结果表明,无论在理想状况下还是分类错误存在的情形下,这种控制算法都能够显著地降低参数波动,大幅提升硅片质量.  相似文献   

9.
数据作为当前社会生产各领域中重要的资源,尤其在智慧民生服务中发挥越来越重要的作用。基于数据要素驱动民生服务视角,如何客观对民生服务中养老服务资源实施建设方案科学评价,这对完善整个养老服务体系的建设显得尤为重要。本文从数据要素驱动智慧民生的角度出发,结合模糊理论、博弈论及信息熵相关知识,提出一种多指标的养老服务资源建设分配方案评价方法。该方法针对养老服务的需求特征,分别从日常照料、医疗护理和精神慰藉三个维度构建评价指标体系,进而确定指标的客观权重,并利用优化模型客观地获得多层次结构上标准的交互系数、权重和方案满意度,有效避免了主观偏好不一致的影响。同时,以上海市16个行政区养老服务资源建设分配方案进行方法验证实验。实验结果显示,本文构建的养老服务资源分配方案评估方法具有可行性,且与实际情况契合。本研究是数据驱动民生服务的具体实践,其研究结果可为政府养老服务资源的合理建设实施提供一定的辅助科学决策支持,也为数据要素在智慧民生中提升建设与管理水平提供可借鉴的应用案例。  相似文献   

10.
商品需求预测对于电商企业意义重大,对阿里电商平台的交易数据进行挖掘以获取有效特征,利用特征建立模型对未来两周这些商品的需求进行动态预测,并基于预测结果和成本最小的原则提出分仓规划建议.预测模型选择随机森林做回归,然后在残差分析的基础上建立报童模型求解分仓的库存规划.对特征数量众多的电商交易数据挖掘所建立的模型有助于电商企业进行有效的商品需求预测并据此制定成本更低的分仓规划.  相似文献   

11.
梁爽  刁节文  肖邦 《运筹与管理》2021,30(1):170-176
随着大数据和机器学习的流行,其在破产预测和风险预测领域逐渐崭露头角。本文运用爬虫技术得到885家网贷平台的16815条数据,通过因子分析及模型验证挖掘出了若干能较好评估P2P平台风险的因子。然后本文通过选取的指标体系建立了Logistics回归、支持向量机、BP神经网络、LightGBM等单模型以及融合模型进行学习训练,所建立的融合模型在测试集中得到最高的准确率,说明本文所建的融合模型能较好地评估网贷平台的风险。本文还选取决策树绘图以及对特征进行重要性排名,选取出了对识别问题平台有重要作用的十项特征。这对投资者选取安全平台进行投资或者监管者选取重点平台进行监管有很好的借鉴意义。  相似文献   

12.
基于原始时间属性下的时态数据难以发现规律的特点,文章构建了时态支持向量机模型,该模型通过对输入时态数据的粒度变换,获得多个分类模型,从而能够发现多种规律.在此基础上,结合时态型操纵特征构建了股票操纵模式发现模型,最后在证监会披露的操纵股票真实数据上进行数值实验,实验发现细时态粒度数据的分类模型在识别一般操纵和严重操纵上效果较好,粗时态粒度数据的分类模型在识别未被操纵或轻微操纵上效果较好.在未知数据集上实验,该模型可以有效识别不同程度操纵股票的模式,其中1个时态粒度数据下添加市场差异特征的模型表现最好,识别准确率达到了98.25%.文章验证了在不同时态粒度输入下,时态支持向量机模型能够发现在原始数据上不能发现的模式特征,这对解决一些复杂规律在原始特征下难以被发现的问题具有重要借鉴意义.  相似文献   

13.
《数理统计与管理》2019,(5):812-822
征信数据中的客户往往呈现"好多坏少"的不平衡结构,这种结构使得一般的分类模型在预测客户信用表现时失效。本文基于零膨胀计数模型的建模思想,分别提出处理因变量为二分类变量、多分类变量、计数变量的零膨胀信用评级模型(ZICSM),将客户结构拆分为稳定好客户、不稳定好客户和坏客户三个部分,利用模型自身优势形成严谨和宽松的两套贷款审批机制。ZICSM模型对目标函数进行权数调整,使模型更加关注"坏"客户,在目标函数中加入惩罚项,使模型具备组变量选择功能。此外,本文提出兼顾风险把控和市场份额的RS得分指标,借以评价信用评级模型的分类效果。模拟研究和实证研究的结果表明,ZICSM模型能够提升金融机构的贷款收益,增加其审批机制的灵活性,适用于处理征信数据的不平衡问题。  相似文献   

14.
机器学习在人工智能领域取得了巨大的成就,在学界和业界都掀起了机器学习的热潮.针对股指期货交易速度快、交易频率高和交易量巨大且交易数据具有高纬、时序的特征,构建了新的股指期货量化投资模型,采用沪深300股指期货1分钟高频数据作为研究对象.并对比分析了神经网络、支持向量机和XGBoost对股指期货下1分钟价格的变动方向的预测能力.研究结果表明,三种机器学习方法都具有较好的预测能力,但XGBoost的预测能力要优于传统的神经网络和支持向量机.  相似文献   

15.
随着交易数据和信用数据的积累和完善,网络借贷的利率定价机制逐步演化到平台直接标价的形式。国内一家代表性网络借贷平台经历了这一变化,本文用倾向性分数匹配法对这一变化进行估计。研究发现,平台识别风险的效率提高,改善了贷款质量,表现为违约率的降低。标价机制上调了原本狭窄的期限利率区分度,改善了平台呈现的信息质量,从而影响了投资人的投标行为,获得了更快的投标速度、更高的投标比例以及更弱的羊群行为。相对于平台原先"借款人选择利率-平台审核借款人"的利率形成机制,平台标价具有信息优势,能够根据大数据对借款人的风险进行准确定价,利率区分度的提高改善了平台的信息质量,并影响了投资人的投标行为。加入利率区分度的模型很好地解释了上述变化。这说明,标价机制实现了更高的定价效率,达到了改善平台经营的目的。  相似文献   

16.
《数理统计与管理》2015,(5):831-839
本文针对Tecator数据介绍一种新的模型一部分函数线性变系数模型,并基于样条估计方法得到了模型中未知系数函数的估计,同时在适当的条件下给出了系数函数估计及模型均方预测误差的收敛速度。通过数值模拟说明本文所提估计方法的有效性。最后基于该模型对Tecator数据进行了统计分析。  相似文献   

17.
本文在多种复杂数据下, 研究一类半参数变系数部分线性模型的统计推断理论和方法. 首先在纵向数据和测量误差数据等复杂数据下, 研究半参数变系数部分线性模型的经验似然推断问题, 分别提出分组的和纠偏的经验似然方法. 该方法可以有效地处理纵向数据的组内相关性给构造经验似然比函数所带来的困难. 其次在测量误差数据和缺失数据等复杂数据下, 研究模型的变量选择问题, 分别提出一个“纠偏” 的和基于借补值的变量选择方法. 该变量选择方法可以同时选择参数分量及非参数分量中的重要变量, 并且变量选择与回归系数的估计同时进行. 通过选择适当的惩罚参数, 证明该变量选择方法可以相合地识别出真实模型, 并且所得的正则估计具有oracle 性质.  相似文献   

18.
经典的测量知情交易概率的模型默认交易者可以无限制的按照私有信息进行卖空交易,而目前我国股票市场存在卖空限制,直接将经典模型应用到我国股票市场时会使测量结果出现偏差。考虑到我国股票市场现状,本文在经典的知情交易概率模型中引入两个卖空限制参数,构建了本文的SC-TPIN模型。通过对融券标的中发生利空消息的股票样本进行实证分析,证实了本文构建的SC-TPIN模型估计出的结果与实际情况相符合。本文还以SC-TPIN模型估计出的SCTPIN值为参照,基于样本股票的低频数据构建了知情交易识别指标组,并使用数据挖掘中的支持向量机算法、KNN算法及Logit模型对黑白样本的知情交易高低情况进行识别比较,构建知情交易识别体系,发现使用支持向量机算法识别全样本的正确率达到了89%,识别效果较理想。  相似文献   

19.
植物遗传与基因组学研究表明许多重要的农艺性状有影响的基因位点不是稀疏的,受到大量微效基因的影响,并且还存在基因交互项的影响.本文基于重要油料作物油菜的花期数据,研究中等稀疏条件下的基因选择问题,提出了一种两步Bayes模型选择方法.考虑基因间的交互作用,模型的维数急剧增长,加上数据结构特别,通常的变量选择方法效果不好.本文提出两步变量选择的方法:首先利用Kolmogorov特征扫描方法筛除那些明显不重要的变量,达到降维的目的;其次,在选出的位点中考虑交互作用.为了克服Bayes方法计算速度慢的问题,本文在模型中引入指示变量,通过估计指示变量的后验分布选择模型.模拟结果表明本文提出的方法在预测精度和计算稳定性上有良好的表现,与不加指示变量的Bayes方法相比,在预测精度上有很大的提高.最后,利用本文提出的方法分析一个油菜花期数据,发现了一些交互效应的基因位点.  相似文献   

20.
借助优势比信息识别不可忽略缺失数据的模型参数   总被引:1,自引:0,他引:1  
由不可忽略缺失机制引起的缺失数据,常使得模型变得不可识别。对于那些不可识别的模型,可以通过添加协变量和借助其他来源的外部数据来达到识别的目的。本文探讨不可忽略缺失机制下,利用外部获得的优势比估计,来达到识别联合概率的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号