首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
特征筛选方法是处理超高维数据的一种快速有效的降维方法.针对超高维判别分类数据,提出一种改进的超高维特征筛选方法,方法不需要特定的模型假定;可以处理多分类响应变量情形;可适用于离散型或连续型协变量情形;对服从重尾分布的协变量,方法仍具有较好的稳健性.从理论上证明了所提出特征筛选方法满足确定筛选性和指标排序相合性,并通过数值模拟和实例分析在有限样本条件下验证了方法的有效性.  相似文献   

2.
特征筛选方法对于超高维数据分析非常重要。本文基于Hoeffding’s独立检验统计量提出了一种新的条件独立筛选方法,简称为MMCSCIS。该方法具有以下特点:(1)不依赖于模型设定;(2)在自变量或因变量或条件变量的严格单调变换下结果不变;(3)可以同时处理条件特征筛选和特征筛选。通过模拟发现它对因变量或者自变量含有厚尾分布的数据和含有异常值的数据都比较稳健。最后我们通过两个实例分析说明了该方法的有效性。  相似文献   

3.
随着数据收集和存储能力的大幅提高,超高维数据~([9]),即数据维数伴随着样本呈指数增长,频繁出现在许多科学邻域.此时,惩罚类变量选择方法普遍遭遇三个方面的挑战:计算的复杂性,统计的准确性以及算法的稳定性.Fan和Lv~([9])首先提出超高维特征筛选的方法,并在近十多年取得大量研究成果,成为当今统计最热点的研究邻域.本文主要从带模型假设,包含参数、非参数半参数模型假定的筛选方法、无模型假设的筛选以及特殊数据的筛选方法四个角度来介绍超高维筛选相关工作,并简要探讨目前超高维筛选方法存在的问题以及未来可能的研究方向.  相似文献   

4.
在生存分析中,已有一些文献提出处理普通时间事件数据的Cox模型的超高维变量选择方法.然而,对于个体处在多个互斥事件的风险下,即存在竞争风险情形,并不能直接应用这些方法.一个分析竞争风险数据的常用模型就是比例子分布风险(proportional subdistribution hazard,PSH)模型.本文基于确定联合筛选(sure joint screening,SJS)和惩罚近似对数部分似然,对于超高维的PSH模型提出了两阶段变量选择方法,并证明了第一步特征筛选方法的确定筛选性质(sure screening property),即选出的变量集合以概率1渐近地包含实际的显著变量.本文通过Monte Carlo模拟展现了方法的性能和表现,并与确定独立筛选(sure independence screening)方法进行了比较.最后将方法应用到一个关于膀胱癌的公开数据集的分析中.  相似文献   

5.
针对存在缺失数据的超高维可加分位回归模型,本文提出一种有效的变量筛选方法.具体而言,将典型相关分析的思想引入到最优变换的最大相关系数,通过协变量和模型残差最优变换后的最大相关系数重要变量的边际贡献进行排序,从而进行变量筛选.然后,在筛选的基础上,利用稀疏光滑惩罚进一步做变量选择.所提变量筛选方法有三点优势:(1)基于最优变换的最大相关可以更全面的反映响应变量对协变量的非线性依赖结构;(2)在迭代过程中利用残差可以获取模型的相关信息,从而提高变量筛选的准确度;(3)变量筛选过程和模型估计分开,可以避免对冗余协变量的回归.在适当的条件下,证明了变量筛选方法的确定性独立筛选性质以及稀疏光滑惩罚下估计量的稀疏性和相合性.同时,通过蒙特卡罗模拟给出了所提方法的表现并通过一组小鼠基因数据说明了所提方法的有效性.  相似文献   

6.
基于条件收益率的VaR测算方法.在假定股票价格对数与收益率服从二维正态分布的基础上,对每一价格水平,得到条件收益率的分布特征,进而计算条件VaR值.通过分析证明了条件收益率分布与价格水平高低有关,一般价格升高会使条件收益率分布向左侧移动,反之向右侧平移.  相似文献   

7.
二元凸函数的判别条件   总被引:3,自引:0,他引:3  
给出了二元凸函数的定义,导出了二元凸函数的判别条件,该判别条件由二元函数的二阶导数给出.用二元凸函数的判别条件和半正定的(半负定)矩阵的性质,得到了二元二次多项式凸性的简单判别形式.  相似文献   

8.
根据多元t分布的定义及性质,推导出二维t分布随机变量差的条件分布仍服从t分布.在假定股票价格对数与收益率服从二维t分布的基础上,利用该性质,可以得到不同股票价格水平条件下,收益率的一维条件t分布,进而计算出价格条件VaR.利用多元t分布研究价格条件的收益率分布问题,与正态分布相比,较好地刻画了证券收益率分布的尖峰厚尾现象.  相似文献   

9.
设f_n是基于一个核函数K和取值于R~d的独立同分布随机变量列的一个非参数核密度估计.本文推广了在He和Gao(2008)中相应大偏差的结果,即证明统计量sup x∈Rd|f_n(x)-f_n(-x)|的大偏差.  相似文献   

10.
设f_n是基于一个核函数K和取值于R~d的独立同分布随机变量列的一个非参数核密度估计.推广了何和高一文中相应中偏差的结果,即证明统计量sup_(x∈R)~d|f_n(x)-f_n(-x)|的中偏差,并给出了两个具体的模拟例子.  相似文献   

11.
本讨论了矩阵相似与特征多项式相同的等价条件及其相关结构,并指出湖南省某次线性代数自考题中一道命题的错误。  相似文献   

12.
本文考虑超高维部分线性模型,其中线性部分的维数p大于样本量n,且维数p随着样本量n呈指数阶增长.首先,利用半参数回归的profile方法,把超高维部分线性模型转化成超高维线性模型.其次,为了对高维线性分量进行有效的变量筛选,考虑到协变量之间的相关性,结合贪婪算法和向前回归变量筛选方法,针对部分线性模型,提出了profile贪婪向前回归(PGFR)变量筛选方法.在一定正则条件下,证明了所提PGFR方法具有筛选相合性.为了确定所选模型是否能够依概率趋于1包含真实模型,进一步提出了BIC准则.最后,通过模拟研究和实例分析验证了PGFR方法在有限样本下的完成情况.  相似文献   

13.
《数理统计与管理》2013,(4):627-633
本文在收入分布的基础上讨论了基尼系数估算的问题。相比以往研究,本文最大的特点是基于微观数据的收入分布非参数拟合,并利用非参数拟合优度检验的方法对拟合效果进行了验证,结果表明非参数估计的收入分布能跟准确的刻画收入分布的各种特征,拟合效果也更好。在准确拟合收入分布的基础上估算基尼系数,结果表明,城镇和农村居民的收入不平等在增加,而且在1997年后,这种恶化的趋势有所加剧。  相似文献   

14.
基于条件事件代数系统的条件证据组合与条件信任组合   总被引:2,自引:0,他引:2  
讨论基于条件事件代数系统上的条件证据与条件信任问题,给出了条件证据的组合方法,由此可作出在条件下对目标支持的判断,我们还给出了综合各条件证据的无条件目标语据组合,它可看作是从全局角度对目标支持的判断,最后我们给出了基于多值映射的条件信任的组合。  相似文献   

15.
该文导出了不等方差正态母体判别模型中附加信息检验的似然比统计量,并给出了其分布和近似分布.  相似文献   

16.
钱斌 《中国科学:数学》2013,43(5):515-518
本文得到了曲率维数条件CD(ρ,∞) 和CD(0, n)与相应的局部传输信息不等式的等价性.  相似文献   

17.
在特征端点条件下,高度为1的PM函数的任意阶连续迭代根的存在性已经被证明.这就产生了一个在没有特征端点条件下的公开问题,称为特征端点问题.当非单调点个数小于等于迭代根阶数时,此问题在大部分情况下已解决.该文将研究非单调点个数大于迭代根阶数的情形,给出高度为2且阶数也为2的连续迭代根存在的充分条件,部分回答了特征端点问题.  相似文献   

18.
研究了广义限制域的最佳一致逼近问题,在允许有有限个节点的情况下,引入次强内点条件的概念,并将优化理论中的BCQ条件等概念应用到本文所研究的问题中,刻划了次强内点条件、BCQ条件和最佳一致逼近的特征之间的关系.  相似文献   

19.
设$f_n$是基于核函数$K$和取值于$d$-维单位球面${\mathbb{S}}^{d-1}$的独立同分布随机变量列的非参数核密度估计. 我们证明了若核函数是有界变差函数, 随机变量的密度函数$f$是连续的和对称的, $\{\sup_{x\in {\mathbb{SS}}^{d-1}}|f_n(x)-f_n(-x)|,n\ge 1\}$的大偏差原理成立.  相似文献   

20.
伴随我国经济持续快速增长,我国城乡居民收入差距问题不断凸显.依据中国健康和营养调查的微观调查数据,利用非参数核密度估计方法对我国城乡居民收入密度曲线进行估计和分析.研究发现:我国城乡居民收入整体在持续提高,大部分城乡居民分享到了经济快速增长的成果,但中低收入家庭仍然是主体;我国城乡居民收入分布变动与改革开放进程高度相关;城镇居民收入增长速度和向高收入水平流动的速度都要快于农村居民,城乡居民收入差距持续扩大.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号