共查询到20条相似文献,搜索用时 180 毫秒
1.
2.
提出了变系数模型条件分位估计的一种新方法.变系数模型已经成为经济学、流行病学、纵向数据和医学领域处理高维数据的有力工具.该模型有助于探测数据的动态特征、降低模型偏差、避免高维灾难,同时便于解释.尽管关于变系数模型条件均值的估计已经有很多文章,但关于变系数模型条件分位的估计方面的文章相对较少.文中提出了一种有效的适应性分位回归方法来诊断出齐性邻域,进行局部自适应窗宽选择和局部线性逼近,同时给出了估计量的风险界和最优窗宽的自动选择准则.模拟研究说明了所提出估计方法的效果. 相似文献
3.
高维空间中数据的相似性度量 总被引:5,自引:0,他引:5
高维空间中数据之间的相似性度量是目前数据挖掘、信息处理与检索等领域所面临的一个重要问题.文章在总结分析了高维数据的特点以及现有的一些度量方法的基础上,提出了一种新的度量方式,该方法在对高维数据进行相似性度量之前,首先对原始数据空间进行网格划分.文章的最后对其有效性作了定量分析,实验证明,该方式是行之有效的. 相似文献
4.
5.
6.
随着传感技术和数据采集系统的逐渐完善,大量复杂高维数据可以被收集,对多变量和高维数据流进行监控往往是现代制造业和质量管理部门的一个基本要求.然而,在高维数据监控领域中,由于“维数的诅咒”以及变量的分布通常是复杂未知的,大多数传统的多元控制图不再适用.针对这种情况,一些研究者讨论了对分布未知且复杂高维数据的均值向量的各种检验,但这些检验很少适用于Phase II阶段的过程监控.文章提出了一种基于高维经验似然比检验的EWMA型非参数监控方案,该方案可用于多元过程和高维过程均值向量的监控,并且适用于子组数据流.所提出的控制图不仅易于实现和解释,而且蒙特卡罗数值模拟结果显示该控制图在对称、偏态、厚尾分布中都能有效地监测均值漂移.最后,将所提出的控制图应用于半导体制造过程,结果显示文章的方法对未通过测试的半导体具有良好的监控效果. 相似文献
7.
高维小波分析是分析和处理多维数字信号的有力工具.基于任意的三维正交尺度函数及相应的正交小波,提出一种构造三维插值对称尺度函数和对称小波的方法,并建立了多维信号采样定理,这一点在信号处理中具有很好的应用价值.最后给出了数值算例. 相似文献
8.
针对传统DBSCAN算法对高维数据集聚类效果不佳且参数的选取敏感问题,提出一种新的基于相似性度量的改进DBSCAN算法.该算法构造了测地距离和共享最近邻的数据点之间的相似度矩阵,克服欧式距离对高维数据的局限性,更好地刻画数据集的真实情况.通过分析数据的分布特征来自适应确定Eps和MinPts参数.实验结果表明,所提GS-DBSCAN算法能够有效地对复杂分布的数据进行聚类,且在高维数据的聚类准确率高于对比算法,验证了算法的准确性和可行性. 相似文献
9.
高维积分波动率矩阵是资源配置和风险管理的重要统计量,对其估计是金融统计和风险度量中的热点和核心问题之一.本文在带有市场信息的微观结构噪声下,考虑了高频金融数据大量资产的积分波动率矩阵估计问题.在多资产价格观察不同步下,当资产数和样本量都趋向于无穷时,本文利用不重叠区间方法和稀疏性特征提出了高维积分波动率矩阵估计,证明了该估计量具有相合性,较在加性噪声下的估计具有更快的收敛速度,其收敛速度可以达到已存在高维积分波动率矩阵估计在无噪声下的最快收敛速度.对所提出的估计与现有的高维积分波动率矩阵估计进行模拟比较,结果表明本文提出的估计方法具有优良的性质.最后将提出的估计应用于上海证券指数数据的实证研究中. 相似文献
10.
PP 型拟合优度检验 总被引:1,自引:0,他引:1
摄影寻踪(Projection Pursuit,简称PP)是一种新兴的用来处理高维数据的统计方法,其主要思想是通过极大化某个投影指标(通常是分布函数的泛函)来寻找低维投影,通过对其低维投影数据的研究来发现高维数据的性质.PP 方法自首次提出,已用于处理一些非正态多维数据分析问题,如回归、判别、聚类、密度估计等. 相似文献
11.
12.
基于仿酉矩阵的对称扩充方法,该文提出了一种尺度因子为3的紧支撑高维正交对称小波构造算法.即设φ(x)∈L~2(R~d)是尺度因子为3的紧支撑d维正交对称尺度函数,P(ξ)是它的两尺度符号,p_(0,v)(ξ)为P(ξ)的相位符号.首先提出一种向量的对称正交变换,应用对称正交变换对3~d维向量(p_(0,v)(ξ))_v,v∈E_d的分量进行对称化.通过仿酉矩阵的对称扩充,给出了3~d-1个紧支撑高维正交对称小波构造.这种方法构造的小波支撑不超过尺度函数的支撑.最后给出一个构造算例. 相似文献
13.
对医疗费用的建模分析与合理预测是医疗保险费用厘定的基础与根本.医疗费用中的高维附加信息在长期预测中具有重要作用.然而,传统的统计建模方法不适用于处理高维纵向数据下的医疗费用.本文提出部分线性多指标可加模型,对具有高维特征的纵向医疗费用数据进行拟合与预测,并且使用两种不同的降维估计方法进行模型估计,并将该模型应用于一组含... 相似文献
14.
高维回归分析的变量选择问题是目前统计学研究的一个热点和难点问题.提出了一个基于条件分布函数的相关性度量准则,并在此基础上提出三种变量选择方法.与现有的方法相比,提出的方法不依赖于统计模型,可以适用于线性模型和非参数可加模型.数值模拟结果表明,即使协变量之间存在一定的相关性,方法也有较为满意的表现. 相似文献
15.
PP 方法是近年来兴起的一种处理高维数据的统计方法。它最早是由 Kruskal(1969,1972)提出来的。PP 的基本思想是把高维数据投影到低维空间中去。这样,通过对某些感兴趣的投影方向上的数据处理来解决高维问题,因而 PP 方法中最根本的问题是投影方向的选择以及选定方向后如何导出高维结构。PP 是 Projection Pursuit 的缩写,一般译为投影寻踪。 相似文献
16.
基于高维数据预测方法的应用,提出一种分维权重样条插值预测算法.通过高维数据的各维,建立样本各维数据与对应权重的网络结构关系,网络的结点个数与样本的个数无关.通过训练样本各维权重所满足的线性方程组得到各维的权值,再根据样本的各维数据值和所得到的对应权值进行三次样条插值,得到各维数据值的权值函数,而不是传统方法的常数,这克服了个别数据变化所带来的整体度量值发生较大变化的缺点.数值仿真实验表明:分维权重样条插值预测算法不失是一种稳定而灵活的算法,而且预测的精度较高,可以根据样条插值函数得到样本各维的权值. 相似文献
17.
在响应变量带有单调缺失的情形下考虑高维纵向线性回归模型的变量选择.主要基于逆概率加权广义估计方程提出了一种自动的变量选择方法,该方法不使用现有的惩罚函数,不涉及惩罚函数非凸最优化的问题,并且可以自动地剔除零回归系数,同时得到非零回归系数的估计.在一定正则条件下,证明了该变量选择方法具有Oracle性质.最后,通过模拟研究验证了所提出方法的有限样本性质. 相似文献
18.
投影寻踪方法与高光谱遥感图像数据特征提取的研究 总被引:4,自引:0,他引:4
高光谱技术的发展与应用对高维的高光谱遥感数据的处理方法提出了更高的要求,投影寻踪方法是一种处理高维数据的十分有效的降维方法。高光谱图像分析对投影寻踪方法仍是一个全新的领域。本文介绍了投影寻踪的一般概念。分析了基于信息散度指标投影的寻踪方法在高光谱图像处理中的应用,给出了它与主成份分析处理结果的对比。并提出PP与高光谱研究将来的发展方向。 相似文献
19.
当有很多候选模型并且不确定使用哪个模型时,模型平均是一种值得采用的方法.相对于单个模型,模型平均通常能够提高预测精度.文章提出了高维泊松回归的模型平均方法,证明了其最优性质,并通过数值模拟发现该方法能够提高计数变量的预测精度.同时,考虑到高维数据下,候选模型过多的问题,文章也提出了一种新的模型筛选方法:基于最小角回归(LARS)的LASSO(或ALASSO)修正算法的模型筛选方法.该种方法,可以大大减少计算负担.数值模拟也显示了该方法有很好的表现. 相似文献
20.
由于高维数据的稀疏性,导致高维空间中的数据处理方法与低维空间中存在显著差异,合理的变量选择方法是解决高维数据问题的一个前提.从理论方面探讨Logistic模型中参数的MCP方法的Oracle性质,证明了MCP估计具有良好的理论性质.在搜索引擎广告转化率预测模型中,对比了几种不同变量选择方法的预测效果.结果表明MCP方法在处理高维稀疏数据时,准确率最高.通过方法筛选出若干显著影响广告转化率的特征变量,为广告主制定广告策略提供相应的理论依据. 相似文献