共查询到10条相似文献,搜索用时 46 毫秒
1.
高维大数据的相似性计算是数据挖掘领域的研究重点,论文通过分析高维大数据相似性计算的难点,提出采用可拓学的方法解决其中矛盾问题的研究思路。在基元表示高维大数据的基础上,借助数据转换、数据筛选、权重的确定、数据预处理等技术实现了数据之间的相似性计算,并基于水污染常规分析数据进行了算法验证。论文借助可拓的思想研究大数据相似性的问题,不仅对数据挖掘的研究有一定的理论促进,同时也为可拓学的研究提供了新的应用空间。 相似文献
2.
3.
考虑n维散乱数据Hermit-Birkhoff型插值问题,在使给定的目标泛极小的条件下,构造了一种带自然边界条件的多元多项式样条函数插值方法.重点研究了插值问题解的特征,存在唯一性和构造方法,并讨论了收敛性及误差,最后给出了一些数值算例对方法进行验证. 相似文献
4.
大数据具有体量大、种类丰富、增长速度快等特点,同时也存在价值密度低、代表性差等问题,为抽样调查带来了机遇与挑战.大数据背景下的抽样如何适应新的变化、具有怎样的发展和应用?文章从三个角度进行了讨论.一是在数据流环境下产生了一些适应性强的新型抽样方法,能够高效、准确地获得有代表性样本,并兼顾存储空间、处理的时间与能力.二是... 相似文献
5.
6.
企业的历史销售记录是供应链优化研究的基础数据来源,然而,在日常的研究中,几乎所有可以通过公开途径获得的销售记录都是高度不完整的,这为研究者开展工作带来了极大的不便。为解决此问题,本文提出,以销售数据集中已有的数据为基础,使用面向时序数据的矩阵分解模型MAFTIS对其缺失的部分进行估算,从而把残缺的数据集补全完整。进一步地,为提高MAFTIS的计算效率,本文还为该模型设计了一种基于交替最小二乘法的求解策略MAFTISALS。在评估实验中,MAFTISALS被用于三个真实销售数据集的缺失记录估计,结果显示,与其它估计模型相比,MAFTISALS能获得更准确的估计结果,并且具有更高的收敛速度。 相似文献
7.
8.
成分数据具有非常复杂的数学性质,很多传统的统计分析方法对其是失效的,因此,在研究中必须采用特殊处理和专门技术.着重讨论了成分数据相关系数的计算方法,由于普通数据的相关系数计算方法只适用于两组单变量数据,而传统的典型相关分析又鉴于成分数据的特殊性质而不能直接使用,故结合logratio变换和典型相关分析技术,提出了一种针对成分数据的相关系数计算方法,成功地解决了这一问题. 相似文献
9.
针对子弹自动自动匹配问题,首先利用子弹表面为圆柱面的假设,对采集得到的数据进行误差校正,然后将圆柱面上的深度数据展开到平面上,用经典的中值滤波和平滑算法去除噪声,良好的数据预处理算法对后续的特征提取和子弹匹配起到了重要作用.一方面将z轴数据映射到二维图像上,提出了基于统计的鲁棒的互相关性系数准则,另一方面,对三维数据进行可视化操作,显示划痕条数、划痕宽度等宏观特征,二者结合起来对子弹进行匹配.实验表明,方法取得了良好的效果,具有高达80%以上的识别率. 相似文献
10.
《数学的实践与认识》2013,(21)
在实际的调查数据和实验数据中,经常会出现数据缺失的问题,插补方法是处理缺失数据的一种常用的技术方法.对于目标变量是二分类的定性变量时,可以采用Logistic回归插补法进行插补,采用一套高中生进入大学学习影响因素分析的模拟数据进行实证分析,探讨了Logi8tic回归插补法的一些特点. 相似文献