共查询到10条相似文献,搜索用时 46 毫秒
1.
区间型符号数据是一种重要的符号数据类型,现有文献往往假设区间内的点数据服从均匀分布,导致其应用的局限性。本文基于一般分布的假设,给出了一般分布区间型符号数据的扩展的Hausdorff距离度量,基于此提出了一般分布的区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于本文提出的基于扩展的Hausdorff距离度量的SOM聚类算法的有效性优于基于传统Hausdorff距离度量的SOM聚类算法和基于μσ距离度量的SOM聚类算法。最后将文中方法应用于气象数据的聚类分析,示例文中方法的应用步骤与可操作性,并进一步评价文中方法在解决实际问题中的有效性。 相似文献
2.
对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。 相似文献
3.
《数理统计与管理》2014,(4):634-641
基于Hausdorff距离用于定义两个紧集之间距离的考虑,将区间数视为一个紧集,定义了区间数之间的距离,并研究了区间向量的距离,从而得到聚类分析中两个样品间的距离。进一步定义了两个类之间的Hausdorff距离。为消除量纲对聚类结果的影响,研究了区间数据的标准化。基于此,给出了区间数据系统聚类算法。采用随机模拟的方法,对文中方法进行有效性评价,结论表明,Hausdorff距离法的聚类有效性在所有设计的实验条件下都要优于传统的欧式距离法。最后,基于符号数据分析的思想构造区间数据,给出了对多种动物群体按其身高、体重等生理特征进行聚类分析的算例。 相似文献
4.
符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。研究应用区间型符号数据的PCA方法来评价股票的市场综合表现问题。首先介绍了符号数据分析的基本理论。接下来研究了区间数据样本的经验描述统计量的计算,并基于经验相关矩阵,给出了区间主成分分析的算法,该算法最终得到区间数表达形式的主成分取值。最后选取上海证券交易市场20支股票在某一周上的交易数据,进行了实证研究,基于区间主成分得分的矩形图表示,将20支股票按其市场综合表现分成了四类。 相似文献
5.
6.
7.
8.
9.
本文研究了加法风险率模型下聚类的当前状态数据(Ⅰ型区间删失数据)的回归分析问题.在相关的失效时间数据与簇类的规模有关的情形下,本文提出了一个簇内再抽样方法,并在一些正则条件下给出了相应估计量的极限分布理论.最后通过模拟实验验证了估计量的有限样本行为. 相似文献
10.
杨斌 《数学的实践与认识》2015,(2):219-224
彩票中奖号码是否公平,可以通过中奖号码的数字是否服从离散均匀分布来衡量.以浙江某体育彩票为例,运用x~2检验,KS检验,Wilcoxon秩检验以及基于Pratt带结模型的Wilcoxon符号秩检验的方法来研究彩票中奖号码的公平性,运用不同的假设检验方法来研究彩票是否符合均匀分布,且用轮次统计量检验方法检验了彩票样本的独立性.从而得到彩票中奖号码服从离散均匀分布的结论.并且通过模拟不同的数据来检验文章上述几种检验方法的可靠性. 相似文献