首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
区间型符号数据是一种重要的符号数据类型,现有文献往往假设区间内的点数据服从均匀分布,导致其应用的局限性。本文基于一般分布的假设,给出了一般分布区间型符号数据的扩展的Hausdorff距离度量,基于此提出了一般分布的区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于本文提出的基于扩展的Hausdorff距离度量的SOM聚类算法的有效性优于基于传统Hausdorff距离度量的SOM聚类算法和基于μσ距离度量的SOM聚类算法。最后将文中方法应用于气象数据的聚类分析,示例文中方法的应用步骤与可操作性,并进一步评价文中方法在解决实际问题中的有效性。  相似文献   

2.
对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。  相似文献   

3.
《数理统计与管理》2014,(4):634-641
基于Hausdorff距离用于定义两个紧集之间距离的考虑,将区间数视为一个紧集,定义了区间数之间的距离,并研究了区间向量的距离,从而得到聚类分析中两个样品间的距离。进一步定义了两个类之间的Hausdorff距离。为消除量纲对聚类结果的影响,研究了区间数据的标准化。基于此,给出了区间数据系统聚类算法。采用随机模拟的方法,对文中方法进行有效性评价,结论表明,Hausdorff距离法的聚类有效性在所有设计的实验条件下都要优于传统的欧式距离法。最后,基于符号数据分析的思想构造区间数据,给出了对多种动物群体按其身高、体重等生理特征进行聚类分析的算例。  相似文献   

4.
符号数据分析是一种新兴的数据挖掘技术,区间数是最常用的一种符号数据。研究应用区间型符号数据的PCA方法来评价股票的市场综合表现问题。首先介绍了符号数据分析的基本理论。接下来研究了区间数据样本的经验描述统计量的计算,并基于经验相关矩阵,给出了区间主成分分析的算法,该算法最终得到区间数表达形式的主成分取值。最后选取上海证券交易市场20支股票在某一周上的交易数据,进行了实证研究,基于区间主成分得分的矩形图表示,将20支股票按其市场综合表现分成了四类。  相似文献   

5.
基于“蒙特卡罗仿真”的思想,采用随机模拟的方法从混合数据形式的角度对密度算子进行拓展研究。首先,给出了一种将混合数据转化为区间数的方法,并通过平移和放大或缩小处理,将所有区间数放到同一区间范围内;然后,运用随机数发生器给出区间上某分布的随机数信息,并依据随机数的分布情况对其进行聚类,给出了密度权重的确定方法;在此基础上,将随机模拟的方法应用于密度算子信息集结模型中,得到带有概率信息的评价结论。最后,通过一个算例验证了方法的有效性。  相似文献   

6.
在治愈率模型中,感兴趣的事件只发生在一部分个体上,对另外的个体而言,感兴趣的事件一直不会出现.所有的个体被分为两类:可治愈的个体和不可治愈的个体.在寿命数据的研究中,加速失效模型的研究成果很多,但大多数是基于右删失数据进行的,区间删失数据的研究成果相对较少,特别是当研究总体包含有治愈的部分时.本文研究的是Ⅰ型区间删失数据下的一类加速失效治愈率模型.假定协变量对个体被治愈的概率的影响用逻辑斯蒂克模型表示,未治愈个体的发病时间用加速失效模型进行分析.文中采用EM算法得出了模型参数的极大似然估计,并用模拟计算的方式验证了估计量的有效性.  相似文献   

7.
聚类区间删失失效时间常出现于医学研究中研究对象来自同一个类中的情形.此外,失效时间可能与类的大小相关.由于缺乏直接分析所需的推演过程,因此常见的简单方式就是简化区间删失数据.鉴于此,本文提出了类内重抽样方法来考虑加法风险模型下的Ⅱ型区间删失问题.类内重抽样的方法简单但需要大量计算,这一方法的主要优势在于在类的大小相关时,估计变量易于实现.渐近性质和部分模拟结果的讨论验证了该方法的有效性.  相似文献   

8.
在这篇文章中,我们针对一般冲击模型,研究Bayes方法处理无失效数据的问题.所谓一般δ-冲击模型是指系统受到强度为λ的Poisson冲击,当两个连续冲击之间时间间隔的长度不属于某个固定的区间[δ1,δ2]时,系统将失效.我们分别选择均匀分布和Beta分布作为先验分布,用Bayes方法和多层Bayes方法得到了参数δ1和δ2的估计.  相似文献   

9.
本文研究了加法风险率模型下聚类的当前状态数据(Ⅰ型区间删失数据)的回归分析问题.在相关的失效时间数据与簇类的规模有关的情形下,本文提出了一个簇内再抽样方法,并在一些正则条件下给出了相应估计量的极限分布理论.最后通过模拟实验验证了估计量的有限样本行为.  相似文献   

10.
彩票中奖号码是否公平,可以通过中奖号码的数字是否服从离散均匀分布来衡量.以浙江某体育彩票为例,运用x~2检验,KS检验,Wilcoxon秩检验以及基于Pratt带结模型的Wilcoxon符号秩检验的方法来研究彩票中奖号码的公平性,运用不同的假设检验方法来研究彩票是否符合均匀分布,且用轮次统计量检验方法检验了彩票样本的独立性.从而得到彩票中奖号码服从离散均匀分布的结论.并且通过模拟不同的数据来检验文章上述几种检验方法的可靠性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号