共查询到20条相似文献,搜索用时 15 毫秒
1.
结合粒计算粗糙集理论和k-匿名理论的最新研究现状,从粒化角度出发,提出个性粒化k-匿名隐私保护方法.针对电子商务中隐私保护个性粒化决策选择度的不同,提出一种新的隐私保护方法:个性粒化k-匿名并给出了相关算法和定义,旨在实现更为合理的个性化隐私保护,提高隐私保护的精度. 相似文献
2.
3.
桑蚕种良卵率是蚕种质量检验的重要指标,控制样本间卵粒数的偏差是保证良卵率准确性的关键。通过对桑蚕卵粒重的调查分析,得出其分布服从正态分布。若从一批蚕种中抽取1g卵作为样本,则来自同一总体的2个样本的卵粒数之差不超过16粒,其置信概率为95%;当置信概率取99%时,两个样本的卵粒数之差不超过21粒。文章为蚕业生产提供了一种实用的克卵粒数偏差控制方法。 相似文献
4.
针对信息系统属性约简问题,通过借助粒关系包含度矩阵这一中间工具,给出一种决策表属性启发式约简算法.首先,计算决策表中条件属性与决策属性之间的粒关系包含度矩阵;然后,将粒关系包含度矩阵中隐含的信息L_B作为启发式算子对决策表进行属性约简;最后,删除冗余属性并设置终止条件,实现决策表的属性约简.通过实例验证了该算法的有效性. 相似文献
5.
马氏(Mahalanobis)距离在数据分析中具有广泛应用,但目前对协方差矩阵奇异时马氏距离的定义和几何解释却不尽相同,导致距离值不唯一,影响了它的应用.当使用p×p协方差矩阵M的Moore-Penrose广义逆矩阵代替它的逆矩阵M~(-1)时,一个p维样本向量x到多维正态分布N(μ,M)(M的秩rp)的马氏距离依赖于x与μ的前r维分量,从而导致x携带信息的损失.为充分利用样本信息,组合马氏距离和欧氏距离给出M奇异时马氏距离的一种计算方法,新方法具有明确的几何解释.最后给出协方差矩阵奇异时计算广义马氏距离的几何解释和一个算例. 相似文献
6.
模糊粗糙集作为处理不确定性信息的有效工具,已广泛应用于特征选择中。然而当数据分布密度差别较大时,传统模糊粗糙近似不能有效度量样本的隶属度,且大多特征评价函数仅从代数或信息单一视角构造。针对以上问题,提出了一种基于模糊邻域相对依赖互信息的特征选择方法。首先,为克服传统模糊粗糙近似对数据分布敏感的缺陷,引入相对距离计算模糊相似关系,同时考虑模糊邻域粒度结构,提出了模糊邻域相对依赖度,从代数观度量数据的不确定性。然后,基于相对粒度结构提出了模糊邻域相对互信息,并与模糊邻域相对依赖度结合构造出一种新的特征评价函数——模糊邻域相对依赖互信息,将代数观和信息观结合进行特征评价。最后,设计了一种基于模糊邻域相对依赖互信息的特征选择算法(FNRDI)。通过与其他算法在9个公共数据集上进行实验对比分析,结果表明所提算法可有效消除冗余特征且提高数据的分类精度。 相似文献
7.
《系统科学与数学》2020,(1)
基于图的半监督分类方法近年来在模式识别和机器学习领域取得了广泛的关注.然而许多传统方法在构建邻域图时采用固定的邻域尺寸,且在模型训练过程中同等对待所有样本,忽略了样本间的差异性,从而影响了方法的效果.对此,文章提出一种基于自步学习和稀疏自表达的半监督分类方法,提取并保持数据的有判别信息的稀疏自表达结构,并基于自步学习机制提出一种新的自步学习项,将数据重要程度的软权重与硬权重相结合,来对样本进行学习.所提方法能够自适应建立数据间的关系,自动给出样本的重要程度并由易到难进行学习,且具有多类的显性非线性分类函数.几个标准数据集上的实验结果表明,所提算法具有较好的半监督分类效果. 相似文献
8.
信息系统是不确定数据的重要模型,多源信息系统可用来表示来自多个同构异源的复杂数据。本文研究了多源信息系统中的不确定性度量,基于信息粒化思想给出了四种度量工具来度量多源信息系统的不确定性。首先,通过不同的信息值类型定义了两个信息值之间的距离,从而诱导出多源信息系统中的相容类。其次,基于粒计算的思想,将这些相容类看作多源信息系统的信息颗粒。从而,通过信息颗粒引入多源信息系统中的四种不确定性度量工具,并研究其之间的联系。这些研究结果对建立信息系统的粒计算框架以及属性约简将会很有帮助。 相似文献
9.
10.
用三维离散涡丝方法模拟轴对称圆射流场涡结构的发展,所得结果在某个周向位置上与用二维点涡方法计算的结果符合较好。然后采用单向淹合模型模拟固粒在圆射流中的运动,说明当固粒St数远小于1时,固粒受流场的作用较明显,当St数为1时,固粒主要分布在涡结构的周围,分布较均匀;当St数远大于1时,固粒受流场的影响较弱,当对涡环沿周向施以五个波长的扰动时,固粒扩散的范围较宽,固粒的扩散与扰动的振幅成正比,中所得 相似文献
11.
《数学的实践与认识》2015,(22)
在模糊形式背景下研究变精度的模糊信息粒,给出精度为δ的必要模糊信息粒,充分模糊信息粒以及充分必要模糊信息粒的定义.在此基础上,进一步给出对任意给定的模糊信息粒转化为精度为δ的必要模糊信息粒,充分模糊信息粒及充分必要模糊信息粒的方法. 相似文献
12.
13.
14.
在医学研究和产品研制过程中, 由于试验对象难于找到或者试验费用昂贵常出现小样本情形. 此时, 精确置信推断尤其重要. 只要在样本空间中给出一种序就可以定义模型参数的某个函数的精确置信限. 这样得到的置信限称为Buehler置信限. 虽然它的定义比较容易, 但是当多维参数或者不完全观测数据出现时, 计算有时难于实行. 为了解决这种计算问题, 本文构造出一种基于EM算法的方法. EM算法原本是用于求解极大似然估计的方法, 在这里EM算法首次被用于求解精确置信限. 分析了3种模型和一组实际数据以说明这个方法. 相似文献
15.
随着大数据时代的到来,各个领域涌现出海量数据且结构复杂.如变量的维数不同、尺度不同等.而现实中变量之间往往存在着不确定关系,经典的Pearson相关系数仅能反映两个同维变量间的线性相关关系,不足以完全刻画变量间的相关关系.2007年Szekely等提出的距离相关系数则能描述不同维数变量间的非线性关系.为了探索变量之间的内在信息,本文基于距离相关系数提出了最大距离相关系数法对变量聚类,且有超度量性和空间收缩性.为充分发挥距离相关系数的优势,对上述方法改进得到类整体距离相关系数法.该方法在刻画两类间相似性时,将每类中的所有变量合并成一个整体,再计算这两个不同维数的整体间的距离相关系数.最后,将类整体距离相关系数法应用到几个实际问题中,验证了算法的有效性. 相似文献
16.
构造恰当的样本空间是古典概率解题的第一步,选择样本空间的计量方法是解决问题的关键.对于同一个随机试验,样本空间可以相当简单,也可以相当复杂.下面通过实例,谈谈在保证等可能性的前提下,通过改变样本容量计量方法或缩减样本空间使得概率计算化繁为简的思维策略.1改变样本空间的计量方法,实现无限向有限的转化在古典概型中,试验的结果是有限的,当试验结果为无限时会出现本质上的困难.此时,我们可用某种数量特征(如长度,面积)来表示总和,设为S;并且其中的一部分,即有利于随机事件A的基本事件数,也可以用同样的数量特征来表示,设为s;则随… 相似文献
17.
当我们面对的数学题不能用已知模型加以解决时,就会考虑其他意义上的解题策略,其中首要的一个是化归转化策略.化繁为简、化生为熟、化新为旧、化未知为已知,这是人类认识的基本规律. 相似文献
18.
《数学的实践与认识》2020,(14)
邻域粗糙集在实际应用中具有灵活性,相关的邻域信息度量在不确定性分析和知识发现中具有重要作用.经典的条件邻域熵具有相交不完备性和非层次性.对条件邻域熵进行扩展改进,建立了基于三层粒结构的三支邻域熵.首先,提出三支概率,研究三支概率的系统性和单调性;然后,利用三支概率函数及层次构建思想,提出基于三层粒结构的三支邻域熵,并获得系统性、单调性/非单调性;最后,利用实例和实验对以上相关度量的关系、性质进行验证.结果表明提出的三支邻域熵扩展和丰富了条件邻域熵. 相似文献
19.
在贝叶斯库存控制研究中一个著名的结论是:当缺货需求不能被观测到时,最优贝叶斯库存水平总会高于短视策略库存水平,原因是决策者需要通过多订货来获取对需求分布的认识. 这是基于风险中性的研究,然后现实中决策者都期望规避风险. 基于贝叶斯信息更新研究了风险规避背景下需求部分可观测的多周期报童问题,决策者的周期内效用函数满足独立可加性公理. 通过引入非正规化概率,研究发现,对风险规避的决策者,当其效用函数具有不变绝对风险规避特征时,最优贝叶斯库存水平也会高于短视策略库存水平. 非正规化概率简化了动态规划方程与结果的证明. 相似文献