首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 706 毫秒
1.
基于温度变量的四维荧光光谱的石油类污染物测定   总被引:1,自引:0,他引:1  
三维荧光光谱结合多元校正分析对石油类污染物复杂多组分体系测定方法多谱图混叠,且易受到空白荧光和干扰物荧光影响降低了测定准确性。提出在三维荧光光谱中增加一维温度信息构造激发波长-发射波长-温度-样品(EEM-temperature data array)的四维荧光光谱数据阵列,应用四线性成分模型建立高维荧光光谱定性定量分析的方法。实验证明在15~25 ℃温度范围内,矿物油荧光光谱轮廓形状不随温度变化,而其强度随温度线性变化,满足四线性要求,这为构建四维荧光光谱发展高维数据的三阶校正提取更丰富的有效信息提供了可能。三阶校正不仅可以在干扰物共存的情况下对感兴趣组份进行定量测定,即具有“二阶优势”,还具有更高的选择性和灵敏性,可以对高共线性和背景干扰的重叠光谱表现更好的解析能力,即“三阶优势”。对0#柴油、97#汽油和机油为混合油待测组分,腐殖酸为水体干扰组分组成的复杂体系污染油样品为进行实验,得到的三维荧光光谱利用平行因子(PARAFAC)算法和交替惩罚三线性分解(APTLD)算法进行二阶校正分析,将三维荧光光谱在温度方向上堆叠构成增加温度维度的四维荧光光谱数阵,并将其利用四维平行因子算法(4-PARAFAC)和交替惩罚四线性分解(APQLD)算法进行三阶校正分析,比较,0#柴油、97#汽油和机油的预测结果表明增加了影响荧光光谱的温度因素构造的四维荧光光谱提高了有效信息提取能力,四维荧光光谱结合高阶校正算法能提高油种光谱识别和浓度精确检测,较传统的三维荧光光谱分析提高了回收率(recovery rate)和预测均方根误差(root mean square error of prediction,RMSEP),有利于石油类污染物的有效,准确,实时,绿色环保检测。同时指出了4-PARAFAC和APQLD算法各自的特点及其不同适用环境,为油类污染物检测具体情况提供算法选择依据。引入温度参量的四维荧光光谱结合三阶校正算法的检测技术较三维荧光光谱技术,在组分光谱定性分辨和浓度定量检测方面能对复杂体系油类污染物实现快速有效,绿色无污染地检测,实现“数学分离”更有效代替“化学分离”。  相似文献   

2.
传统荧光光谱技术已被用于土壤中多环芳烃(PAHs)的检测,但由于土壤体系的复杂性、PAHs污染物的多样化和微量化,传统的荧光光谱技术无法有效提取土壤中PAHs的特征信息。为了解决上述问题,提出并建立一种基于二维相关荧光谱土壤中多环芳烃的检测方法。以土壤中典型的多环芳烃蒽和菲为研究对象,配置38个蒽菲混合标准土壤样品(蒽和菲的浓度范围均为0.000 5~0.01 g·g-1),在激发波长265~340 nm,发射波长350~500 nm范围内采集了所有样品的三维荧光谱。以激发波长为外扰,对外扰变化的动态一维荧光谱进行相关计算,得到每一样品的同步二维相关荧光谱。研究了浓度均为0.005 g·g-1蒽菲混合土壤样品的三维荧光谱和同步二维相关荧光谱特性,在同步谱主对角线398,419,444和484 nm处存在自相关峰,其中,398和484 nm荧光峰来自土壤中的菲,419和444 nm荧光峰来自土壤中的蒽;在主对角线外侧,蒽和菲两组荧光峰之间存在负的交叉峰,进一步验证了其来源不同;同时,在(408,434) nm和(434,467) nm处出现交叉峰,其中408和434 nm荧光峰来自土壤中的菲,467 nm荧光峰来自土壤中的蒽。指出与三维荧光谱表征的信息相比,二维相关荧光谱不仅能提取更多的特征信息(408和467 nm的特征峰在三维荧光谱中未被表征),而且还能提供荧光峰之间的相互关系,对其来源进行有效解析。在上述研究二维相关荧光谱特性的基础上,基于同步相关谱矩阵(38×151×151)建立了定量分析土壤中蒽和菲污染物浓度的多维偏最小二乘(N-PLS)模型,对蒽的校正和预测相关系数分别为0.986和0.985,校正均方根误差(RMSEC)和预测均方根误差(RMSEP)分别为4.33×10-4和5.55×10-4 g·g-1;对菲的校正和预测相关系数分别为0.981和0.984,RMSEC和RMSEP分别为5.20×10-4和4.80×10-4 g·g-1。为了比较,基于三维荧光光谱矩阵(38×16×151)建立了定量了分析土壤中蒽和菲的N-PLS模型,对蒽的校正和预测相关系数分别为0.981和0.972,RMSEC和RMSEP分别为5.09×10-4和6.74×10-4 g·g-1;对菲的校正和预测相关系数分别为0.957和0.956,RMSEC和RMSEP分别为7.36×10-4和7.77×10-4 g·g-1。指出,对于土壤中的蒽和菲检测,基于二维相关荧光谱的N-PLS模型的相关系数r,RMSEC和RMSEP都要优于基于三维荧光谱的N-PLS模型。研究结果表明:所提出和建立的方法-二维相关荧光谱直接检测土壤中PAHs污染物不仅可行,而且能提供更好的分析结果。该研究为激光诱导荧光结合相关谱技术现场直接检测土壤中多环芳烃污染物提供了理论和实验基础,具有较好的应用前景。  相似文献   

3.
用多种荧光标记物进行STR检测时,由于荧光光谱的谱带展宽特性,各个荧光光谱之间有重叠部分,如何实现将相互重叠的各个波长上的能量有效利用起来,对提高荧光利用效率至关重要。本文给出了一种基于矩阵分析的数据处理方法,该方法在进行荧光探测前首先要对荧光谱进行光谱校正,即要得到每种所用标记染料受激发射荧光的光谱分布,根据光谱分布建立染料组合荧光信号矩阵,然后对矩阵进行归一,利用归一后的矩阵对所探测的荧光谱进行解谱,从而得到所期望的荧光谱图。理论分析和实验结果表明,该方法可以有效的利用各个波长的荧光光谱能量,并实现对不同荧光重叠谱的有效光谱解谱。  相似文献   

4.
多组分三维荧光重叠光谱是三维荧光光谱的数据解析中的难点之一。本文基于二维微分谱的计算原理, 充分利用三维荧光光谱具有激发光谱和发射光谱的特点, 获得了三维荧光光谱展开后的激发微分谱和发射微分谱. 之后利用独立成分分析对激发光谱或发射光谱的多组分混合微分谱分别进行解析, 得到了单一组分的激发微分谱和发射微分谱。其中三次样条插值有效的弥补了实测激发波长数据点少的缺点, 而粗糙惩罚平滑技术的引入则很大程度上减少了发射光谱的噪声,为微分谱的计算提供了有利的条件。单一组分的标准谱与解析谱的相似性系数的计算表明, 利用独立成分分析对微分谱进行解析更有利于多组分混合三维荧光光谱所含成分的识别。  相似文献   

5.
苯酚和麝香草酚等酚类化合物对人体和动植物有着严重危害,且这些酚类化合物往往同时存在于水体。由于苯酚和麝香草酚的激发和发射光谱重叠严重,常规荧光方法不能实现直接快速测定。基于三维荧光光谱结合四维平行因子(4-PARAFAC)算法,对存在未知干扰物的湖水中苯酚和麝香草酚进行定性和定量分析。利用三维平行因子和四维平行因子算法分解光谱数据,探索三阶校正算法的“三阶优势”。通过引入温度维来构建四维数据阵,将不同温度下扫描得到的激发发射矩阵沿样本维叠加得到四维数据阵,结合基于四维平行因子的三阶校正算法对目标分析物进行定性定量分析。为避免溶剂散射和仪器的影响,需要对扫描得到的激发发射矩阵信号进行预处理。通过空白扣除法和Delaunay三角内插值法去除激发发射矩阵中散射信号,再进一步进行激发发射校正,得到真实光谱。然后分别使用基于平行因子的二阶校正算法和基于四维平行因子的三阶校正算法对光谱数据进行分析,对比两种算法的分析结果。结果表明,四维数据阵并不是三维激发发射矩阵简单的叠加,得到的四维数据可能含有丰富的高维信息,有助于改善对分析物的测量结果。四维平行因子算法解析得到的湖水中苯酚和麝香草酚的平均回收率分别为97.7%±9.2%和96.5%±8.8%,预测均方根误差为0.047和0.057 μg·mL-1,预测相对误差低于10%,分析结果优于三维平行因子(平均回收率分别为105.7%±15.3%和111.0%±3.6%,预测均方根误差为0.090和0.056 μg·mL-1,预测相对误差高于10%)。实验表明,样本中存在复杂干扰背景和数据共线性严重时,三阶校正算法能够得到比二阶校正算法更满意的结果,为复杂体系中苯酚和麝香草酚的检测提供了可靠方法。  相似文献   

6.
时间序列三维荧光光谱数据量大和信息丰富的特点虽然有利于有机物的定性和定量分析,但是大量冗余信息的存在增加了计算的复杂度和计算量。在分析了时间序列三维荧光光谱的时频特征后,分别利用聚类分析和二维小波变换从时间维和光谱维对三维荧光光谱进行了压缩。在聚类分析中探讨了样本距离、类间距离、复合相关系数和R平方统计量等关键因素。相关系数和R平方统计量的结合不仅提高了聚类分析的精确度,而且减少了二维小波在光谱维进行数据压缩的工作量。相关的数值实验表明压缩后的数据保留了原有时间序列三维荧光光谱的重要信息。  相似文献   

7.
基于高斯马尔科夫模型的高光谱异常目标检测算法研究   总被引:1,自引:0,他引:1  
随着光谱成像技术的发展,高光谱异常检测在遥感图像处理中的应用越来越广泛。传统RX异常检测算法忽略影像空间相关性,而且由于没有经过有效数据降维,运算耗费大,对于高光谱数据有效性不高。高光谱影像在空间和光谱上符合高斯-马尔科夫模型。通过建立马尔科夫参数能够直接计算协方差矩阵的逆矩阵,避免了高光谱海量数据的庞大计算。提出一种基于三维高斯-马尔科夫随机场模型的改进RX异常检测算法。该方法用高斯-马尔科夫随机场模型模拟高光谱影像数据,用最大似然近似法估计高斯-马尔科夫随机场参数,由高斯-马尔科夫随机场参数直接构造检测算子,并以待检测像元为中心设置局部优化窗口,称为马尔科夫检测窗。取窗口内数据计算均值向量和协方差逆矩阵,得到中心像元的异常度,通过移动窗口进行逐像元检测。应用AVIRIS高光谱数据对传统RX算法、高斯-马尔科夫模型背景假设异常检测算法和该算法进行了仿真实验对比。结果表明,该算法能够有效提高高光谱异常检测效率,降低虚警率。运行时间较传统RX算法提高了45.2%,体现出更好的计算效率。  相似文献   

8.
提出了一种光谱重叠的多种矿物油混合物组分含量测定的新方法。将偏最小二乘方法(PLS)推广至三维扩展(tri-PLS),不需要解决特征值问题。利用该方法对柴油、汽油和煤油混合物的三维荧光光谱进行研究,根据样本序列、激发波长、发射波长构造出三维数据矩阵,结合浓度矩阵应用tri-PLS法建立校正模型,对实验样本进行预测,实验结果表明tri-PLS方法的建模精度比常用的平行因子法优越。  相似文献   

9.
三维荧光光谱分析法以其灵敏度高、选择性好、操作简单和可用于多组分混合物分析等优点成为诸多研究者在海面溢油鉴别中的热点选择。但三维荧光光谱中存在的瑞利散射会对光谱的准确检测产生较大的影响,因此有效地消除瑞利散射对后续光谱的定性鉴别和定量分析具有重要意义。采用仪器校正法、空白扣除法、 Delaunay三角形内插值法和缺损数据重构(MDR)法对海面溢油三维荧光光谱中的瑞利散射进行校正。首先以海水的SDS胶束溶液作为溶剂,将航空煤油和润滑油按不同相对体积分数比配制8个校正样本和3个测试样本;然后利用FS920稳态荧光光谱仪采集11个样本的三维荧光光谱数据,并分别采用仪器校正法、空白扣除法、 Delaunay三角形内插值法和缺损数据重构(MDR)法消除瑞利散射的干扰;再利用核一致诊断法估计出最佳的组分数;最后利用平行因子分析(PARAFAC)对混合油样本的三维荧光光谱数据进行定性鉴别和定量分析。研究结果表明:采用发射波长滞后激发波长以消除瑞利散射的仪器校正法会丢失部分有效光谱信息;采用空白扣除法无法彻底消除瑞利散射,在光谱中仍然存在散射干扰,利用PARAFAC解析后得到的激发、发射光谱会出现失真,且预测的浓度值偏差较大;采用Delaunay三角形内插值法消除瑞利散射后,利用PARAFAC解析所得到的激发、发射光谱与真实光谱吻合度较高,且预测的浓度值偏差较小;而采用MDR消除瑞利散射后,利用PARAFAC解析所获得的激发、发射光谱与真实光谱吻合度最高,且相较于其他几种方法预测的浓度值偏差最小,得到的样本回收率为98.9%和100%,预测均方根误差均小于等于0.130。根据定性鉴别、定量分析的结果, MDR能够在保证原有特征光谱不失真的基础上有效消除瑞利散射带来的影响,是一种消除三维荧光光谱数据中瑞利散射较为理想的方法。  相似文献   

10.
利用三维同步荧光光谱法获取不同氧化状态下的葵花籽油荧光光谱数据,同时采集葵花籽油品质指标。运用平行因子法对三维同步荧光光谱矩阵进行降维处理,通过iPLS(interval partial least squares),BiPLS(backward interval partial least squares)和SiPLS(synergy interval partial least squares)模式识别方法进行数学建模。结果表明:波长差Δλ=50 nm时,样品同步荧光光谱具有显著差异,筛选用于数学建模初始数值。不同模式识别方法建模结果显示,iPLS,BiPLS和SiPLS法所得校正集模型和预测集模型的相关系数分别为0.908 3,0.961 2,0.954 5和0.872 3,0.925 2,0.852 5,交互验证均方根误差分别为0.050 3,0.033 1,0.035 9和0.073 3,0.054 1,0.065 5,比较发现采用BiPLS法建模效果最好。该研究将为葵花籽油品质快速辨别提供理论基础和技术支持,为其他食用油脂的快速检测提供方法指导。  相似文献   

11.
多种群精英共享遗传算法在异常光谱识别中的应用   总被引:1,自引:0,他引:1  
提出了一种基于多种群精英共享遗传算法的异常光谱识别方法.该方法应用于红外光谱数据的分析,并在删除异常光谱样本后使用偏最小二乘方法进行建模.与使用蒙特卡洛交叉验证、留一交叉检验、马氏距离以及传统遗传算法进行异常光谱识别的方法相比,所提方法将水分预测模型的预测误差平方和(PRESS)分别降低了72.4%,39.5%,39.5%和14.5%;将脂肪含量的预测模型的PRESS值分别降低了86.2,75.9%,84.9%和19.9%;将蛋白质含量的预测模型的PRESS值分别降低了56.5%,35.7%,35.7%和18.2%.实验表明,所提方法不仅能适应不同成分光谱数据的异常识别,而且删除异常光谱数据后所建立的模型具有较高的预测能力和较好的稳健性.  相似文献   

12.
为探讨快速、实时藻类检测方法,实验通过荧光光谱成像技术结合模式识别方法对不同藻类进行鉴别研究。发现藻类样本存在着显著的荧光特性,通过采集40个藻类样品的荧光光谱图像,对图像进行去噪、二值化处理,确定有效像素后,根据光谱立方体绘制每个样本的光谱曲线,将所得400~720 nm区段范围内的光谱数据作鉴别分析,再利用系统聚类分析及主成分分析两种不同的模式识别法对光谱数据进行处理。系统聚类分析结果表明: 采用欧氏距离法及平均加权法计算样本间的聚类距离,在距离L=2.452以上水平处可将样本正确分类,准确率为100%;主成分分析结果表明: 通过对原始光谱数据进行一阶微分、二阶微分、多元散射校正、变量标准化等预处理后,再对数据进行主成分分析,其中二阶微分预处理后鉴别效果最佳,八种藻类样品在主成分特征空间中独立分布。因此,利用荧光光谱成像技术结合聚类分析法及主成分分析法对藻类进行鉴别是可行的,操作简便、快速、无损。  相似文献   

13.
一种基于光谱奇异值检测的高光谱遥感小目标探测方法   总被引:4,自引:1,他引:3  
高光谱遥感技术能够借助丰富的地物图像和光谱信息,反映目标地物与背景地物间的细微差异,从而将其区分开来。目前的小目标探测算法多侧重于从图像处理方面着手,文章则从光谱维数据分析的角度出发,利用光谱分析中的奇异值检测方法探测小目标,首先对关注区域的地物像元光谱进行连续统去除和正交变换等预处理;然后将每个像元的光谱对该区域平均光谱进行光谱匹配求其相似性,并实现高光谱数据降维;而后通过光谱角匹配值的马氏距离进行奇异值检测,将马氏距离大于自适应阈值的像元判定为小目标。该方法不需要任何先验信息,实验结果表明该方法运算量较小,运算速度快,并有较好的小目标探测准确度。  相似文献   

14.
近红外漫反射光谱具有无创伤、连续、无感染、速度快等诸多优势,在人体成分无创伤检测方面有很好的应用前景。但是在测量过程中,随机噪声、干扰组分以及检测条件的改变等容易导致异常光谱。判定并剔除异常光谱对于提高近红外无创血液成分检测的可靠性具有重要意义。首先分析了近红外漫反射光谱无创血糖检测中可能出现的异常数据类型,提出了一种综合利用马氏距离、光谱残差和化学值残差三个指标构造三维空间对样本集进行检验的三维坐标异常数据判定方法。其次,针对三层皮肤组织模型,在参数中设置人为失误、极端成分含量以及异常温度变化的样本,通过蒙特卡罗(MC)模拟程序得到一组正常模拟数据以及一组包含化学值异常和光谱异常的模拟数据,并利用三维坐标法进行异常数据的判定。结果显示,该方法能识别出全部异常样本,剔除这些异常样本后,偏最小二乘(PLS)校正模型的交互验证均方根误差(RMSECV)由21.2 mmol·L-1降低到1.1 mmol·L-1,初步验证了该方法的可行性。进一步,对三位受试者开展了口服葡萄糖耐量试验(OGTT),通过在测量受试者血糖参考值的同时同步采集其手指部位的漫反射光谱,获得了三组在体实验数据。并利用三维坐标法和蒙特卡罗交互验证法进行异常数据的判定和剔除,最后建立PLS模型比较两种异常数据判别方法的效果:剔除三维坐标法识别出的异常数据后,三组样本建立的校正模型的决定系数显著提升,RMSECV平均值由2.1 mmol·L-1降低至0.8 mmol·L-1,效果优于蒙特卡罗交互验证法的结果。这些结果表明,基于马氏距离、光谱残差和化学值残差的三维坐标异常数据判定方法能有效识别近红外无创血糖测量中的异常数据,在在体成分检测应用中有显著优势。  相似文献   

15.
原位能量色散X射线荧光现场分析岩样矿物成分时,岩样基体效应会对测量结果产生影响。本文以Cu元素作为待测元素,研究了17种不同岩样基体对原位能量色散X射线荧光分析Cu元素特征X射线强度的影响及其修正方法。采用蒙特卡罗方法模拟获得了Cu元素含量相同的17种不同岩样测量谱线,综合各类岩石元素构成的相似性,并依据模拟谱线Cu元素射线强度与谱线参数之间的相关性,反映了原位能量色散X射线荧光分析岩样Cu元素的基体效应并不完全受岩体元素构成或岩石分类的控制,需要依据岩石样分析谱线参数的相关性进行归类讨论。针对基体影响Cu元素特征射线强度相似的15种岩样进一步研究,并对Cu元素特征X射线与谱线主要参数的主成分进行分析,发现散射本底、X光管靶材料特征X射线及其非相干散射峰强度能够很好的描述Cu元素特征X射线强度受岩样基体影响的变化,据此可以对基体效应影响相似的岩体进行Cu元素测量结果修正。采用本文方法同样也能为不同岩性岩体其他待测元素基体效应的修正提供参考。  相似文献   

16.
近年来,饮用水安全问题引起社会的广泛关注。采用紫外-可见光吸收光谱对水质进行异常检测,具有现场原位、无需试剂、分析快速等优点,适合快速在线监测。然而,紫外-可见光光谱数据量大,且易受仪器和水质正常波动的干扰,从而影响水质异常检测结果。提出一种基于基线校正和主元分析的紫外-可见光光谱法来检测污染物引起的水质异常,该方法利用非对称最小二乘校正基线,采用主元分析法从基线校正后的光谱矩阵中降维并提取特征,然后根据残差子空间的Q统计量评估测试样本的离群点,最后采用累计概率来更新异常报告结果。通过苯酚注入的实验,验证了该算法的有效性,实验结果表明,提出的方法与单波长法相比,有效地提高了污染物的检出下限;与未经基线校正采用主元分析进行的异常检测方法相比,提高了检出率,降低了误报率。  相似文献   

17.
海面目标受海水扰动影响,难以被宽波段光电传感器探测识别。高光谱传感器可以获取海面目标和水体的光谱数据,利用目标和海水的光谱特性差异可以有效抑制海面扰动影响,提高探测识别能力。针对高光谱数据降维融合容易丢失海面弱小目标问题,研究了弱小目标光谱数据融合方法。通过相似性分类产生类矩阵,由类矩阵主成分变换的降维投影矩阵来投影变换原有光谱数据,获得降维数据矩阵。降维矩阵通过空间变换转换到RGB彩色空间,生成伪彩色融合图像。通过远距离弱小目标和水中鱼群高光谱数据,验证了改进方法的融合性能。实验结果表明:相似性分类融合方法不仅能将高维光谱数据融合成一幅伪彩色图像,还能有效避免弱小目标融合丢失问题,提高了目标探测识别能力。  相似文献   

18.
三维荧光光谱结合PCA-SVM对几种浓香型白酒的鉴别   总被引:1,自引:0,他引:1  
提出一种利用三维荧光光谱技术鉴别不同品牌浓香型白酒的方法。运用FLS920荧光光谱仪测量了七个不同品牌浓香型白酒的三维荧光光谱,不同品牌浓香型白酒的荧光光谱特征相似,仅凭荧光特征参数较难区分。采用求偏导和小波压缩相结合的数据预处理方法,求解光谱数据中每一激发波长下,荧光强度对发射波长的一阶和二阶偏导数,选取db7紧支撑正交小波对数据进行压缩,选择4尺度分解后的近似系数作为新的数据矩阵,然后做主成分分析(PCA)。将提取的主成分作为支持向量机(SVM)的输入,并利用K-fold交叉验证的方法寻找支持向量机的最优参数cγ,建立不同品牌白酒的分类鉴别模型。从每个品牌白酒中随机选取14个样本,共98个样本组成训练集,其余的42个样本组成预测集。分别比较了数据不求偏导,对数据求一阶偏导和二阶偏导的预处理后对鉴别模型的影响。结果表明:三维荧光光谱经过二阶偏导的预处理后,结合主成分分析和支持向量机能很好地实现不同品牌浓香型白酒的分类鉴别,模型的准确率为98.98%,预测集的准确率为100%。该方法具有简单,快速,成本低的优点,可为中国白酒的检测和鉴别技术的发展提供帮助。  相似文献   

19.
五维同时荧光信息显微成像方法是一种新的荧光信息获取技术,它采用了双光子阵列点激发方式.这一方法可同时获取激发阵列点每点荧光的位置信息、荧光光谱信息和荧光寿命信息,弥补了现有荧光检测技术的不同功能信息不具有同时性的缺陷.给出了从这种技术的复合信息中提取复合光谱几何强度结构图像、不同光谱几何强度结构图像、不同光谱寿命图像的方法.提出了一种激发荧光强度修正系数矩阵方法,消除阵列点激发光强不均匀对激发荧光强弱产生的不利影响,取得明显效果.实验对实际样品做了数据采集和处理,给出图像结果,表明处理的效果良好.对存在的问题也作了讨论. 关键词: 荧光信息处理 双光子 荧光光谱 荧光寿命  相似文献   

20.
Outlier detection is an important research direction in the field of data mining. Aiming at the problem of unstable detection results and low efficiency caused by randomly dividing features of the data set in the Isolation Forest algorithm in outlier detection, an algorithm CIIF (Cluster-based Improved Isolation Forest) that combines clustering and Isolation Forest is proposed. CIIF first uses the k-means method to cluster the data set, selects a specific cluster to construct a selection matrix based on the results of the clustering, and implements the selection mechanism of the algorithm through the selection matrix; then builds multiple isolation trees. Finally, the outliers are calculated according to the average search length of each sample in different isolation trees, and the Top-n objects with the highest outlier scores are regarded as outliers. Through comparative experiments with six algorithms in eleven real data sets, the results show that the CIIF algorithm has better performance. Compared to the Isolation Forest algorithm, the average AUC (Area under the Curve of ROC) value of our proposed CIIF algorithm is improved by 7%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号