首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 968 毫秒
1.
医生根据磁共振影像征象对患者的乳腺病变程度进行BI-RADS分类评估时存在一定的主观性,且 BI-RADS 3-5类病变的良恶性存在交叉,在临床诊断时极易发生因诊断类别较高而造成不必要的有创治疗.针对这些问题,本文应用影像组学技术对乳腺的T1加权(T1W)和动态对比增强(DCE)磁共振图像进行特征提取和融合,采用最小绝对收缩和选择算子(LASSO)算法筛选出各特征集的最优特征集,并分别使用支持向量机(SVM)、随机森林(RF)、K最近邻(KNN)及逻辑回归(LR)算法进行BI-RADS 3-5类乳腺病变三分类,并且在此基础上实现乳腺良恶性分类.结果显示基于特征融合的四个影像组学模型对乳腺病变BI-RADS 3-5类的分类准确率分别为81.25%、87.50%、78.38%、81.25%;对乳腺病变良恶性鉴别的准确率分别为90.91%、93.55%、92.73%、94.55%. 这表明MRI影像组学结合机器学习的算法对乳腺病变BI-RADS分类效果及良恶性鉴别效果均较好,且特征融合可进一步提高分类预测的准确率.  相似文献   

2.
支持向量机复合核函数的高光谱显微成像木材树种分类   总被引:1,自引:0,他引:1  
采用体视显微高光谱成像方法,构建木材树种分类识别模型。利用SOC710VP体视显微高光谱图像采集系统获取可见光/近红外(372.53~1 038.57 nm)波段内的木材高光谱图像。首先,采用ENVI软件提取木材样本感兴趣区域(ROI)的平均光谱,分别采用连续投影算法(SPA)和竞争性自适应重加权算法(CARS)对光谱数据进行降维。再利用支持向量机(SVM)分别建立木材样本采集波段和特征波长下的分类模型。然后,在空间维采用第一主成分图像,计算基于灰度共生矩阵(GLCM)的木材纹理特征。在0°,45°,90°和135°四个方向计算能量、熵、惯性矩、相关性等16个特征参数后输入SVM进行木材树种分类处理。最后,采用四个复合核函数SVM进行光谱维和空间维的特征融合及分类识别。20个树种的分类实验结果表明,CARS的特征波长选择效果和运行速度较好一些,采用普通SVM进行木材光谱维特征分类处理时,测试集分类准确率达到了92.166 7%。采用基于GLCM的木材空间维纹理特征时,采用普通SVM的测试集分类准确率是60.333 0%,具有较低的分类精度。在将光谱维和空间维纹理特征进行数据融合及分类处理时,采用复合核函数SVM分类具有更好的效果。采用第二个复合核函数的SVM分类精度最高,测试集分类正确率是94.166 7%,运行时间为0.254 7 s。另外,采用第一个和第三个复合核函数的SVM的测试集分类准确率分别是93.333 3%和92.610 0%,运行时间分别为0.180 0和0.260 2 s。可以看出,采用这3种复合核函数的SVM进行木材树种分类,分类精度都高于采用普通SVM的光谱维或者空间维的分类识别精度。因此,利用体视显微高光谱成像和复合核函数SVM可以提高木材树种分类精度,为木材树种快速分类提供了参考。  相似文献   

3.
石油污染的出现,导致生态环境遭到破坏。因此,油类识别方法的研究对于环境的保护具有重要意义。采用荧光光谱法获得石油光谱数据,并对其进行预处理,再通过降维方法来提取特征信息,最后利用模式识别算法进行分类,从而可以实现对油类的定性分析,因此研究一种更高效的数据降维方法以及识别分类算法极其重要。基于三维荧光光谱技术,利用稀疏主成分分析(SPCA)对FS920光谱仪测得的荧光光谱数据进行特征提取,再利用支持向量机(SVM)算法对提取的特征数据进行分类识别,获得了一种更加高效的油类识别方法。首先,利用海水和十二烷基硫酸钠(SDS)配制成浓度为0.1 mol·L-1的胶束溶液,将其作为溶剂配制柴油、航空煤油、汽油以及润滑油各20种不同浓度的溶液;然后,利用FS920光谱仪测得样本溶液的三维荧光光谱数据,对得到的光谱数据进行预处理;最后,对预处理后的数据分别利用SPCA和主成分分析(PCA)进行特征提取,再利用SVM和K最近邻(KNN)两种模式识别算法对特征向量进行分类,最终得到四种模型PCA-KNN,SPCA-KNN,PCA-SVM以及SPCA-SVM的分类结果。研究结果表明,由四种模型得到的分类准确率分别为85%,90%,90%和95%,其中,在同种分类算法中,利用SPCA进行特征提取得到的分类准确率均比PCA的准确率高5%,因此可知,SPCA的稀疏性具有突出主要成分的作用,在提取光谱特征时能够减小非必要成分的影响,并且载荷矩阵的稀疏化可以去除变量之间的冗余信息,优化降维特征信息,为后续分类提供更有效的数据特征信息;在同种特征提取算法下,利用SVM算法进行分类得到的分类准确率均比KNN算法得到的准确率高5%,表明SVM算法在分类中更具有优势。因此,本文利用三维荧光光谱技术结合SPCA和SVM算法,实现了对石油的准确识别与分类,为今后对石油污染物的高效检测提供了新思路。  相似文献   

4.
孟滔  周新志  雷印杰 《应用声学》2016,24(9):215-217, 223
针对基于遗传算法支持向量机(SVM)训练时间较长以及分类精度较网格搜索法有所降低等问题,通过重新定义遗传算法参数的寻优范围,提出一种自适应遗传算法;该算法根据网格搜索法得到遗传算法参数的最佳寻优范围,然后遗传算法在这个范围内进行参数的精确寻优,最后得到分类的结果;这样不仅可以有效缩短训练时间,而且拥有更高的分类正确率;通过UCI中的10组经典数据集的实验结果可知,自适应遗传算法较之网格搜索法、 常规遗传算法、粒子群算法在训练时间上有较大的提升,并且拥有较高的分类准确率。  相似文献   

5.
激光诱导击穿光谱(LIBS)是一种高效快速的光谱采集手段,可应用于各类物质的元素分析工作中。线性判别分析(LDA)与支持向量机(SVM)是化学计量学中两种常用的有监督算法,均通过对已知不同种类的样本数据进行学习建模,进而实现对未知类别数据的归类。为了实现LIBS技术对有机物的高准确率识别,将这两种算法应用到LIBS光谱数据的分类中。实验利用波长为1 064 nm的纳秒激光烧蚀女贞、珊瑚树、竹子三种植物的叶片,并采集每种树叶220~432 nm波段的100组光谱数据。通过对300组样本的原始光谱数据进行主成分提取,由第一主成分(PC1)和第二主成分(PC2)的得分图得出三种植物光谱的相似度非常高。然后,利用每种叶片70组样本的光谱数据作为训练集建模,其余30组光谱数据作为测试集来进行树叶种类的预测识别。将PCA对原始光谱数据提取得到的前20个主成分作为LDA与SVM建模的属性值。对于LDA算法,将属性值分析后得到前两个判别函数值,通过聚类分析发现不同种类的植物叶片光谱数据在空间上的分离效果较好,同一种类基本聚集在一起。再借助马氏距离可得到测试集的平均分类正确率为96.67%。与此类似,使用SVM方法对训练集样本的数据进行学习得到分类超平面,对测试集的平均分类正确率达到98.9%。研究结果表明,经过PCA对数据的预处理,再结合LDA,SVM这两种方法可实现LIBS技术应用于复杂有机物的快速准确分类,并且PCA与SVM结合的分类正确率更高。该方法可在食品快速溯源、生物组织原位鉴别、有机爆炸物远程分析等领域应用。  相似文献   

6.
棉花精量播种技术目前已经在新疆兵团全面推广,该技术能精确实现一穴一粒的农艺技术指标,但是也对高质量棉种的筛选提出了更高的要求。为了避免播种往年活力不足的棉种而导致发芽率降低的问题,结合机器学习和近红外(NIR)高光谱成像技术(HSI)进行棉种年份精确鉴别,实现棉种的快速无损筛选。采集2016年—2019年近四年外观无明显差异的棉种各360粒,共1 440粒棉种(按照3∶1∶1划分训练集、验证集和测试集)作为样本,按照每批60粒采集915~1 698 nm范围的棉种高光谱图像,去除首尾两端噪声大的光谱,保留1 002~1 602 nm范围的光谱为原始数据。利用Savitzky-Golay(SG)平滑算法对光谱进行预处理,采用主成分载荷方法(PCA-loading)选取13个特征波段,基于全部光谱数据和特征波段(±10 nm)数据建立逻辑回归(LR)、偏最小二乘判别分析(PLS-DA)、支持向量机(SVM)、循环神经网络(RNN)、长短记忆网络(LSTM)和卷积神经网络(CNN)六种分类模型。使用全光谱数据建模时,六种分类模型在测试集上的鉴别准确率分别为96.27%,98.98%,99.32%,96.95%,97.63%和100%,其中CNN和SVM模型取得了较好的结果;使用特征光谱数据建模时,六种分类模型在测试集上的鉴别精度分别为93.56%,97.29%,98.30%,95.25%,94.24%和99.66%,其中CNN和SVM模型仍有较好的分类结果。结果表明,使用全光谱数据建模时,六种分类模型都可以实现较高精度的棉种年份鉴别,使用特征光谱数据建模时CNN和SVM模型的鉴别精度仍可达到98%;其中深度学习方法优于传统机器学习方法,但是传统机器学习方法仍能保持较好的鉴别准确率。因此,结合近红外高光谱成像技术和机器学习方法能够实现棉种年份的高精度鉴别,为棉花精量播种过程中的优质棉种选种技术提供理论依据和方法。  相似文献   

7.
千禧番茄营养丰富且酸甜可口,不同千禧番茄品种的风味和营养价值均有明显差异,尤其是番茄红素、柠檬酸、维生素C和氨基酸含量的差异较大。传统人工分类方式效率低、主观性强、误检率高等问题亟待解决。为筛选综合营养价值高且风味佳的千禧番茄品种,实现千禧番茄快速准确分类,提出了基于千禧番茄光谱特征的分类模型构建及GWO优化SVM算法研究,以期解决千禧番茄自动化分类问题。以四个品种千禧番茄作为研究对象,试验样本240个,将其按2∶1比例划分为训练集160个和测试集80个样本,利用可见-近红外光谱采集系统获取350~1 000 nm范围内的千禧番茄反射强度,经光谱校正得样本反射率;为增强信噪比,截取481.15~800.03 nm范围内的光谱波段作为有效波段。由于数据采集过程受无关信息干扰影响建模效果,故将平滑点数设置为3进行Savitzky-Golay(SG)平滑预处理。预处理后采用连续投影算法(SPA)提取特征波长变量,优选得到11个特征波长反射率作为输入矩阵X,预设样本变量1,2,3和4作为输出矩阵Y,利用支持向量机(SVM)建立SPA-SVM千禧番茄定性分类模型,训练集和测试集平均分类准确率分别为59.38%和48.75%;在此基础上,引入灰狼优化算法(GWO)对训练集160个样本训练,寻求SVM最优惩罚系数(c)和核函数参数(g),根据模型训练结果对测试集80个样本预测,建立SPA-GWO-SVM千禧番茄分类模型,训练集和测试集平均分类准确率分别为100%和81.25%。研究结果表明:经灰狼算法优化后的支持向量机模型性能明显提高,其中训练集和测试集平均分类准确率分别提高了40.62%和32.50%,灰狼优化算法可用于提高支持向量机的分类性能,实现对千禧番茄品种的分类。本研究为千禧番茄及其他果蔬快速准确分类提供了新的思路和方法。  相似文献   

8.
烟草是一种成分复杂的天然植物,地理位置、生长条件等外界因素直接影响着烟叶的品质;我国烟叶种植范围十分广泛,每个产区种植的烟叶都有其独特的风格特征,不同产区的烟叶配比对卷烟的质量起着决定性的作用。为实现烟叶产地准确、快速判别,基于近红外光谱(NIRS),采用灰狼算法(GWO)优化的支持向量机(SVM)算法实现烟叶产地鉴别分类。以8个产地的824个烟叶样本为研究对象,基于x-y距离样本集划分(SPXY)方法得到校正集617个和验证集207个样品。首先应用最佳波长筛选方法,如竞争自适应加权采样(CARS)和随机青蛙(RF)算法减少光谱冗余信息,最终从1 609个变量中分别获得141和534个与产地相关的重要变量,并以此输入SVM作为建模数据,接下来在相同搜索范围内比较了粒子群优化算法(PSO)、遗传算法(GA)和GWO对SVM分类模型的优化效果。结果表明,经RF筛选后的光谱变量较CARS具有更好的产地建模性能,其中RF-GWO-SVM对8个产地烟叶的整体判别正确率达到了96.62%,相较于RF-PSO-SVM和RF-GA-SVM正确率更高。同时,RF-GWO-SVM的运行时间分别比RF-PSO-SVM和RF-GA-SVM的运行时间缩短156和131 min,RF-GWO-SVM具有精度更高、寻优速度更快等优点。GWO对于SVM模型参数具有更高效的优化能力,可用于烟叶产地快速鉴别模型的建立。  相似文献   

9.
大量废弃的塑料制品给生态环境造成严重破坏,当务之急是要对塑料进行分类回收。传统的分类方法普遍存在成本高,效率低,操作复杂等问题,不能满足工业生产的需要。激光诱导击穿光谱技术由于具备简单灵活,快速灵敏等优点,在物质鉴别领域有广泛应用。采用激光诱导击穿光谱技术结合主成分分析(PCA)和支持向量机(SVM)算法对20种塑料进行分类识别研究。由于目前有关塑料分类识别速率的研究报道较少,该实验在保证识别准确率的前提下,进一步研究和分析实验过程耗费的时间,满足工业生产中快速分类的要求。每种塑料采集100组光谱数据,随机选取50组数据作为训练集建立模型,余下50组作为测试集测试模型的分类识别效果,所以训练集和测试集各有1 000组光谱数据。将训练集的数据不加处理地输入SVM中进行训练,并采用5折交叉验证建立最佳模型,此时测试集的识别准确率为99.90%,建模时间为1小时58分41.13秒,预测时间为11.96 s。由此可见,单纯使用SVM算法可以得到很高的准确率,但是需要耗费大量时间。为了提高实验效率,引入主成分分析算法,将原来的高维数据变换成低维数据,并用降维后的数据训练模型。针对不同的主成分个数,均采用随机训练十次再取平均值的方法获得相关数值。实验表明,当选取主成分个数为13时,得到相应的识别准确率为99.80%,而PCA处理时间为1.44 s,建模时间为12.16 s,预测时间仅为0.02 s。虽然PCA算法结合SVM算法在对20种塑料进行分类识别时准确率有轻微下降,但是大大减少了模型训练的时间,实验效率得到很大程度的提高。结果表明,结合两种算法辅助激光诱导击穿光谱可以对塑料进行快速准确的分类识别。  相似文献   

10.
煤矸智能识别是实现综放开采智能化亟待研发的新技术;可见-近红外光谱技术具有环保、实时等优势,满足煤矸智能分选的要求。为解决基于可见-近红外光谱的煤矸识别问题,引入在数据科学竞赛中表现出色的极端梯度提升树(XGBoost)算法。搭建可见-近红外光谱实验平台采集来自山西西铭、陕西神木、内蒙古巴隆图煤矿的块状煤与矸石样品在370~1 049 nm波段的反射光谱;利用黑白校正、始末波段去除、SG卷积平滑和标准正态变量变换(SNV)对采集的原始光谱进行预处理,以减少光照不均、噪声以及光程差的影响。依据三个煤矿煤与矸石样品反射光谱的差异划分实验组和测试组,实验组差异微小,用于对比不同模型的性能,挑选最佳算法;测试组差异较明显,用于测试最佳算法在其他煤矿下的表现,检验算法对不同煤矿的适用性。在实验组的实验中,首先基于XGBoost算法建立煤与矸石分类模型,并引入常用的机器学习分类算法k近邻法(KNN)、随机森林(RF)、支持向量机(SVM)做对比,结果表明XGBoost的表现最佳,十折交叉验证的平均准确度(ACC10)、分类准确度(ACC)与AUC值分别达到0.957 2,0.970 5与0.971 6,体现出较强的稳定性与分类能力。其次为降低数据维度减少模型运算量,使用递归特征选择(RFE)、连续投影算法(SPA)与竞争性自适应重加权算法(CARS)分别进行特征波长的选择并与上述四种分类算法结合构建简化分类模型,经测试RFE与XGBoost组合的简化模型表现最佳,ACC10,ACC与AUC值分别为0.965 7,0.980 3与0.980 3且数据维度降至9,在降低数据维度的同时提高了模型的稳定性与分类能力。在测试组的实验中,基于优选出的XGBoost与RFE-XGB算法建立的模型,同样可以实现对其他矿区煤与矸石稳定精确地识别,且简化模型表现更好,与实验组结果一致。  相似文献   

11.
OBJECTIVE: To assess by MR imaging the frequency of hepatic nodules in patients waiting on the liver transplant list and to determine whether certain underlying hepatic diseases were more often associated with the development of such hepatic nodules. MATERIAL AND METHODS: We reviewed the MR and clinical records in all patients seen by the liver transplant service at our center since its inception in January 1998 until September 2002. A total of 371 patients (207 men and 164 women, age range 18-68 years, mean 45 years) were included in the study. The presence of hepatic nodules, size, number and underlying hepatic diseases were determined in all patients. Magnetic resonance imaging was performed on a 1.5-T MR imager using T1-weighted, T2-weighted and multi-phase gadolinium-enhanced sequences. Odds ratio (OR) and 95% confidence intervals (CIs) were computed to evaluate the association between the underlying hepatic disease and the development of hepatic nodule. RESULTS: Among 371 liver transplantation candidates, the most common underlying hepatic disease was hepatitis C virus (HCV) infection, either alone (n=93; 25%) or associated with other hepatic diseases (n=40; 10.8%). Of all patients, 33 (8.9%) had regenerative nodules (RNs), 40 (10.7%) dysplastic nodules (DNs) and 57 (15.3%) hepatocellular carcinomas (HCCs). Hepatocellular carcinoma was observed in 35.3% of patients with HCV infection and alcohol abuse combined, 24.5% with cryptogenic cirrhosis, 25% with hemochromatosis and 19% with alcohol abuse. Patients who had either DNs or HCC were 2.5 times more likely to have either alcohol abuse or HCV, alone or combined, as the substrate of their liver disease (OR 2.54, 95% CI 1.56-4.13). Our data suggest a supra-additive interaction between HCV infection and ethanol in their association with MR imaging detected lesions. CONCLUSION: Patients with cryptogenic cirrhosis, alcohol abuse, HCV infection (alone or combined) and hemochromatosis had the greatest likelihood of having HCC, with the combination of HCV infection and alcohol abuse having the highest of all.  相似文献   

12.
稀疏降噪自编码算法用于近红外光谱鉴别真假药的研究   总被引:1,自引:0,他引:1  
近红外光谱分析技术作为一种快速、无损检测技术十分适用于真假药品现场鉴别。自编码网络作为当前机器学习领域研究的热点受到广泛关注,自编码网络是一种典型的深度学习网络模型,它比传统的潜层学习方法具有更强的模型表示能力。自编码网络使用贪婪逐层预训练算法,通过最小化各层网络的重构误差,依次训练网络的每一层,进而训练整个网络。通过对数据进行白化预处理并使用无监督算法对输入数据进行逐层重构,使网络更有效的学习到数据的内部结构特征。之后使用带标签数据通过监督学习算法对整个网络进行调优。首先对真假琥乙红霉素片的近红外光谱数据进行预处理以及白化预处理,通过白化处理降低数据特征之间的相关性,使数据各特征具有相同的方差。数据处理之后利用稀疏降噪自编码网络针对真假药品光谱数据建立分类模型,并将稀疏降噪自编码网络模型与BP神经网络以及SVM算法在分类准确率及算法稳定性方面进行对比。结果表明对光谱数据进行白化预处理能有效提升稀疏降噪自编码网络的分类准确率。并且自编码网络分类准确率在不同训练样本数量下均高于BP神经网络,SVM算法在少量训练样本的情况下更有优势,但在训练数据集样本数达到一定数量后,自编码网络的分类准确率将优于SVM算法。在算法稳定性方面,自编码网络较之BP神经网络和SVM算法也更稳定。使用稀疏降噪自编码网络对真假药品近红外光谱数据进行建模,能对真假药品进行有效的鉴别。  相似文献   

13.
基于LVQ与SVM算法的近红外光谱煤产地鉴别   总被引:1,自引:0,他引:1  
传统煤产地鉴别方法一般以发热量、挥发分、粘结指数、哈氏可磨指数和坩埚膨胀序数作为分类指标,过程复杂耗时较多、耗费巨大的人力、物力并且无法直接快速的得到煤样产地等问题,借助近红外光谱技术快速无损检测的优势,利用基于SVM的留一算法对光谱数据集进行异常样本剔除,得到包含正确光谱信息的煤样光谱数据集,构造基于SVM算法与LVQ算法的定性分析模型,完成基于近红外光谱分析技术的煤产地的快速鉴别,无需对煤样的各种指标进行汇总并且人为预测。针对SVM分析模型中存在随机参数优化问题,引入PSO算法对SVM模型中的损失参数C和核函数半径g进行改进,得到最优参数,最后引入计算准确率的方法对比以上模型并进行评价分析。实验一共收集了加拿大、俄罗斯、澳大利亚、印度尼西亚、中国内蒙等5个地区的煤样光谱数据集,数据集共计305组煤样样本,其中异常样本共计10组,分别选择各国煤炭光谱的前31组作为训练样本,后6组数据作为测试样本,结果表明各分类模型的分类准确率均能达到75%以上,其中基于PSO算法改进的SVM分析模型的准确率可达到96.67%,仅一个样本出现问题,可快速高效地实现基于近红外光谱分析技术的煤产地的鉴别。  相似文献   

14.
血痕的种属鉴别在刑事技术和检验检疫等领域有重要的实践意义,拉曼光谱技术为血痕种属鉴别提供了思路。实验采集人血及猪、鸡、鸭、牛、鼠5种动物的血样并获取其拉曼光谱,采用Savitzky-Golay方法平滑降噪,airPLS方法进行基线校正,选取100~1 700 cm-1波段进行实验。训练集有600组数据,测试集有300组拉曼光谱数据。第一部分实验对比了PLS-DA,LDA,PCA+LDA,SVM和PCA+SVM等方法,测试集准确率分别为84.0%,49.3%,78%,83.0%和85.7%,验证了降维算法结合SVM分类器的有效性。第二部分采用互信息算法、遗传算法和等间隔组合三种波段选择算法,结合SVM分类器做对比实验,结果显示互信息结合SVM算法的分类准确率最优,在选择波段数为50时,测试集准确率达到86.0%。在波段选择数为300时,三种波段选择算法结合SVM分类器的准确率都达到93%左右,大幅高于传统分类方法。实验结果表明,采用波段选择算法进行光谱降维,可以有效的提高算法的准确率和鲁棒性,同时使拉曼光谱种属鉴定的可解释性更强。波段选择算法确定了血痕鉴别的关键波段位置,对设计用于执法的便携式拉曼系统也有重要意义。  相似文献   

15.
基于多分类支持向量机的船舶桨叶数识别研究   总被引:1,自引:1,他引:0       下载免费PDF全文
分析了目前常用的支持向量机多分类方法以及存在的不足,本文提出了一种混合纠错输出编码的多分类支持向量机改进算法,并应用于利用船舶目标辐射噪声DEMON谱进行船舶桨叶数分类的实验。理论分析与实验结果表明,该改进算法编码明确、具备纠错能力,是一种有效的多分类支持向量机方法,在船舶桨叶数识别中,其分类性能优于一对余、一对一及最小输出编码支持向量机等多分类方法,可适用于船舶桨叶数的分类识别。  相似文献   

16.
17.
麦卢卡蜂蜜产自新西兰,具有很强的抗菌及抗氧化作用,其售价较高,近年来掺假事件时有发生,利用激光诱导荧光技术对掺杂糖浆的麦卢卡蜂蜜进行分类识别研究。选用266,355,405和450 nm四种常用激光作为激发源,选择三种品牌的新西兰进口麦卢卡蜂蜜(编号A,B,C)中掺杂烘焙糖浆作为实验样品,掺杂比例为0%~90%,间隔10%;每个激发波长下每种样本溶液重复测试60次,共7 200组数据。光谱数据首先进行荧光波段截取、平滑及归一化等预处理;然后随机选取80%的数据做训练集,20%的数据做测试集;对训练集数据使用主成分分析(PCA)结合线性判别分析(LDA)做数据降维;最后对降维后的数据分别建立K最近邻(KNN)和支持向量机(SVM)分类模型,对测试集数据进行分类识别,重复进行50次随机分组及分类识别后对得到的分类识别率求平均值及标准差。实验分析结果表明,激发光波长对最终识别结果影响较大,266 nm激发的荧光光谱分类识别正确率最高,三种麦卢卡蜂蜜掺杂溶液的分类识别率均能达到98.5%以上,最高能达100%;355和405 nm激发的分类识别效果次之,所有样品的分类识别率均大于92%;而450 nm激发的荧光光谱分类识别率最低,不同样品的分类识别率均低于66%。因此,后续分类算法的比较仅使用266,355和405 nm激发的荧光光谱数据,分析结果表明,KNN算法的分类效果要优于SVM算法,不同激发波长下三种蜂蜜掺杂溶液的分类识别率均是KNN算法更高,且对266 nm激发的三种蜂蜜掺杂样品,KNN算法的分类识别率比SVM算法要高1%以上。实验结果表明,使用激光诱导荧光技术对掺假麦卢卡蜂蜜进行分类识别是可行的,对于掺杂糖浆的麦卢卡蜂蜜,在使用的所有组合中,266 nm激发结合PCA-LDA降维和KNN分类算法的分类识别率最高,分类效果最好,可用于掺假麦卢卡蜂蜜的快速准确鉴别。  相似文献   

18.
19.
近红外光谱结合化学计量学方法对癌症的辅助诊断已有了文献报道.该文测定了77例不同生理阶段的子官内膜组织病理切片的近红外光谱,对其分别进行多元散射校正(MSC)、正交信号校正(OSC)以及二者联用的预处理方法,采用拉丁配分法选择3/4样本作为训练集,1/4样本作测试集,建立支持向量机(SVM)模型进行分类,并与基于同样预...  相似文献   

20.
激光探测对于获取云和气溶胶的垂直廓线,研究大气中云和气溶胶的垂直分布特征以及对全球气候变化的影响意义重大。而星载大气激光雷达云气溶胶分类算法的研究,对于激光雷达数据的参数反演及应用极为重要。针对激光条件下探测的云和气溶胶特有的光学信息和空间分布,结合概率统计与机器学习算法,提出了一种对于云/气溶胶、云相态及气溶胶子类型识别的分类算法,实现了星载激光雷达的大气特征层快速、有效分类。算法采用中国地区2016年CALIOP的观测数据作为样本数据,主要由三部分组成:(1)基于激光探测的云和气溶胶层不同的光学特性以及地理空间分布特征,分别构建了云和气溶胶的γ532,χ,δ,Z和lat的五维概率密度函数,以此为基础构建云气溶胶的分类置信函数,并基于此实现了云和气溶胶类型的反演;(2)选取支持向量机(SVM)作为随机朝向冰晶粒子(ROI)和水云分类的算法模型基础,结合云层的γ532,χ,δ Z和云顶温度T的概率密度函数构建ROI,水平朝向冰晶粒子(HOI)和水云的分类置信函数以修正SVM误分的特征层以及筛选出水云中少部分的HOI冰云,获得云相态的分类结果;(3)以各气溶胶子类型的光学以及空间分布特性为基础,采用决策树策略的气溶胶子类型识别算法实现了对气溶胶子类型的区分,完成气溶胶子类型的识别。利用现有CALIOP观测结果作为样本数据构建分类数据库,避免了对于地面以及航测数据的依赖,而机器学习则大大简化了算法的实现过程,使得云气溶胶分类更加高效。算法结果与正交极化云气溶胶激光雷达垂直特征层分布数据(CALIPSO VFM)产品对比分析:云层有98.51%一致性,气溶胶有88.43%的一致性,且白天比夜间一致性高。对于云相态分类,可以有效区分出水云和冰云,其中二者水云一致性高达93.44%。在气溶胶子类型反演结果中,可以准确识别出大多数气溶胶特征层子类型。霾、沙尘以及晴空三种典型情况下的反演结果均与CALIOP VFM产品数据具有较好的一致性。其中,霾天的大部分煤烟型以及污染型(污染沙尘以及污染大陆)气溶胶反演结果与VFM具有较好的一致性。沙尘天也能够获得较好的沙尘以及污染沙尘的结果。晴空为数不多的气溶胶层也取得了较为一致的结果。对于实现的星载大气激光雷达特征层分类算法,针对CALIOP激光测量的云气溶胶层的分类进行了重要的改进,在保证一定精度的基础上,简化了算法,提高了数据处理的效率,在下一步工作中,将分别构建不同时段和季节的分类模型以及提高两种不同偏振特性的冰云和气溶胶子类型的分类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号