首页 | 本学科首页   官方微博 | 高级检索  
     检索      

可能模糊鉴别C均值聚类的茶叶FTNIR分类研究
摘    要:茶叶傅里叶近红外光谱(FTNIR)中含有茶叶的有机物化学成分信息,不同品种茶叶的化学成分和含量都有差异,所以利用傅里叶近红外光谱进行茶叶品种分类是可行的。由于茶叶近红外光谱数据具有维数高,有波峰和波谷,光谱重叠交错等特点,所以准确分类光谱数据存在困难。为此,提出一种可能模糊鉴别C均值聚类(PFDCM)算法,将模糊线性判别分析(FLDA)引入到可能模糊C均值聚类(PFCM)算法中,在模糊聚类过程中FLDA可提取茶叶近红外光谱的鉴别信息和进行数据空间的转换。PFDCM在对茶叶光谱进行模糊聚类后得到的模糊隶属度和典型值可实现茶叶近红外光谱的准确聚类,具有聚类速度快,准确率高等优点。由于PFDCM的典型值没有隶属度之和为1的约束条件,因而PFDCM在聚类含噪声的光谱数据方面优于模糊C均值聚类(FCM)。采集岳西翠兰,六安瓜片,施集毛峰和黄山毛峰四种茶叶共260个样本,采用AntarisⅡ型傅里叶近红外光谱仪采集茶叶的傅里叶近红外光谱。光谱波数范围为10 000~4 000 cm~(-1),实验所得近红外光谱为1 557维的高维数据。首先,将光谱数据用多元散射校正(MSC)进行预处理以减少光谱散射和噪声影响和增加信噪比;其次,用主成分分析法(PCA)降低光谱数据空间的维数,经过PCA处理后光谱数据维数为7;然后,用线性判别分析(LDA)提取光谱数据中的鉴别信息并将光谱数据空间的维数进一步降低到3维;最后,分别用FCM,可能模糊C均值聚类(PFCM)和PFDCM进行数据的聚类分析,实现茶叶品种的准确分类。实验结果:权重指数m=2.0,η=2.0, FCM, PFCM和PFDCM聚类算法的聚类准确率分别为93.60%, 93.02%和98.84%; FCM收敛时共迭代25次,而PFCM和PFDCM收敛时分别迭代8次和23次;模糊聚类收敛所消耗的时间, FCM最少,而PFDCM最多。FTNIR技术结合MSC, PCA, LDA和PFDCM提供了一种实现茶叶品种准确鉴别的分类模型。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号