摘 要: | 在法庭科学实践中,往往需要通过对文件中字迹墨水的成分分析来精确判定检材和样本文件的同一性。该文利用高光谱成像技术结合机器学习对喷墨打印墨水的种类进行区分,分别采集14套不同品牌、型号的4色(黑、青、品红和黄色)喷墨打印墨水打印的文件在400~1 000 nm范围的高光谱图像,共提取56种样品墨迹的光谱数据。使用均匀流形逼近与投影技术(UMAP)和T分布随机近邻嵌入技术(t-SNE)两种算法对高光谱喷墨打印墨水数据进行降维处理,然后建立极致梯度提升(XGBoost)、轻量级梯度提升机器学习(LightGBM)和支持向量机(SVM)3种分类模型,以1∶4的比例确定测试集和训练集,分别对原始数据和降维后的数据进行分类。实验结果显示,UMAP降维算法结合SVM模型对喷墨打印墨水分类的效果最优,黑色墨水样品的分类精度为90%左右,其余颜色墨水样品的分类精度均为100%。该研究为喷墨打印文件的检验鉴定提供了一种新的、无损、准确的鉴别方法。
|