基于CARS和1D-CNN联合的XRF光谱分析新进展 发布日期:2024-07-03 16:53:33    文章来源:Tecsync(泰克鑫科)智能制造 探索微观世界,解析万物之本

基于CARS和1D-CNN联合的XRF光谱分析新进展


TECSYNC



1. 研究背景


土壤中的重金属污染是世界上突出的环境污染问题之一。随着社会城市化的快速发展,燃料燃烧、矿产开采、农药使用等人类活动加剧着土壤中重金属的污染程度。镍、铜、砷、铅等重金属在人类生活和工业排放中通过大气沉降和农业灌溉等方式进入土壤,并且长时间滞留难以降解。这些累积在土壤中的重金属对生态环境影响大,同时也对人类的健康构成了严重威胁。

然而,土壤重金属污染具有隐蔽性,人们很难凭借肉眼分辨出土壤中是否存在重金属及其含量,需要依靠相关检测技术对土壤中的元素含量进行测定及风险评估。能量色散型X射线荧光光谱(ED-XRF)分析是一种常用的无损分析、快速检测元素的方法,因其制样简单、快捷、环保、经济、准确有效等优点被广泛用于土壤、合金等的重金属检验。由于通常需要检测的重金属含量很低,元素特征峰会出现与其对应干扰元素特征峰发生谱线重叠的现象,从而导致土壤重金属超标分析的误差显著增加。本研究提出了一种基于CARS和1D-CNN联合的XRF土壤重金属超标分析方法对土壤中的重金属污染进行风险筛选。结果表明结合CARS算法的1D-CNN模型在判断土壤样品是否有Ni、Cu、As、Pb元素污染风险时的准确率分别可以达到96.67%,93.22%,91.67%,88.33%,在提高模型预测准确率的同时减少了模型的计算量,对于XRF光谱土壤重金属元素污染风险筛选具有较好的理论指导和应用价值。


2. 创新研究


2.1样品采集和XRF光谱采集

实验样品采用59份国家标准土壤样品,包含 GBW(E) 农业土壤成分分析标准物质、GSD 水系沉积物成分分析标准物质、GSS土壤成分分析标准物质三个系列样本。在数据采集过程中,采用泰克鑫科手持式XRF光谱仪对59个标准土壤样品进行了检测。为保证土壤光谱数据的稳定性,在45 kV管电压、25 mA电流、90 s测量时间下,使用光谱仪采集土壤样品的XRF光谱。

图1 光谱仪的原理图和数据采集过程


2.2 1D-CNN网络设计

卷积神经网络(CNN)是带有卷积操作的深度前馈神经网络。对于XRF 光谱数据来说,使用一维卷积神经网络(1D-CNN)可以不需要将原始一维向量转换为二维矩阵,相较二维卷积神经网络能够减少计算复杂度。本研究通过构建一维卷积核,提出土壤重金属元素含量超标检测的一维卷积神经网络X荧光光谱分析模型

卷积神经网络通常由输入层、卷积层、池化层、全连接层组成。一维CNN的结构与二维CNN相似,最主要的区别是在一维卷积层中将二维CNN中卷积核的大小修改为一维,降低了网络的复杂程度,1D-CNN模型结构图如图2所示。构造了一个10层一维CNN 用于判断土壤中重金属元素是否存在污染风险,包括输入层-卷积层1-池化层1-卷积层2-池化层2-卷积层3-池化层3-全连接层1-全连接层2-输出层,使用筛选准确率作为评价指标。

图2  1D-CNN模型结构图


2.3基于CARS算法的特征点采样

X 射线荧光光谱中有2048个通道(能量段)信息,但许多通道不在研究目标范围内,有必要进一步剔除区间能量中的无关变量,有效的变量选择方法能够提高模型的预测性能。本研究采用CARS算法进行特征筛选,在去除冗余信息的同时还提高了数据的可靠性,参数设置如下:迭代次数为20次,蒙特卡罗采样时建模集与校正集的比例为0.8,最大主成分数为20,交叉验证数为10。将59份经过预处理后的土壤样品作为输入,大小为59×2048,以单一目标元素的含量作为输出,大小为59×1。以Pb为例,图3为基于CARS算法Pb元素的能量段变量筛选过程。

图3  针对Pb元素光谱数据CARS采样过程


由图3可知筛选出来的特征变量数呈指数函数下降趋势,谱图的特征通道从原始的2048个急剧减少至400个通道,然后逐渐缓慢减少并趋于稳定。RMSECV变化趋势呈现先减小后增大的特点,RMSECV值减小则表明筛选过程中成功剔除了与Pb元素不相关的特征峰信息。经过CARS采样,特征变量数出现大幅度减少,Ni、Cu、As、Pb元素从原来的2048个特征分别减少至37、53、37、45个,为原来通道数的1.81% ~ 2.59%,去除了XRF光谱能量区间中大量的无用信息。

2.4基于CARS和1D-CNN联合的XRF土壤重金属超标分析

采用 CARS算法对原始光谱信息进行变量筛选,并与连续投影算法(SPA)进行比较,然后利用1D-CNN方法建立土壤重金属元素含量超标检测模型。针对SPA 变量选择方法[19],其利用矢量空间共线性最小化原理,设置最小波长数为1,最大波长数为50,找到最小冗余信息的变量筛选结果,将筛选后的结果输入到1D-CNN模型进行预测。

将1D-CNN模型与上述模型作对比,表1为不同方法下元素含量风险筛选模型的准确率。首先对比CARS和SPA筛选算法的有效性,可以看出CARS算法在 X 射线荧光光谱的变量选择方面具有较明显优势,可以筛选出更为有用的通道信息并去除冗余信息,降低模型计算量。在CARS算法基础上,对比1D-CNN和PLSR模型的效果,发现1D-CNN模型的预测准确率优于传统的PLSR模型,它可以提取到比 PLSR方法更多更深层的有用光谱信息,模型精度更高。将CRAS筛选算法和1D-CNN方法结合可以很好的提取光谱特征信息,大幅度提高了模型的准确性。

表1 十折交叉验证下基于不同风险筛选方法的元素含量超标预测结果准确率




3. 应用与展望


本研究基于 X 荧光光谱分析技术,建立 CARS-1D-CNN模型对重金属元素进行土壤风险筛选判别与分析。首先,采用于CARS 方法进行能量特征选择,并将筛选后的数据作为1D-CNN模型输入,判断是否有重金属污染风险。与全能量段1D-CNN、SPA-1D-CNN相比,CARS方法有效去除了冗余的干扰信息,在降低模型计算量的同时还提高了风险筛选的效率。在CARS筛选的基础上,1D-CNN相较于传统的PLSR模型具有更优的预测精度和预测能力,Ni、Cu、As、Pb的风险准确率分别为96.67%,93.22%,91.67%,88.33%。本研究首次提出将CARS结合1D-CNN模型用于土壤风险筛选,对XRF光谱土壤重金属元素污染筛选有一定的指导意义,为深度学习在本领域应用提供新的思路。

服务热线|4000-988-166

联系电话|133-7683-5869

联系微信|tecsync_sale

(PS:发送时请备注公司或合作项目哦)