基于PSO-CARS和BLS-Net的土壤XRF 重金属元素定量分析研究 发布日期:2024-12-05 15:00:09 文章来源:Tecsync(泰克鑫科)智能制造 探索微观世界,解析万物之本
基于PSO-CARS和BLS-Net的土壤XRF重金属元素定量分析研究
研究背景
TECSYNC
随着社会农业现代化的发展,重金属元素对土壤生态的危害已成为人类不可忽视的土壤污染问题。农药和化肥的过量施用导致土壤受到严重的有毒元素污染。由于生物体容易富集重金属元素,这些元素逐渐在土壤环境中积累,并通过食物链危害人体健康。因此,准确检测土壤中重金属元素是一个迫切需要解决的问题。将基于数据预处理的机器学习与XRF光谱相结合,已经成为提高土壤重金属元素定量分析性能的有力工具。然而,由于XRF光谱强度与待测元素浓度之间复杂的线性和非线性关系,将单一的线性或非线性模型用于元素预测,可能会损害信息的丰富性,并降低定量分析的性能。
本研究提出了一种结合粒子群算法优化的竞争性自适应重加权采样(PSO-CARS)和双主成分分析(PCA)优化的宽度学习系统(BLS-Net)的新型XRF定量分析框架,以准确预测土壤重金属元素浓度。首先,为了充分挖掘XRF光谱变量与重金属元素之间的隐含关系,提出了一种用于XRF光谱变量选择的PSO-CARS方法。然后,为了量化谱变量子集与重金属元素浓度之间的混合线性和非线性关系,提出了一个BLS-Net来准确预测不同元素的浓度。本文研究的低浓度重金属元素包括Cr、Cd、Cu和Pb。为了评估该方法相对于其他先进方法(LSTM(长短期记忆)、MLP(多层感知器)、SVR(支持向量回归)、CNN(卷积神经网络))的优越性,本文使用的评价指标包括决定系数(R2)、均方误差(MSE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE)。本研究完整流程如图1所示。
图1 利用PSO-CARS和BLS-Net对土壤重金属元素进行定量分析的示意图
创新研究
TECSYNC
2.1样品采集和XRF光谱获取
在本工作中,从国家标准中心获得了57个标准土壤样品。所有土壤样品均严格按照土壤环境监测技术规范进行采样。标准样品中的元素浓度由国家标准中心采集和验证,以确保结果的准确性和权威性。实验使用的XRF设备是由泰克鑫科(TECSYNC)公司生产的TSXH4000手持式能量色散X荧光(ED-XRF)光谱仪。采集的土壤样品和使用的ED-XRF光谱仪如图2所示。干燥过程在电热恒温烘箱中进行。标准土样在105℃的烘箱中干燥2小时。然后,将干燥的样品取出,放在研磨机中研磨10分钟。研磨后的粉末通过200目(0.075毫米)筛子筛过。将筛过的样品放置在一个开口的聚丙烯样品杯中。然后,将聚酯薄膜压实并覆盖以进行测试。
图2 土壤和光谱仪示意图 (a) 57个土壤样品;(b) ED-XRF光谱仪
2.2 基于PSO-CARS的光谱变量选择策略
竞争性自适应重加权采样(CARS)是一种有效的光谱变量选择算法,它利用指数递减函数(EDF)来限制变量的数量。然而,由于EDF的强制衰减机制,在变量选择早期与低浓度元素相关的光谱变量丢失,增加了定量分析的难度。粒子群算法是一种有效权衡全局最优和局部最优关系的启发式搜索技术。本研究提出了一种基于粒子群算法的自适应衰减策略来优化CARS算法的EDF函数。通过控制每次迭代中变量数量的衰减速率,使算法能够保留更多的光谱信息。这些信息通常与低浓度元素的浓度呈现弱线性关系,因此确保了信息的有效性和可靠性。此外,PSO-CARS根据偏最小二乘(PLS)的变量重要性排序(回归系数的绝对值)确定变量的权重。同样,PLS获得的RMSECV用于选择变量的最优子集。
本文选取Cr、Cd、Cu、Pb四种元素进行分析。为了公平比较,选择原始CARS算法作为PSO-CARS算法的基线,并确保不同算法的参数设置一致。以元素Cd为例,图4显示了CARS和PSO-CARS中Cd的变量选择过程。红、蓝线分别代表CARS和PSO-CARS的优化过程。与图3(a)中的CARS相比,PSO-CARS的变量衰减曲线呈现出非光滑的下降趋势。PSO倾向于在每次迭代中通过平衡局部和全局搜索空间来自适应地确定更有效的变量,而不是强制选择光滑收敛的解,从而找到最合适的变量衰减曲线。图3(b)分析表明,经过50次迭代后,CARS算法表现不佳,在减少变量的同时难以提取与Cd浓度相关的关键光谱信息。在第29次迭代时,CARS算法达到最低RMSECV(0.706)。相比之下,PSO-CARS表现出更好的性能,RMSECV值遵循先下降后上升的模式,在迭代第37次达到最低(0.367)。在变量数量上,PSO-CARS在第29次和第37次迭代中比CARS拥有更多的变量。主要原因是PSO-CARS算法在变量衰减过程中保留了与元素相关的强线性变量(特征峰)和一些弱线性变量。这些弱线性变量通常是与待测低浓度元素相关的辅助信息,其中包含非光谱特征峰的变量。CARS算法在变量选择的早期就排除了部分弱线性谱变量,导致关键信息的丢失,最终难以达到更好的性能。图3(c)的回归系数路径证实了上述观察结果。
图3 Cd的CARS和PSO-CARS变量选择过程。(a)变量数量的变化趋势,(b) 5倍交叉验证的RMSECV值,(c)各变量的回归系数路径图。
2.3 双PCA优化的BLS-Net
宽度学习系统(BLS)通过利用融合建模的优势来解决同时拟合线性和非线性关系的问题,而不需要额外的模型来处理复杂的光谱信息。BLS的体系结构包括三层:用于线性变换的特征映射层,用于非线性变换的增强层,以及输出层。
PCA是一种通用的线性数据优化技术,它可以从高维数据中过滤冗余信息,降低定量分析模型陷入过拟合的风险。核主成分分析(KPCA)是主成分分析的一种非线性扩展,可以更好地挖掘数据中的非线性关系。鉴于它们能够捕获线性和非线性隐式信息,同时增强BLS的结构有效性,本研究提出了一种增强的定量分析模型,即双PCA优化BLS(BLS-Net)。BLS-Net可以更有效地揭示和利用PSO-CARS识别的细微候选光谱信息,对土壤重金属元素进行精确定量。BLS- Net在原始BLS之上包含一个额外的PCA层和KPCA层。其中,PCA层用于细化特征映射层的线性关系,KPCA层用于阐明增强层的非线性关系。该模型简化了隐藏层的复杂度,增强了模型的融合建模能力和整体泛化性能。BLS-Net的框架结构如图4所示。
图4 BLS-Net模型的框架图
将BLS-Net与其他先进的机器学习方法进行了更广泛和全面的比较,包括LSTM、MLP、SVR和CNN。所有的机器学习模型都将PSO-CARS的变量选择结果作为输入,并通过预实验设置不同比较模型的最优参数。表1显示了BLS-Net模型和不同机器学习模型的完整预测性能评估。与其他方法相比,该方法具有更高的R2和更低的MSE、RMSE和MAPE。这种性能优势在Cd的定量分析中表现得最为明显。在Cd分析中,BLS-Net的R²分别比LSTM、MLP、SVR和CNN高0.152、0.17、0.108和0.124。在预测Cr的元素浓度实验中,与LSTM、MLP、SVR和CNN相比,BLS-Net将测试集的RMSE分别降低了65.265、36.167、91.774和51.973。在Cu的预测精度方面,BLS-Net与LSTM、MLP、SVR和CNN相比,RMSE分别降低了16.713、30.074、9.326和46.324。同样的性能优势也反映在Pb的定量结果中。
表1 PSO-CARS变量选择后不同机器学习方法定量预测结果的比较。
上述结果表明,所提出的BLS-Net的融合建模能力有效地利用了与低浓度重金属元素相关的不同类型的复杂信息,增强了模型的预测能力。此外,PSO-CARS在定量分析上与BLS-Net更具兼容性和一致性。尽管PSO-CARS提取了更有效的变量子集,但其他非线性模型仍然不可避免地存在单一建模方式的过拟合问题,并且对低浓度重金属元素的定量性能有限。显然,结合PSO-CARS和BLS-Net可以充分捕捉和量化光谱强度与元素浓度之间的复杂映射关系。
2.4 BLS-Net的可解释性研究
BLS-Net模型可以通过特征映射层和增强层量化光谱中变量和感兴趣性质之间的线性和非线性关系,并分别通过PCA和KPCA层优化不同的响应。因此,模型的拟合结果为线性和非线性响应之和。BLS-Net的浓度预测输出分为PCA层输出(线性)和KPCA层输出(非线性)。为了观察BLS-Net对元素浓度的拟合过程,本研究在测试集上可视化了4种重金属元素的BLS-Net模型的线性和非线性驱动响应。
图5显示了预测样品中不同元素浓度的线性和非线性响应的比例。从图5可以看出,对低浓度元素的预测主要依靠BLS-Net来拟合光谱中的非线性信息。随着元素浓度的增加,光谱的线性信息逐渐占主导地位。对于待测元素浓度较高的样品,光谱特征峰与元素浓度之间存在明显的线性关系。BLS-Net可以减弱非线性信息对预测结果的干扰。结果表明,BLS-Net有效地量化了光谱中的混合信息,并在精度和可解释性之间实现了有效的权衡。
图5 BLS-Net预测结果的线性和非线性响应。(a) Cr, (b) Cd, (c) Cu, (d) Pb
总结和展望
TECSYNC
本研究引入了一个定量框架,利用PSO-CARS算法进行变量选择,利用BLS-Net通过XRF预测土壤中的重金属元素。PSO-CARS利用粒子群的全局搜索能力,动态调整和保存与低浓度重金属元素相关的关键信息。同时,BLS-Net通过优化光谱变量子集强度与元素浓度之间的线性和非线性响应来提高预测精度。该框架解决了变量选择和分析过程中的信息丢失问题,并通过四个重金属元素浓度预测实验证明了其优越性。该方法提高了XRF分析土壤中低浓度重金属元素的准确性、可靠性和适用性。此外,BLS-Net定量分析的可视化结果显示,土壤重金属元素浓度与定量分析模型的拟合能力(线性和非线性)密切相关。这些发现突出了BLS-Net作为一种有效的光谱融合建模技术的潜力。
服务热线|4000-988-166
联系电话|133-7683-5869
联系微信|tecsync_sale
(PS:发送时请备注公司或合作项目哦)