基于惩罚最小二乘算法的光谱基线校正研究新进展 发布日期:2024-08-28 16:44:35 文章来源:Tecsync(泰克鑫科)智能制造 探索微观世界,解析万物之本
基于惩罚最小二乘算法的光谱基线校正研究新进展
研究背景
能量色散X射线荧光(EDXRF)光谱仪作为一种定量分析技术,可快速实现多种重金属元素的同步分析。除了能无损检测外,EDXRF因其体积小、质量轻、分析速度快以及准确度高,广泛应用于野外现场分析。然而,在获取X射线荧光光谱的过程中,常伴随着各种噪声和背景干扰,如SDD探测器、采集板、样品成分复杂等。噪声是高频信号,基线变化是低频信号。同时,基线问题是一个相对复杂的问题。因此,很难开发出一种理论上完美的方法来处理基线问题。基线的近似估计是一般方法。通常,直线用于连接信号峰的两端。以直线为基线,在此基础上进一步计算峰面积或峰高。如果直线不符合实际基线,计算就会产生误差。
近年来,许多研究人员提出了各种基线校正方法,例如小波变换、多项式拟合、傅里叶变换、形态学和惩罚最小二乘。在这些方法中,惩罚最小二乘因其在光谱背景扣除中的高效率和简便性,一直是一个被广泛采用的方法。在惩罚最小二乘算法中,文献中多见单独提出或者几种应用于近红外光谱领域,均未见应用于X射线荧光光谱领域。因此,本研究选择具有代表性和较新颖的5种惩罚最小二乘(或其改进)算法结合PLS技术分别对土壤样品中的铅和砷建立X射线荧光光谱定量分析模型,并对比分析模型的相关指标,选取最适合X射线荧光光谱基线校正的算法。然后,采用选好的PLS模型分别与神经网络(BP)和支持向量机(SVR所建立的模型进行比较分析,建立一个较优的土壤中X射线荧光光谱定量分析模型。本研究所建立的土壤中重金属含量的定量分析模型不仅能为土壤污染调查分析提供技术支持,也可为惩罚最小二乘算法在X射线光谱领域的研究提供理论基础。
创新研究
2.1样品采集和XRF光谱采集
实验样品采用89份土壤样品,包含鄱阳湖土壤、GSD国标土壤、GSS国标土壤系列。在数据采集过程中,采用Tecsync公司制造的手持式XRF光谱仪对89个标准土壤样品进行了检测。XRF光谱仪在管压35keV、电流40μA和时间90s下,采集土壤X射线荧光光谱数据,测量时每个样本测量3次,3次移动不同位置,取平均值作为光谱数据,共获取样品在0~45keV范围内共2048个通道数的光谱信息。
2.2 惩罚最小二乘算法基线校正
以国家土壤标准物质GSS-7为例,5种基线校正方法拟合得到基线如图2所示。从图1中可以看出,DRPLS算法对基线有较好的拟合效果,所得的估计基线能够更好地拟合本底,估计基线与X射线荧光光谱的真实基线最为接近,可以精确拟合土壤实际光谱目标元素特征峰附近的基线,且基线校正后的本底扣除最为明显。而ASLS、ARPLS和LRSPLS算法所得估计基线存在着不同程度的位置偏低的现象,从而低估了土壤样品实际光谱的基线,而这一现象也间接证明了ASLS、ARPLS和LRSPLS的加权方案总是受到实际光谱噪声的影响。另外,AIRPLS算法的估计基线沿着底部信号中间穿过,而不是沿着X射线荧光光谱真实基线的底部,这将造成校正后光谱向下凹起,进而导致谱强度偏小,小峰无法识别,从而影响对X射线荧光光谱的后续分析,特别是定量分析结果的准确性。
图1 GSS-7国家标准土壤的X射线荧光光谱估计基线与校正结果
为了更具体地比较不同方法对实测光谱信号拟合的效果,删去校正后光谱特征峰区域的数据,然后求取信号方差。方差越小,说明校正后信号的基线越平缓,拟合效果越好,去除特征峰后信号的方差如表1所示。
表1 去除特征峰后信号的方差
与其他4种方法相比,DRPLS算法在土壤样品实测数据中得到的方差最小,为1.52×10-3,说明DRPLS算法在样品非特征峰区的基线不会太高或太低,校正后的基线最平缓,波动最小,拟合效果最好。综上所述,该方法可以有效地去除XRF谱的基线,为后续定量分析模型的精度提高提供了保障。
利用原始数据和使用5种处理方法对土壤样品X射线荧光光谱进行基线校正处理后的光谱数据绘制校准曲线,分别基于PLS建模,进行铅和砷元素的定量分析,结果表2所示。
表2 基线校正后的结果
不同算法基线校正处理对PLS模型精度的影响差异明显,6种光谱基线校正方法中,铅的预测集R²最大的为0.982,最小的为0.912;RMSECV和RMSEP最大的分别为0.233mg/kg和0. 239mg/kg,最小的分别为0.113mg/kg和0.056mg/kg。从图1和表2中均可看出AIRPLS的效果最差,经基线扣除后的RMSECV和RMSEP 最大,且低于无基线处理的PLS模型。图2b中DRPLS基线校正的结果表明,经基线校正处理后,原始光谱的基线有较明显改善。DRPLS基线校正后的模型训练集和预测集R²,RMSECV和RMSEP均有提高,且主成分数也减少,改善了模型的精度。从多个指标综合考虑,相比较其他几种基线校正方法,可以得出DRPLS基线校正处理方法对PLS模型精度影响效果最好,但也并不是所有的惩罚最小二乘基线校正算法均对PLS模型精度改善有效果,有可能对模型产生负影响。
2.3 不同定量反演模型建模对比分析
为了验证该最优选算法在不同模型中对定量分析的影响,将铅和砷元素作为定量分析对象,进行PLS、BP和SVR建模,以模型决定系数(R²)和预测均方根误差(RMSEP)作为评价标准,对不同模型建模的预测结果进行评价。利用Kennard-Stone(K-S)算法样本划分方法将光谱原始数据的69个样品划作训练集,20个样品划作预测集。采用DRPLS对土壤重金属铅和砷的光谱基线校正后进行PLS、BP和SVR建模,20个预测集预测值与实际值的拟合结果见图2-图4。铅和砷的预测值和实际值的R²和RMSEP见表3。
表3 两种重金属的预测值和实际值的拟合结果
图2 铅和砷元素的DRPLS-PLS模型的建模和预测结果
图3 铅和砷元素的DRPLS-BP模型的建模和预测结果
图4 铅和砷元素的DRPLS-SVR模型的建模和预测结果
通过对比分析R²和RMSEP,可以得出DRPLS-SVR是具有最佳的回归效果,铅和砷的R²分别为0.998和0.993,RMSEP分别为0.015mg/kg和0.59mg/kg,相比较于无任何基线校正处理SVR不仅在精度方面有较大的提升,比DRPLS-BP在时间性能方面也有所提高,且与DRPLS-PLS相比具有更好的泛化性能和预测效果。 综上所述, SVR比PLS模型和BP模型更适用于土壤浓度的测定,因为SVR模型具有较高的准确性。
应用与展望
针对X射线荧光光谱分析技术在检测土壤重金属方面具有无损、快速等优点。实际应用过程中,由于土壤背景复杂,包含大量噪声和干扰信息,易受基体效应影响问题,为了提高定量分析模型的精度,需要对X射线荧光光谱进行基线校正,减少基线漂移的影响。惩罚最小二乘算法作为一种基线常用算法,通过拟合基线与真实基线之间的保真度和平滑度,基于最小二乘来进一步优化拟合基线。选用无基线扣除、非对称最小二乘(ASLS)、自适应迭代重加权惩罚最小二乘(AIRPLS)、非对称重加权惩罚最小二乘(ARPLS)、局部对称重加权惩罚最小二乘(LSRPLS)和多约束重加权惩罚最小二乘(DRPLS) 等6种处理方法对土壤中的重金属元素铅和砷的测量光谱进行基线校正;然后结合偏最小二乘(PLS)算法建立相应的校正模型以选择最优基线校正算法;最后与神经网络(BP)和支持向量机(SVR)建立的校正模型进行比较,评价模型的优劣。结果显示:铅的最佳模型为DRPLS-PLS,模型的R²达到0.982,预测均方根误差(RMSEP)为0.056mg/kg;砷的最佳模型为DRPLS-PLS模型,模型的R²达到0.985,RMSEP为0.796mg/kg。SVR模型与PLS和BP模型相比,两种元素铅砷的SVR模型建模均最优,模型的R²分别达到0.998和0.993,RMSEP分别为0.015mg/kg和0.596mg/kg。实验表明通过基线校正后建立的模型预测精度、检出限和稳定性均有所提高,可以有效提高X射线荧光光谱在土壤中的定量分析能力。
服务热线|4000-988-166
联系电话|133-7683-5869
联系微信|tecsync_sale
(PS:发送时请备注公司或合作项目哦)