基于GAS变换和PCANet的XRF-visNIR土壤重金属超标分析新进展-Tecsync(泰克鑫科)智能制造探索微观世界，解析万物之本

基于GAS变换和PCANet的XRF-visNIR土壤重金属超标分析新进展发布日期：2024-08-01 18:37:26 文章来源：Tecsync(泰克鑫科)智能制造探索微观世界，解析万物之本

TECSYNC

基于GAS变换和PCANet的XRF-visNIR土壤重金属超标分析新进展

01.研究背景

X射线荧光（XRF）和可见光-近红外光谱（visNIR）因其非破坏性和快速性，已成为评估土壤中各种参数和污染物极具前景的方法。对于土壤中重金属的分类和估算，XRF和visNIR的融合已经得到了广泛研究，并取得了高度准确的分类和估算结果。然而，当融合数据集中包含光谱数据过多的情况下，传统的分类模型在对于具有多个变量的高维XRF-visNIR光谱分类任务上表现不佳。

在光谱分类领域，深度学习模型在处理复杂分类问题方面取得了显著成功。研究表明，这些模型在准确性方面优于传统机器学习方法。在处理XRF-visNIR融合数据时，一维卷积神经网络（CNN）已成为强大的工具。然而，直接应用CNN可能导致信息丢失和无法捕获特征波长之间的关系。为了解决深度学习中的特征提取问题，研究人员提出了几种改进方法。例如，多尺度卷积神经网络引入不同尺度的卷积核，以捕获光谱数据在不同尺度上的波长特征。另一方面，自编码器可以通过学习数据的潜在表示来提取更有价值的特征。在现有研究的基础上，本研究旨在将深度学习网络应用于XRF-visNIR融合模型。为了应对非统一维度融合和无法保留波长特征的挑战，本研究设计了一种Gramian Angular Summation（GAS）方法，用于将一维光谱数据转换为二维图像。将XRF和visNIR作为RGB通道输入，从而将它们融合成一张新的图像。为了克服大数据冗余和特征提取困难的问题，本研究采用PCANet网络从图像中提取特征，通过利用深度学习网络、GAS 和 PCANet为土壤重金属污染的快速筛选提供了新的视角。

02.创新研究

2.1样品采集和XRF光谱采集

在清镇市红枫湖盆地采集了180个土壤样品。将土壤样品分别利用Tecsync公司制造的手持式XRF光谱仪和可见光-近红外光谱（vis-NIR）进行光谱分析。对于XRF光谱，在45 kV管电压、25 mA电流、90 s测量时间采集XRF光谱数据。对于vis-NIR光谱，光谱范围为350至2500纳米，采样间隔为1.4纳米（350-1000纳米）和2纳米（1000-2500纳米），重采样间隔为1纳米。

图1 数据采集及全文流程图

2.2 PCANet-CNN网络设计

在基于XRF-visNIR光谱的土壤重金属污染风险筛选任务中，采用CNN模型进行二元分类，结果为“是”或“否”。如果土壤样品中的元素浓度超过了风险筛选阈值，则认为存在重金属污染的风险。根据《中国农田土壤污染风险筛选值暂行技术规定》，筛选选择标准为pH≤5.5，与180个样品中168个的土壤pH值一致。其余12个样本的pH值均小于6.04。例如，在元素Pb的情况下，大于70 mg/kg的浓度标记为1，而小于或等于阈值的浓度标记为0。编码和建模过程如图2A所示。在样本选择过程中，选取红枫湖四个湖区的样本作为训练集和测试集，选取离红枫湖较远的样本作为独立验证集。

为了提供模型的全面比较，传统的1D-CNN和XGBoost模型分别使用预处理后的XRF和visNIR光谱构建，并使用数据融合方法。此外，通过结合RGB的GASF和GADF图像作为CNN的输入，建立了GASF_CNN和GADF_CNN模型。此外，采用PCANet特征提取方法建立GASF_PCANet_CNN和GADF_PCANet_CNN模型。共建立了6个分类模型，并对这些模型进行了全面的评价和分析。1D-CNN模型的结构如图2b所示。构建了10层结构，包括输入层、卷积层1、池化层1、卷积层2、池化层2、卷积层3、池化层3、全连接层1、全连接层2、输出层。

图2 a) GAS结合PCANet和CNN对土壤重金属进行分类；b) 1D-CNN网络

2.3 PCANet模型的参数设计

为了探究不同 PatchSize 对模型性能的影响并选择最佳 PatchSize，进行了以下实验。实验使用了四种不同的 PatchSize：3x3、5x5、7x7 和 9x9。训练并比较了 PCANet 和 CNN 模型的性能，如图3所示。在 3x3 PatchSize 下，PCANet 的训练时间为 18.56 秒，其在训练集和测试集上的识别率分别为 83.93% 和 79.76%。当 PatchSize 增加到 5x5 时，PCANet 的训练时间增加到 23.18 秒，但识别率分别下降到 79.46% 和 76.19%。随着 PatchSize 继续增加到 7x7 和 9x9，出现了相同的趋势。

这些实验结果揭示了一个重要现象：随着 PatchSize 的增加，尽管模型的训练时间增加，但识别率并没有提高，反而呈现下降趋势。这可能是因为增加 PatchSize 实际上增加了模型的复杂性，导致过度复杂化，从而影响了结果。基于上述分析，在设计 PCANet 模型的参数时，需要在实现高识别率和确保较短训练时间之间找到平衡。这需要根据具体应用需求和实际情况合理设置和调整参数，如 PatchSize。在本次建模中，选择 3x3 的 PatchSize 以实现最佳的模型性能。

图3 不同 PatchSize对PCANet 和 CNN 模型性能的影响

在建立 XRF-visNIR 重金属分类模型时，选择适当的 NumFilters 值至关重要。我们将 NumFilters 设置为 2、4、6 和 8，并进行了三次独立实验，其中训练集和测试集随机划分。计算了 PCANet 和 CNN 的训练时间，以及测试集和训练集的识别率。实验结果如图4所示，误差条以标准差表示。根据结果分析发现，NumFilters 值的增加对模型性能有一定影响。随着 NumFilters 的增加，PCANet 的训练时间逐渐增加。当 NumFilters 为 2 时，PCANet 的训练时间为 18.32 秒，而当 NumFilters 为 8 时，训练时间增加到 35.14 秒。这表明随着 NumFilters 的增加，训练时间也相应增加。同样，随着 NumFilters 的增加，CNN 的训练时间也逐渐增加。当 NumFilters 为 2 时，CNN 的训练时间为 11.52 秒，而当 NumFilters 为 8 时，训练时间增加到 13.45 秒。

在识别率方面，当 NumFilters 为 4 时，达到了最高识别率 85.42%。当 NumFilters 增加或减少时，识别率呈现不同程度的下降。在我们的实验数据中，当 NumFilters 为 6 时，识别率为 79.88%。综上所述，我们建议选择 NumFilters 为 4 的参数组合。这一组合在识别率方面达到了最佳效果，并且相对较短的训练时间使其更加实用。

图4 不同 NumFilters数量对PCANet 和 CNN 模型性能的影响

此外，我们基于数据分析研究了不同 BlkOverLapRatio 值对 PCANet 模型性能的影响。为了分析 BlkOverLapRatio 对 PCANet 模型的影响，我们使用土壤数据集进行了一系列实验。数据集被分为训练集和测试集，并在不同的 BlkOverLapRatio 值下训练和测试 PCANet 模型（见图 5）。我们可以观察到以下趋势：随着 BlkOverLapRatio 的增加，PCANet 模型的训练时间逐渐增加。例如，当 BlkOverLapRatio 为 0.00 时，PCANet 在训练集上的训练时间为 8.08 秒，而当 BlkOverLapRatio 增加到 0.70 时，训练时间增加到 28.04 秒。同样，CNN 的训练时间也随着 BlkOverLapRatio 的增加而增加。在识别率方面，我们注意到当 BlkOverLapRatio 为 0.00 时，训练集上的最高识别率为 87.50%。然而，随着 BlkOverLapRatio 的增加，识别率略有下降。例如，当 BlkOverLapRatio 为 0.70 时，训练集上的识别率为 85.42%。因此，在我的模型中，选择 BlkOverLapRatio 为 0.4。

图5 不同 BlkOverLapRatio 值对PCANet 和 CNN 模型性能的影响

局部直方图块的大小直接影响 PCANet 模型提取特征的表达。为了确定最合适的 HistBlockSize（N1 × N2），进行了三次独立实验，使用不同的 N1 = 2, 4, 6, 8, 10, 12 和 N2 = 2, 4, 6, 8, 10, 12。计算了每次实验的平均识别率和模型时间成本。首先，观察 HistBlockSize 对训练集样本识别率的影响，如图 6 所示。可以看到，随着 HistBlockSize 的增加，总体识别率呈下降趋势。特别是，当 HistBlockSize N1×N2 = 6 × 12 时，平均识别率最高，可达 91.25%；而当 N1×N2 = 2 × 12 时，平均识别率最低，仅为 72.58%。此外，观察 HistBlockSize 对测试集识别率的影响，如图6所示。当 N1×N2 = 6 × 12 时，平均识别率最高，可达 90.30%；而当 N1×N2 = 6 × 4 时，平均识别率最低，仅为 74.68%。通过分析不同 HistBlockSize 下识别率的热图，我们选择将 HistBlockSize 设置为 6 × 12 以实现最佳识别效果。

图6 不同 NumFilters数量对PCANet 和 CNN 模型性能的影响

2.4 XRF土壤重金属超标分析

本研究对多种模型进行了综合比较，包括 1D-CNN、RF、KNN、SVM、XGBoost、MLP、GBDT、GASF_CNN、GADS_CNN、GASF_PCANet_CNN和 GADS_PCANet_CNN，用于重金属的预测，准确率、召回率、精确率和 F1 分数结果如图7所示。

图7 不同重金属元素的测试集模型性能比较

1D-CNN的准确率、召回率、精确率和 F1 分数在不同重金属中范围为 64.84% 至 94.00%。RF 模型的性能参数范围为 64.31% 至 84.54%。1D-CNN 和 RF 算法可能不适合变量数量较多（超过 4000）的建模条件。在分类之前，还需要对大量数据进行必要的特征提取。与传统机器学习算法如 SVM 和 KNN 相比，XGBoost、MLP 和 GBDT 表现更佳。这些集成机器学习方法在各种重金属分类任务中表现出良好的性能。其中，XGBoost 模型具有稍高的平均准确率和平均精确率，MLP 模型具有稍高的平均召回率，GBDT 模型具有稍低的平均 F1 分数。

GASF_CNN、GADS_CNN、GASF_PCANet_CNN 和 GADS_PCANet_CNN 表现出色。每个模型在不同的重金属分类任务中均取得了相对较高的准确率、召回率、精确率和 F1 分数。在 Pb 和 Cd 分类任务中，CASF_PCANet_CNN 表现良好。然而，该模型对 Cd 的识别表现一般，平均准确率为 87.77%，这可能归因于 Cd 含量较低。为了提高 Cd 的识别，可能需要进行硬件改进或增加测试时间。在 As 和 Zn 分类任务中，GADS_CNN 表现出色。Zn 具有较高的风险筛选值，一般模型可以实现良好的识别。对于其他重金属，各模型的表现有所不同。

我们将使用训练和测试数据集训练的模型部署在嵌入式平台上，并在独立验证区域进行了快速验证，获得的结果如图 7E 所示。模型的表现与训练和测试数据集的一致。GASF_CNN、GADS_CNN、GASF_PCANet_CNN 和 GADS_PCANet_CNN 模型继续表现最佳。在七个重金属分类模型中，GASF_CNN、GADS_CNN、GASF_PCANet_CNN 和 GADS_PCANet_CNN 仍然取得了良好的结果。可以观察到，将 GAS 转换与深度学习网络结合比机器学习表现更好。从性能角度来看，GASF_PCANet_CNN 模型在独立验证区域表现出色。基于模型分析，我们推荐 GASF_PCANet_CNN 作为 XRF-visNIR 领域中重金属分析的最合适建模方法。该模型在本研究中针对所有评估的重金属均始终实现了高准确率、召回率、精确率和 F1 分数，对大多数重金属（包括 Pb、Cd、As、Cr、Cu、Zn 和 Ni）的 F1 分数在 97%左右。

03.应用与展望

本研究探讨了将XRF-visNIR光谱数据、Gram角场变换、PCANet网络特征提取和CNN结合用于重金属筛选的方法。通过GAF将XRF和visNIR转换为二维图像，然后将其融合成RGB图像。然后，提利用PCANet网络提取特征，该网络可以对高维GAF数据进行降维和特征提取，有效地最小化数据量。最后，将数据输入到CNN中进行模型训练并识别土壤中重金属是否超标，提高了识别和分类的准确性。与XGBoost等方法相比，本研究提出的方法可以提高Pb、Cd、As、Cr、Cu、Zn、Ni等7种重金属的分类性能，为土壤污染监测和管理提供了一种可行的解决方案。

服务热线|4000-988-166

联系电话|133-7683-5869

联系微信|tecsync_sale

（PS:发送时请备注公司或合作项目哦）

上一个：基于主成分分析和宽度学习系统的土壤重金属元素定量分析

下一个：面向XRF的竞争性自适应重加权算法和改进的支持向量机定量分析新进展

基于GAS变换和PCANet的XRF-visNIR土壤重金属超标分析新进展 发布日期：2024-08-01 18:37:26 文章来源：Tecsync(泰克鑫科)智能制造 探索微观世界，解析万物之本

基于GAS变换和PCANet的XRF-visNIR土壤重金属超标分析新进展发布日期：2024-08-01 18:37:26 文章来源：Tecsync(泰克鑫科)智能制造探索微观世界，解析万物之本