027-87860098

用于评估作物种子和其他物体的高光谱分类模型性能的实验数据处理

2022/8/24
正在开发和采用光学传感解决方案来对包括农作物种子在内的各种生物对象进行分类。光学分类模型的性能评估仍然是一个重点和挑战。作为训练数据,作者从两个番茄品种的 3646 颗番茄种子(发芽是/否)中获取了高光谱成像数据。作者进行了三个实验数据操作:(1)对象分配错误:训练数据中的单个对象被分配到错误的类的影响。(2) 光谱重复性:引入已知范围(0-10%)的随机噪声对单个反射率值的影响。(3) 训练数据集的大小:减少训练数据中观察值的影响。基于两个函数[线性判别分析 (LDA) 和支持向量机 (SVM)] 的分类器都可以表征和量化这些实验数据每一个操作的影响。


本研究中包括的番茄种子的图像和平均反射率分布。来自两个品种 A 和 B 的番茄种子照片,以及每个品种的五个子样本 (a)。本研究中番茄种子品种1 (B)和2 (c)的五个子样本的平均反射率分布。

两种分类函数精度均随着目标分配误差的引入和光谱可重复性的实验降低而线性下降。 作者还证明了将训练数据减少 20% 的实验对分类准确性的影响可以忽略不计。LDA 和 SVM 分类算法被用于独立验证种子样本。 基于 LDA 的分类预测种子萌发的 RMSE = 10.56(品种 1)和 26.15(品种 2),基于 SVM 的分类预测种子萌发的 RMSE = 10.44(品种 1)和 12.58(品种 2)。


发芽和非发芽种子的平均反射率分布。品种 1 和 2 (a) 中未发芽和发芽的番茄种子的平均分布,以及品种 1 和 2 (b) 的发芽(发芽/未发芽)的相对影响

作者认为,这项研究是第一次在光学种子分类中既包含基于实验数据操作的两个单独分类函数的全面性能评估,又将分类模型应用于验证未包含在训练数据中的种子样本。提出的实验数据操作在更广泛的背景和一般相关性中进行了讨论,并建议将它们作为光学分类模型的深度性能评估的方法。

来源:Plant Methods.Experimental data manipulations to assess performance of hyperspectral classification models of crop seeds and other objectsChristian Nansen, Mohammad S. Imtiaz, Mohsen B. Mesgaran & Hyoseok Lee
https://plantmethods.biomedcentral.com/articles/10.1186/s13007-022-00912-z