品质至上,客户至上,您的满意就是我们的目标
技术文章
当前位置: 首页 > 技术文章
Plant Phenomics | 用于农业深度学习模型的标准化和集中化数据集的高效训练
发表时间:2023-09-15 15:16:30点击:602
来源:植物表型组学
分享:
深度学习模型已经成为现代基于计算机视觉的农业任务的标准。现在,通过深度学习实现自动化的常见标准任务包括水果检测、作物和杂草分割以及植物疾病分类和预测。深度学习模型通常情况下最初并非应用于场景复杂的农业,因此数据集的模型权重会针对农业任务进行微调。缺乏针对农业的微调可能会增加培训时间和资源使用,并降低模型性能,从而导致数据效率的总体下降。
2023年8月,Plant Phenomics在线发表了加州大学戴维斯分校等单位题为Standardizing and Centralizing Datasets for Efficient Training of Agricultural Deep Learning Models 的研究论文。
为了克服这一限制,我们将数据集限制为三个任务:图像分类,语义分割和目标检测。此外,我们专注于只有单个3通道RGB图像输入的数据集,以便于使用标准深度学习模型为各种数据集创建基准,而无需进行任何架构修改,从而可以更轻松地访问更广泛的未来应用。然后,我们使用深度学习任务中常用的方法进行了许多实验,但这些方法在农业领域的特定应用中尚未被探索。我们的实验指导我们开发了许多改进数据的方法训练农业深度学习模型时的效率,无需对现有管道进行大规模修改。
图1 从本研究中使用的语义分割数据集的样本图像,分别为甜菜草、萝卜草和苹果花三种植物的图像。包含带有注释分割掩码的原始图像。每个图像来源的数据集在它上面进行了注释。这些图像以其原始的高宽比显示。
图2 一个来自加州葡萄检测的例子图像与本研究中使用的每一个增强应用于它。原始图像没有调整大小,而增强图像大小调整了(为了实际的训练)
本研究所构建的标准管道使深度学习模型能够在本研究所采集和整理的数据集上获得与现有基准相当的性能,在某些情况下甚至超过它们。这些数据集以及达到这些基准的预训练模型可以通过开源框架AgML获得,从而可以进一步研究开发更高效的数据和模型管道。下图(图3)总结了农业预训练权重的实验结果,每个结果代表7个单类模型,完整代表一个7类模型。对于所有的7类模型,预训练的农业模型显著优于COCO和NONE基线。
图3比较来自全球水果检测数据集的7个不同个体水果的mAP@0.5值,以及完整的数据集
本研究结果表明,即使是很小的训练修改,如使用农业预训练模型权值,或在数据处理管道中采用特定的空间增强,也可以显著提高模型性能,缩短收敛时间,节省训练资源。此外,本研究发现即使是在低质量注释上训练的模型也能产生与高质量注释相当的性能水平,这表明具有低质量注释的数据集仍然可以用于训练,扩大当前可用数据集的池。本研究所提出的方法广泛适用于整个农业深度学习,并呈现出显著提高数据效率的巨大潜力。
本文的主要作者为Amogh Joshi博士和Dario Guevara博士,所属单位加州大学戴维斯分校和下一代食品系统人工智能研究所。该项目部分得到了美国农业部人工智能下一代食品系统研究所(AIFS)的支持,美国农业部的奖项编号为2020-67021-32855。该项目主要由加州大学戴维斯分校葡萄栽培与酿酒学系和加州大学生物与农业工程学协完成,实验数据为AgML收集的公共数据。
论文链接:
https://doi.org/10.34133/plantphenomics.0084
——推荐阅读——
https://doi.org/10.34133/plantphenomics.0064
Plant Phenomics | 虚拟图像“以假乱真”,无需人工标注,自监督创建小麦表型算法
Analyzing Nitrogen Effects on Rice Panicle Development by Panicle Detection and Time-Series Tracking
https://doi.org/10.34133/plantphenomics.0048
Plant Phenomics | 南京农业大学基于目标检测与追踪算法在提取水稻抽穗开花期表型上的应用
加入作者交流群
扫码添加小编微信,拉您进入《植物表型组学》作者交流群,群内不定期开展作者分享会、专刊发布会等高质量活动。
添加小编微信,备注姓名+单位+PP,加入作者交流群
About Plant Phenomics
《植物表型组学》(Plant Phenomics)是由南京农业大学和美国科学促进会(AAAS)合作创办的英文学术期刊,于2019年1月正式上线发行。采用开放获取形式,刊载植物表型组学交叉学科热点领域具有突破性科研进展的原创性研究论文、综述、数据集和观点。具体范围涵盖高通量表型分析的最新技术,基于图像分析和机器学习的表型分析研究,提取表型信息的新算法,作物栽培、植物育种和农业实践中的表型组学新应用,与植物表型相结合的分子生物学、植物生理学、统计学、作物模型和其他组学研究,表型组学相关的植物生物学等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等数据库收录。科睿唯安JCR2022影响因子为6.5,位于农艺学、植物科学、遥感一区。中科院农艺学、植物科学一区,遥感二区,生物大类一区(TOP期刊)。2020年入选中国科技期刊卓越行动计划高起点新刊项目。
说明:本文由《植物表型组学》编辑部负责组稿。
中文内容仅供参考,一切内容以英文原版为准。
撰稿:吴庚宸(南京农业大学)
排版:张婕(上海交通大学)
审核:孔敏、王平