學(xué)術(shù)中心
PlantSeg:用于植物病害分割的大規(guī)模野外數(shù)據(jù)集
發(fā)布時(shí)間:
2024-10-16
來源:
作者:
植物病害對(duì)農(nóng)業(yè)構(gòu)成重大威脅。它需要正確的診斷和有效的治療,以保障作物產(chǎn)量。為了實(shí)現(xiàn)診斷過程的自動(dòng)化,通常采用圖像分割技術(shù)來精確識(shí)別病害區(qū)域,從而推進(jìn)精準(zhǔn)農(nóng)業(yè)的發(fā)展。開發(fā)穩(wěn)健的植物病害圖像分割模型需要在大量圖像中提供高質(zhì)量的標(biāo)注。然而,現(xiàn)有的植物病害數(shù)據(jù)集通常缺乏分割標(biāo)簽,并且往往局限于受控的實(shí)驗(yàn)室環(huán)境,不能充分反映自然環(huán)境的復(fù)雜性。基于這一事實(shí),我們建立了一個(gè)大規(guī)模的植物病害分割數(shù)據(jù)集PlantSeg。PlantSeg 與現(xiàn)有數(shù)據(jù)集的區(qū)別主要體現(xiàn)在三個(gè)方面。(1) 注釋類型:與大多數(shù)僅包含類標(biāo)簽或邊界框的現(xiàn)有數(shù)據(jù)集不同,PlantSeg 中的每張圖像都包含詳細(xì)、高質(zhì)量的分割掩碼,并與植物類型和疾病名稱相關(guān)聯(lián)。(2) 圖像來源:與包含實(shí)驗(yàn)室環(huán)境圖像的典型數(shù)據(jù)集不同,PlantSeg 主要包含野外植物病害圖像。這種選擇增強(qiáng)了實(shí)際應(yīng)用性,因?yàn)橛?xùn)練有素的模型可用于綜合病害管理。(3) 規(guī)模:PlantSeg 范圍廣泛,包含 11,400 幅帶有病害分割掩膜的圖像和另外 8,000 幅按植物類型分類的健康植物圖像。大量的技術(shù)實(shí)驗(yàn)驗(yàn)證了 PlantSeg 注釋的高質(zhì)量。該數(shù)據(jù)集不僅能讓研究人員評(píng)估其圖像分類方法,還為開發(fā)先進(jìn)的植物病害分割算法并為其設(shè)定基準(zhǔn)奠定了重要基礎(chǔ)。
圖1 PlantVillage 和我們的數(shù)據(jù)集的圖像示例。由于是在實(shí)驗(yàn)室環(huán)境中收集的,PlantVillage 中的每張圖片只包含一片葉子,并且背景統(tǒng)一,而我們數(shù)據(jù)集中的圖片則具有更復(fù)雜的背景、不同的視角和不同的光照條件。
表1 植物病害圖像數(shù)據(jù)集摘要。現(xiàn)有數(shù)據(jù)集
圖2 獲取的源圖像的位置。圖的大小表示獲取圖像的數(shù)量。每個(gè)圓圈的大小表示從該地址獲取的圖像數(shù)量,顏色深度表示附近區(qū)域內(nèi)的地址密度。
圖3 在受疾病影響的區(qū)域標(biāo)注多邊形的圖像示例。
表2 PlantSeg 的元數(shù)據(jù)。
圖4 PlantSeg 數(shù)據(jù)集的整理過程包括三個(gè)主要步驟:圖像采集、數(shù)據(jù)清理和注釋。在圖像采集階段,使用已識(shí)別的關(guān)鍵字從各種互聯(lián)網(wǎng)資源中收集圖像,然后根據(jù)其類別進(jìn)行存儲(chǔ)。在數(shù)據(jù)清理階段,要識(shí)別并刪除不正確的圖像。在分割注釋過程中,注釋者利用 LabelMe26 對(duì)清理后的圖像進(jìn)行注釋。這些注釋隨后由專家進(jìn)行審核,并保存在 JSON 文件中。
圖5 PlantSeg 中的疾病分布根據(jù)植物和社會(huì)經(jīng)濟(jì)分類。條形的高度代表與每種植物相關(guān)的疾病數(shù)量。
圖6 不同數(shù)據(jù)集(包括 PlantVillage、PlantDoc 和 PlantSeg)的分辨率分布。每個(gè)綠點(diǎn)代表 PlantSeg 數(shù)據(jù)庫中的一幅圖像;紅色代表 PlantDoc 數(shù)據(jù)庫中的每幅圖像;倒置的黃色三角形代表 PlantVillage 數(shù)據(jù)庫。
圖7 橫軸表示掩模區(qū)域相對(duì)于整個(gè)圖像的百分比,縱軸表示對(duì)應(yīng)圖像的數(shù)量。
圖8 箱線圖顯示了每幅圖像掩模區(qū)域的百分比分布,不同植物之間的差異很大。
表3 PlantSeg 上不同方法的性能比較。
圖9 PlantSeg 測(cè)試集上的一些實(shí)驗(yàn)結(jié)果可視化。從左到右:PlantSeg 的圖像示例、DeepLabv3的結(jié)果、SegNext的結(jié)果以及地面實(shí)況注釋。
Wei, T., Chen, Z., Yu, X., Chapman, S., Melloy, P., & Huang, Z. (2024). PlantSeg: A Large-Scale In-the-wild Dataset for Plant Disease Segmentation. arXiv.
編輯
小安
推薦新聞
石時(shí)之約|韓志國:透過表型數(shù)據(jù),看見植物的喜怒哀樂!
高通量植物表型平臺(tái)建設(shè)注意事項(xiàng)
視頻展示