植物の病気判定のデータセット

論文へのリンク

[1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection

筆者・所属機関

Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra

Indian Institute of Technology Gandhinagar, Gujarat, India 382 355

投稿日付

2019/11/23

概要（一言まとめ）

13種類の植物の合計2,598のデータを17クラスの病気に分類したデータセットを作成。アノテーションには300時間程度かけているとのこと。

手法の概要

　既に植物のデータセットとしてPlantVillage dataset(PVD)があるが、以下の図のように、実際のフィールドでの写真とは乖離のあるデータとなっているのに対して、実際のフィールドに近いデータセットをつくったとのこと。

f:id:karaage:20200526111250p:plain

　また、データセットに対して複数のモデルで画像判別と物体検出のタスクを評価している。

インドは35%の作物を病気で失っているという書き出しが結構衝撃的だった。

性能は、物体判別のACCで70%、物体検出のmAP(at 50% IoU)で38%と高くはない。2,598のデータを17クラスだと、1クラスあたりのデータは200ないくらいなので、全然データが足りないのではないかなという印象だが、EfficientNet使ってDataAugmentation駆使すればもう少しはあげれそうな気はする。