2020-07-17

CVPR2020メモ

技術メモ

CVPR2020

　みつけたものをメモ

技育祭（Geek SAI）まとめ

技術メモ

技育祭とは

内容のアーカイブ

400人以上のインターン生を受け入れ成長させてきたCTOが考える若手エンジニアが成長するコツ / Three Tips for Young Engineers to Grow and Examples of VOYAGE GROUP Practice - Speaker Deck

国内最大級の学生エンジニア向けカンファレンス #技育祭で登壇しました – Madoka Chomado

変化し、進化し続ける技術者になるために〜メルカリ新卒エンジニアの場合〜 - Speaker Deck

2020-07-13

色々なSegmentation

技術メモ

　物体検出といえば、Object Detection、Semantic Segmentation, Instance Segmentationだと思っていたのですが、更にPanoptic Segmentationなるものもあるらしいです。

f:id:karaage:20200713214124j:plain

　Semantic Segmentation と Instance Segmentationの合いの子みたいなやつみたいです。奥深い…

　まだまだ、どんどん新しいSegmentation出てきそうですね。

2020-06-29

ノイズか？シグナルか？それが問題だ

論文

論文へのリンク

[2006.09994] Noise or Signal: The Role of Image Backgrounds in Object Recognition

筆者・所属機関

Kai Xiao, Logan Engstrom, Andrew Ilyas, Aleksander Madry

全員 MIT

投稿日付

2020/06/17

概要（一言まとめ）

　物体認識のとき、ニューラルネットワークモデルがノイズ（背景）とシグナルをどう見分けているかを調査した内容。

手法の概要

　色々な手法を用いて、実験的に調べているらしい（後で追記）

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

disentangling もつれをほどく

2020-06-10

Tramsformerを取り入れた素早く手軽な物体検出「DETR」

論文

論文へのリンク

End-to-End Object Detection with Transformers

筆者・所属機関

Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko

全員 Facebook

投稿日付

2020/05/27

概要（一言まとめ）

　BERTなどの自然言語処理で目覚ましい成果を上げつつあるモデルのベースとなるTransformerを、物体検出に適応した研究。構造は以下となる。

f:id:karaage:20200610171243p:plain

　COCOデータセットでFaster R-CNNの精度を上回ったとのこと。

手法の概要

　transformerを取り入れる他、以下2つの技術が特徴的

Bipartite Matching Loss
Parallel Decoding

　精度的には、Faster R-CNN程度ということは、まだまだなのかなという印象だが、Transformerを物体検出に適応して結果を出しているのは凄い。論文の検出も、チャンピオンデータかもしれないけど、かなり使えそうな印象。

　Google Colabで手軽に推論を試せるのも好印象。

　Transformerは、あんまり理解できてなくて、そこまで重要な技術でもないのではないかと思っていたけど、ちょっと認識を改めた方が良いかもしれない。

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

bipartite 相互の

2020-05-26

植物の病気判定のデータセット

論文

論文へのリンク

[1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection

筆者・所属機関

Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra

Indian Institute of Technology Gandhinagar, Gujarat, India 382 355

投稿日付

2019/11/23

概要（一言まとめ）

13種類の植物の合計2,598のデータを17クラスの病気に分類したデータセットを作成。アノテーションには300時間程度かけているとのこと。

手法の概要

　既に植物のデータセットとしてPlantVillage dataset(PVD)があるが、以下の図のように、実際のフィールドでの写真とは乖離のあるデータとなっているのに対して、実際のフィールドに近いデータセットをつくったとのこと。

f:id:karaage:20200526111250p:plain

　また、データセットに対して複数のモデルで画像判別と物体検出のタスクを評価している。

インドは35%の作物を病気で失っているという書き出しが結構衝撃的だった。

性能は、物体判別のACCで70%、物体検出のmAP(at 50% IoU)で38%と高くはない。2,598のデータを17クラスだと、1クラスあたりのデータは200ないくらいなので、全然データが足りないのではないかなという印象だが、EfficientNet使ってDataAugmentation駆使すればもう少しはあげれそうな気はする。