からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

CVPR2020メモ

CVPR2020

 みつけたものをメモ

CVPR2020まとめ

CVPR 2020 報告

xpaper.challenge(Hirokatsu KATAOKA)

cvpaper. challenge’s Presentations on SlideShare

CVPR2020 Report - Speaker Deck

CVPR2020サーベイまとめ(一覧)

CVPR2020話題

【ボタ山話#13】CVPR2020 Best Paperの解説 | 白金鉱業.FM

動画関係

ComputerVisionFoundation Videos - YouTube
まとめ

CVPR2020 Keynote Speach
Keynoteスピーチ

CVPR2020読み会

2020/07/04全日本コンピュータビジョン勉強会「CVPR2020読み会」(前編)発表資料まとめ - takminの書きっぱなし備忘録 @はてなブログ

2020/07/18 全日本コンピュータビジョン勉強会「CVPR2020読み会」(後編)発表資料まとめ - takminの書きっぱなし備忘録 @はてなブログ

JapanCV(7/4) YouTube

JapanCV(7/18) YouTube

自分が読んだ論文・スライドなどメモ

200704 revisiting knowledge distillation via label smoothing regulari…
モデルの軽量化(蒸留)に関して

CVPR2020読み会 Proxy Anchor Loss for Deep Metric Learning - Speaker Deck
深層距離学習に関して

全日本コンピュータビジョン勉強会:Disentangling and Unifying Graph Convolutions for Sk…

2020/07/04 BSP-Net (CVPR2020)

関連記事

技育祭(Geek SAI)まとめ

技育祭とは

内容のアーカイブ

400人以上のインターン生を受け入れ成長させてきたCTOが考える若手エンジニアが成長するコツ / Three Tips for Young Engineers to Grow and Examples of VOYAGE GROUP Practice - Speaker Deck

国内最大級の学生エンジニア向けカンファレンス #技育祭 で登壇しました – Madoka Chomado

400人以上のインターン生を受け入れ成長させてきたCTOが考える若手エンジニアが成長するコツ / Three Tips for Young Engineers to Grow and Examples of VOYAGE GROUP Practice - Speaker Deck

変化し、進化し続ける技術者になるために 〜メルカリ新卒エンジニアの場合〜 - Speaker Deck

色々なSegmentation

 物体検出といえば、Object Detection、Semantic Segmentation, Instance Segmentationだと思っていたのですが、更にPanoptic Segmentationなるものもあるらしいです。

f:id:karaage:20200713214124j:plain

引用元:コンピュータビジョンの最新論文調査 Segmentation 編 · DeNA Engineers' Blog

 Semantic Segmentation と Instance Segmentationの合いの子みたいなやつみたいです。奥深い…

 まだまだ、どんどん新しいSegmentation出てきそうですね。

ノイズか?シグナルか?それが問題だ

論文へのリンク

[2006.09994] Noise or Signal: The Role of Image Backgrounds in Object Recognition

筆者・所属機関

Kai Xiao, Logan Engstrom, Andrew Ilyas, Aleksander Madry

全員 MIT

投稿日付

2020/06/17

概要(一言まとめ)

 物体認識のとき、ニューラルネットワークモデルがノイズ(背景)とシグナルをどう見分けているかを調査した内容。

手法の概要

 色々な手法を用いて、実験的に調べているらしい(後で追記)

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

  • disentangling もつれをほどく

Tramsformerを取り入れた素早く手軽な物体検出「DETR」

論文へのリンク

End-to-End Object Detection with Transformers

筆者・所属機関

Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko

全員 Facebook

投稿日付

2020/05/27

概要(一言まとめ)

 BERTなどの自然言語処理で目覚ましい成果を上げつつあるモデルのベースとなるTransformerを、物体検出に適応した研究。構造は以下となる。

f:id:karaage:20200610171243p:plain

 COCOデータセットでFaster R-CNNの精度を上回ったとのこと。

手法の概要

 transformerを取り入れる他、以下2つの技術が特徴的

  • Bipartite Matching Loss
  • Parallel Decoding

コメント

 精度的には、Faster R-CNN程度ということは、まだまだなのかなという印象だが、Transformerを物体検出に適応して結果を出しているのは凄い。論文の検出も、チャンピオンデータかもしれないけど、かなり使えそうな印象。

 Google Colabで手軽に推論を試せるのも好印象。

 Transformerは、あんまり理解できてなくて、そこまで重要な技術でもないのではないかと思っていたけど、ちょっと認識を改めた方が良いかもしれない。

関連情報

demo_detr.ipynb

How to use Facebook's DETR object detection algorithm in Python(YouTube)

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

  • bipartite 相互の

植物の病気判定のデータセット

論文へのリンク

[1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection

筆者・所属機関

Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra

Indian Institute of Technology Gandhinagar, Gujarat, India 382 355

投稿日付

2019/11/23

概要(一言まとめ)

13種類の植物の合計2,598のデータを17クラスの病気に分類したデータセットを作成。アノテーションには300時間程度かけているとのこと。

手法の概要

 既に植物のデータセットとしてPlantVillage dataset(PVD)があるが、以下の図のように、実際のフィールドでの写真とは乖離のあるデータとなっているのに対して、実際のフィールドに近いデータセットをつくったとのこと。

f:id:karaage:20200526111250p:plain

 また、データセットに対して複数のモデルで画像判別と物体検出のタスクを評価している。

コメント

インドは35%の作物を病気で失っているという書き出しが結構衝撃的だった。

性能は、物体判別のACCで70%、物体検出のmAP(at 50% IoU)で38%と高くはない。2,598のデータを17クラスだと、1クラスあたりのデータは200ないくらいなので、全然データが足りないのではないかなという印象だが、EfficientNet使ってDataAugmentation駆使すればもう少しはあげれそうな気はする。

関連情報

GitHub - pratikkayal/PlantDoc-Object-Detection-Dataset

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現