からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

ディープラーニングによる物体検出のサーベイ論文 その2

論文へのリンク

[1908.03673] Recent Advances in Deep Learning for Object Detection

筆者・所属機関

Xiongwei Wua(School of Information System, Singapore Management University),Doyen Sahooa, Steven C.H. Hoi(School of Information System, Singapore Management University / Salesforce Research Asia)

投稿日付

2019/08/10

概要(一言まとめ)

ディープラーニングによる物体検出手法を比較・調査しているサーベイ論文。

手法の概要

サーベイ論文。以下の内容がまとまっており、物体検出の理解を深めるのによい論文

  • ディープラーニング以前の手法(探索・特徴量抽出・分類の3ステップ)の解説
  • ディープラーニングの発展に関しての概略
  • ディープラーニングによる物体検出の2ステージの手法と1ステージの手法の概要
  • 物体検出の評価方法
  • 物体検出のアルゴリズムの紹介・性能比較
  • 物体検出応用例

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

  • spur 拍車をかける
  • hierarchical 階層的
  • spatial-invariant 空間不変量
  • neocognitron 福島邦彦によって提唱されたネットワーク(ディープラーニングの元祖)

オートエンコーダを使った異常検知の性能向上

論文へのリンク

[1807.02011] Improving Unsupervised Defect Segmentation by Applying Structural Similarity to Autoencoders

筆者・所属機関

Paul Bergmann(MVTec Software GmbH), Sindy Lo ̈we(MVTec Software GmbH / University of Amsterdam) , Michael Fauser1, David Sattlegger(MVTec Software GmbH), and Carsten Steger(MVTec Software GmbH)

投稿日付

2018/07/05

概要(一言まとめ)

オートエンコーダで異常検知。精度良好、可視化もできる。

手法の概要

従来の方式(多分、オートエンコーダを使って得た画像と元画像をピクセルレベルで差分比較して異常検知)に対して、輝度、コントラスト、構造情報を上手く用いることで、精度を向上させている。

詳しくは後で読み込む。

コメント

関連情報

【まとめ】ディープラーニングを使った異常検知 - Qiita

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

ディープラーニングでブドウの物体検出

論文へのリンク

[1907.11819] Grape detection, segmentation and tracking using deep neural networks and three-dimensional association

筆者・所属機関

Thiago T. Santos(Embrapa Agricultural Informatics), Leonardo L. de Souza(University of Campinas), Andreza A. dos Santos(University of Campinas), Sandra Avila(University of Campinas)

投稿日付

2019/07/26

概要(一言まとめ)

実農場で、ディープラーニングを使ってブドウの物体検知、セグメンテーション、数え上げを行う。

手法の概要

インスタンスセグメンテーションで、ブドウを検出している。様々な手法を比較している

インスタンスセグメンテーションに必要なアノテーション済みのブドウのデータセットも公開しているようす。

コメント

データセットを公開して、商用用途は応相談のライセンスというのは面白いけど、こっそり使われたりしそうな気も。

モデルの性能比較、Mask R-CNN > YOLOv2 > YOLOv3 となっているのが面白かった。考察は、深いネットワークになっていくと過学習している可能性があるから、性能出すにはデータをもっと増やさないといけないかもしれないとのこと。

関連情報

GitHub - thsant/wgisd: Embrapa Wine Grape Instance Segmentation Dataset - Embrapa WGISD
インスタンスセグメンテーションのための、ブドウのデータセット。研究用途なら好きに使える様子。商用は要相談らしい

f:id:karaage:20190803001626p:plain:w640

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

  • orchard 名詞 果樹園

今最も軽くて早いニューラルネット「MobileNetV3」

論文へのリンク

[1905.02244] Searching for MobileNetV3

筆者・所属機関

Andrew Howard, Mark Sandler, Grace Chu, Liang-Chieh Chen, Bo Chen, Mingxing Tan, Weijun Wang, Yukun Zhu, Ruoming Pang, Vijay Vasudevan, Quoc V. Le, Hartwig Adam

全員所属はGoogle AI or Google Brain

投稿日付

2019/05/06

概要(一言まとめ)

もはや説明不要な、モバイル向けの軽量ニューラルネットMobileNetV3の論文

手法の概要

色々工夫をして、精度を向上している模様。V2との違いの詳細や、何で良くなるのかは正直良くわかっていない。

コメント

V2に比べて良くなっているという話を聞くので試してみたい。まだObject Detection APIにconfigも学習済みモデルも無い。まだ来ないのかな。

関連情報

【精度対決】MobileNet V3 vs V2 - Qiita

Searching for MobileNetV3 (2019) - deconvo's blog

GitHub - kuan-wang/pytorch-mobilenet-v3: MobileNetV3 in pytorch and ImageNet pretrained models

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

GAN関係のリンクまとめ

GAN関係リンク

 GAN関係の参考になりそうな情報源のまとめ

GANはじめに

はじめてのGAN

MIRU MIRU わかる GAN
スライド

GAN Lab: Play with Generative Adversarial Networks in Your Browser!
可視化

深層学習の生成モデル
パワポの資料

GANsの最新動向: 応用領域でのGANs (CVPR 2018 完全読破チャレンジ報告会)
2018年での動向

eriklindernoren/Keras-GAN | Porter.io

敵対的生成ネットワーク(GAN)

GANの論文

Generative Adversarial Nets
最初の論文

GANの実践例

Deep Convolutional GANs(DCGAN)をkerasで実装して、いらすとや画像を生成する - 緑茶思考ブログ

DCGANで画像の自動生成 - Qiita

akmtn記録
GAN関係の記事多数

[失敗談]GANで戦車画像の生成 - Qiita
失敗例(戦車)

関連記事