からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

SSD: Single Shot MultiBox Detector(物体検出)

論文へのリンク

[1512.02325] SSD: Single Shot MultiBox Detector

筆者・所属機関

投稿日付

2015/12/8

概要(一言まとめ)

 物体検出をディープラーニングでEnd-to-Endでできるアルゴリズム

新規性(何が過去の研究に比べて凄い?)

 従来の物体検出は、Selective Searchとの組み合わせなどで実現していたが、ディープラーニングでEnd-to-Endで学習できる。速度も精度も高い(Yoloと2トップ)。比較的低い解像度(300x300)でも性能を発揮出来る。

手法の概要

 VGG-16の畳み込み層の後に、特別な畳み込み層(Extra Feature Layers)を追加している。この追加した層で、様々なスケールでの特徴量を抽出して検出が可能らしい(Multi-scale feature maps for detection)。

 なんでそんなこと出来るのかは、全然分からなかったけど、以下のスライド見てちょっとだけ分かった気がしてきた。

コメント

関連情報

次に読む論文

自分なりのアウトプット

 物体検出の概要をまとめて、実際に動かしてみる。

 自前データでの学習もやってみたい。

気になった英単語・英語表現

  • discretize 離散化・範囲ごとに分ける
  • subsequent 後に続く
  • encapsulate カプセルに包む、要約する
  • truncated 先端を切ったような形の

We add convolutional feature layers to the end of the truncated base network 先端を断ち切ったような形のベースのネットワークに畳み込み層を追加