からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

ディープラーニングによる物体検出のサーベイ論文

論文へのリンク

[1809.02165] Deep Learning for Generic Object Detection: A Survey

筆者・所属機関

Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen

投稿日付

2018/09/06

概要(一言まとめ)

 物体検出のサーベイ論文。ディープラーニングのものが中心。

 ディープラーニングで劇的に性能が上がったよという話(単純な物体判別と同様)

f:id:karaage:20180921223716p:plain:w640

 様々なアルゴリズムの概要を歴史を追って説明している。

手法の概要

 一口に物体検出といっても、色々カテゴリがある。具体的には

  • Object Classification
  • Object Detection
  • Semantic Segmentation
  • Instance Segmentation

 それぞれの違いは、以下の図がわかりやすい。

f:id:karaage:20180921223752p:plain:w640

 これらの違いは、以下の記事が詳しい。

深層学習による画像処理の概要からChainerCVとFCISで『物体検出ソフト』を作るまで|はやぶさの技術ノート

 あと、ステージとしてTwo StageのものとOne Stageのものがある。これらに関しては、以下記事が詳しい

ChainerCVとLight-Head R-CNNで『カメラ・動画対応!物体検出ソフト』を作る|はやぶさの技術ノート

 End-to-End(最初から最後までディープラーニングか)かそうでないかもある。Faster RNNが初めてのEnd-to-Endという認識だったけど、この論文ではFast RNNだと書いてある(領域サーチを除くという但し書きがあるので、Faster RNNが初でも間違いではないと思う)。

 ここらへんは、自分がまとめたけど、ちょっと勘違いしているような気がしてきた。

コメント

関連情報

次に読む論文

 Semantic SegmentationかInstance Segmentation関係で何か。

自分なりのアウトプット

 以下でObject Detectionまでは試している。

 Semantic SegmentationやInstance Segmentationも試してみたい

気になった英単語・英語表現

ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解

論文へのリンク

[1806.08756] Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation

筆者・所属機関

Peter R. Florence(MIT), Lucas Manuelli(MIT), Russ Tedrake(MIT)

投稿日付

2018/06/22

概要(一言まとめ)

手法の概要

コメント

関連情報

未来のロボットアームは、人工知能でモノを視覚的に判断できる、はず。 | ギズモード・ジャパン

GitHub - RobotLocomotion/pytorch-dense-correspondence: Code for "Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation"

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

descriptor 記述子、デスクリプタ

LUCSS: Language-based User-customized Colourization of Scene Sketches

論文へのリンク

[1808.10544] LUCSS: Language-based User-customized Colourization of Scene Sketches

筆者・所属機関

Changqing Zou, Haoran Mo, Ruofei Du, Xing Wu, Chengying Gao, Hongbo Fu

投稿日付

2018/08/30

概要(一言まとめ)

手法の概要

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

PythonRobotics: a Python code collection of robotics algorithms

論文へのリンク

[1808.10703] PythonRobotics: a Python code collection of robotics algorithms

筆者・所属機関

Atsushi Sakai(University of California, Berkeley), Daniel Ingram, Joseph Dinius, Karan Chawla, Antonin Raffin, Alexis Paques

投稿日付

2018/08/31

概要(一言まとめ)

ロボティクスで使われる様々なアルゴリズムをPythonで実装したOSS(Open Source Software)のプロジェクトの紹介。Python3と最小限のライブラリで動かすことができる

手法の概要

コメント

関連情報

 下記ブログの方の論文

MyEnigma

 論文で紹介しているOSS(PythonRobotics)のGitHubリポジトリ

GitHub - AtsushiSakai/PythonRobotics: Python sample codes for robotics algorithms.

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

End-to-end Recovery of Human Shape and Pose

論文へのリンク

[1712.06584] End-to-end Recovery of Human Shape and Pose

筆者・所属機関

Angjoo Kanazawa(University of California, Berkeley), Michael J. Black, David W. Jacobs, Jitendra Malik

投稿日付

概要(一言まとめ)

手法の概要

コメント

関連情報

Human Mesh Recovery

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

AVID:Adversarial Visual Irregularity Detection

論文へのリンク

[1805.09521] AVID: Adversarial Visual Irregularity Detection

筆者・所属機関

Mohammad Sabokrou(IPM), Masoud Pourreza, Mohsen Fayyaz, Rahim Entezari, Mahmood Fathy, Jürgen Gall, Ehsan Adeli(Stanford University)

投稿日付

2018/07/17

概要(一言まとめ)

 GANを使った異常検知

[DL輪読会]AVID:Adversarial Visual Irregularity Detection

手法の概要

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

機械学習技術とその数理基盤に関する良さそうな資料

 Taiji Suzuki's Homepage (鈴木大慈)2018年度講義情報ページのページに、機械学習に関する良さげな資料があったので、メモ

機械学習技術とその数理基盤

機械学習技術の進展とその数理基盤

深層学習の生成モデル

 以下は資料からのリンク

Statistical Semantic入門 ~分布仮説からword2vecまで~