2018-09-19

ディープラーニングによる物体検出のサーベイ論文その1

論文

論文へのリンク

[1809.02165] Deep Learning for Generic Object Detection: A Survey

筆者・所属機関

Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen

投稿日付

2018/09/06

概要（一言まとめ）

　物体検出のサーベイ論文。ディープラーニングのものが中心。

　ディープラーニングで劇的に性能が上がったよという話（単純な物体判別と同様）

f:id:karaage:20180921223716p:plain:w640

　様々なアルゴリズムの概要を歴史を追って説明している。

手法の概要

　一口に物体検出といっても、色々カテゴリがある。具体的には

Object Classification
Object Detection
Semantic Segmentation
Instance Segmentation

　それぞれの違いは、以下の図がわかりやすい。

f:id:karaage:20180921223752p:plain:w640

　これらの違いは、以下の記事が詳しい。

深層学習による画像処理の概要からChainerCVとFCISで『物体検出ソフト』を作るまで｜はやぶさの技術ノート

　あと、ステージとしてTwo StageのものとOne Stageのものがある。これらに関しては、以下記事が詳しい

ChainerCVとLight-Head R-CNNで『カメラ・動画対応！物体検出ソフト』を作る｜はやぶさの技術ノート

　End-to-End（最初から最後までディープラーニングか）かそうでないかもある。Faster RNNが初めてのEnd-to-Endという認識だったけど、この論文ではFast RNNだと書いてある（領域サーチを除くという但し書きがあるので、Faster RNNが初でも間違いではないと思う）。

　ここらへんは、自分がまとめたけど、ちょっと勘違いしているような気がしてきた。

次に読む論文

　Semantic SegmentationかInstance Segmentation関係で何か。

自分なりのアウトプット

　以下でObject Detectionまでは試している。

　Semantic SegmentationやInstance Segmentationも試してみたい

気になった英単語・英語表現

2018-09-18

ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解

論文

論文へのリンク

[1806.08756] Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation

筆者・所属機関

Peter R. Florence(MIT), Lucas Manuelli(MIT), Russ Tedrake(MIT)

投稿日付

2018/06/22

概要（一言まとめ）

手法の概要

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

descriptor 記述子、デスクリプタ

2018-09-06

LUCSS: Language-based User-customized Colourization of Scene Sketches

論文

論文へのリンク

[1808.10544] LUCSS: Language-based User-customized Colourization of Scene Sketches

筆者・所属機関

Changqing Zou, Haoran Mo, Ruofei Du, Xing Wu, Chengying Gao, Hongbo Fu

投稿日付

2018/08/30

概要（一言まとめ）

自然言語でイラストの色塗りを行う研究。「オレンジの車～」「水色の空～」と入力すると、イラスト中の該当箇所の色が変わる。イラストに対するインスタンスセグメンテーション＋Image Caption＋GANを組み合わせている。 https://t.co/GYJNGfAapN
— piqcy (@icoxfog417) 2018年9月5日