からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

高速のトラッキングとセグメンテーションの技術「SiamMask」

論文へのリンク

https://arxiv.org/pdf/1812.05050.pdf

筆者・所属機関

Qiang Wang(CASIA), Li Zhang(University of Oxford), Luca Bertinetto(FiveAI)

投稿日付

2018/12/12

概要(一言まとめ)

バウンディングボックスを回転させるというアイディアで、高速なトラッキングとセグメンテーションを実現

手法の概要

セグメンテーションされたマスク画像から、Min-max、MBR、Optという3つの方法でバウンディングボックスを生成

コメント

トラッキングがあんまり分かってないので、SiamMaskの肝を理解できていない気がする

関連情報

Fast Online Object Tracking and Segmentation: A Unifying Approach

次に読む論文

トラッキング関係の何か

自分なりのアウトプット

気になった英単語・英語表現

  • dubbed ダビング済み
  • Siamese 双生児の
  • versatility 汎用性

YOLO v3より速い?現時点で最速の物体検出技術「CenterNet」

論文へのリンク

[1904.07850] Objects as Points

筆者・所属機関

Xingyi Zhou(UT Austin), Dequan Wang(UC Berkeley), Philipp Kra ̈henbu ̈hl(UT Austin)

投稿日付

2019/04/25

概要(一言まとめ)

 以下のツイートが分かりやすいので引用(手抜き)

手法の概要

 略

コメント

 シンプルなアイディアなのに、効果は絶大。常識を疑うのは大事だなと思わされる。試してみたい

関連情報

GitHub - xingyizhou/CenterNet: Object detection, 3D detection, and pose estimation using center point detection:
GitHubリポジトリ

次に読む論文

[1812.05050] Fast Online Object Tracking and Segmentation: A Unifying Approach
こっちは、セマンティックセグメンテーションの高速度版

自分なりのアウトプット

 試して実際の速度体感したい

気になった英単語・英語表現

Google Waymoの自動運転技術の論文

論文へのリンク

[1812.03079] ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst

筆者・所属機関

Mayank Bansal(Waymo), Alex Krizhevsky(Google Brain & Waymo), Abhijit Ogale(Waymo)

投稿日付

2018/12/7

概要(一言まとめ)

手法の概要

コメント

 日経Roboticsに記事があった。これから読む

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

ディープラーニングを使った超解像技術の論文

論文へのリンク

Deep learning based super resolution, without using a GAN

筆者・所属機関

Christopher Thomas BSc Hons. MIAP

投稿日付

2019/2/24

概要(一言まとめ)

GANを使わない超解像

手法の概要

fast.aiを使った超解像の実践記事

コメント

fast.aiもGANを使わない超解像も興味あるので、時間を見つけてやってみる。

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

Definitely living up to the Arthur C Clarke quote “any advanced technology is indistinguishable from magic”.

アーサー・C・クラークの三法則「十分に発達した科学技術は、魔法と見分けがつかない」の原文。

Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

論文へのリンク

[1811.06152] Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

筆者・所属機関

Vincent Casser(Google Brain), Soeren Pirk(Google Brain), Reza Mahjourian(Google Brain), Anelia Angelova(Google Brain)

投稿日付

2018/11/15

概要(一言まとめ)

単眼動画からの教師無し学習による3次元推定(Depth Prediction)

手法の概要

SfMとディープラーニングの組み合わせ?インスタンスセグメンテーションでマッチングをとっているっぽい。

コメント

流し読みしかしてない。ちゃんと読む予定。

関連情報

次に読む論文

[1704.07804] SfM-Net: Learning of Structure and Motion from Video

自分なりのアウトプット

気になった英単語・英語表現

Riemannian Motion Policies

論文へのリンク

[1801.02854] Riemannian Motion Policies

筆者・所属機関

Nathan D. Ratliff(NVIDIA), Jan Issac(NVIDIA), Daniel Kappler(Max Planck for Intelligent Systems), Stan Birchfield(NVIDIA), Dieter Fox(NVIDIA)

投稿日付

2018/1/9

概要(一言まとめ)

手法の概要

コメント

関連情報

自分用読むべき論文メモ 2019年2月版 - cvl-robot's diary

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現