からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

機械学習の７つのステップとは何か？

技術メモ

　Googleのエンジニアの動画

機械学習の7つのステップは以下

データ収集(Gathering Data)
データの前処理(Preparing that Data)
モデル選定(Choosing a Model)
学習(Training)
評価(Evaluation)
ハイパーパラメータの調整(Hyperparameter Tuning)
推論(Prediction)

高速のトラッキングとセグメンテーションの技術「SiamMask」

論文

論文へのリンク

https://arxiv.org/pdf/1812.05050.pdf

筆者・所属機関

Qiang Wang(CASIA), Li Zhang(University of Oxford), Luca Bertinetto(FiveAI)

投稿日付

2018/12/12

概要（一言まとめ）

バウンディングボックスを回転させるというアイディアで、高速なトラッキングとセグメンテーションを実現

手法の概要

セグメンテーションされたマスク画像から、Min-max、MBR、Optという3つの方法でバウンディングボックスを生成

コメント

トラッキングがあんまり分かってないので、SiamMaskの肝を理解できていない気がする

関連情報

Fast Online Object Tracking and Segmentation: A Unifying Approach

次に読む論文

トラッキング関係の何か

自分なりのアウトプット

気になった英単語・英語表現

dubbed ダビング済み
Siamese 双生児の
versatility 汎用性

YOLO v3より速い？現時点で最速の物体検出技術「CenterNet」

論文

論文へのリンク

[1904.07850] Objects as Points

筆者・所属機関

Xingyi Zhou(UT Austin), Dequan Wang(UC Berkeley), Philipp Kra ̈henbu ̈hl(UT Austin)

投稿日付

2019/04/25

概要（一言まとめ）

　以下のツイートが分かりやすいので引用（手抜き）

物体検出で領域(矩形)を予測するのは無駄が多いため、中心点のみ予測を行い領域の大きさや角度などはその属性として推定しようという研究。入力画像をストライド幅でダウンサンプルし、ガウシアンカーネルを用いてヒートマップを作製。それを推定するという形をとっている。 https://t.co/wndBTFq1aK
— piqcy (@icoxfog417) 2019年5月19日

手法の概要

　略

コメント

　シンプルなアイディアなのに、効果は絶大。常識を疑うのは大事だなと思わされる。試してみたい

関連情報

GitHub - xingyizhou/CenterNet: Object detection, 3D detection, and pose estimation using center point detection:
GitHubリポジトリ

次に読む論文

[1812.05050] Fast Online Object Tracking and Segmentation: A Unifying Approach
こっちは、セマンティックセグメンテーションの高速度版

自分なりのアウトプット

　試して実際の速度体感したい

気になった英単語・英語表現

Google Waymoの自動運転技術の論文

論文

論文へのリンク

[1812.03079] ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst

筆者・所属機関

Mayank Bansal(Waymo), Alex Krizhevsky(Google Brain & Waymo), Abhijit Ogale(Waymo)

投稿日付

2018/12/7

概要（一言まとめ）

手法の概要

コメント

　日経Roboticsに記事があった。これから読む

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

ディープラーニングを使った超解像技術の論文

論文

論文へのリンク

Deep learning based super resolution, without using a GAN

筆者・所属機関

Christopher Thomas BSc Hons. MIAP

投稿日付

2019/2/24

概要（一言まとめ）

GANを使わない超解像

手法の概要

fast.aiを使った超解像の実践記事

コメント

fast.aiもGANを使わない超解像も興味あるので、時間を見つけてやってみる。

関連情報

GANを使わない超解像についての記事https://t.co/PpUMAFPYKz
流行りのfastaiのライブラリを用いている
例としてあげられている解像前後の画像が置いてある著者のdriveへのリンクがあったり，使用するモデルやデータもかなり詳細に書かれている
（ただし，かなり長い）
— えるエル (@learn_learning3) 2019年2月24日

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

Definitely living up to the Arthur C Clarke quote “any advanced technology is indistinguishable from magic”.

アーサー・C・クラークの三法則「十分に発達した科学技術は、魔法と見分けがつかない」の原文。

Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

論文

論文へのリンク

[1811.06152] Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

筆者・所属機関

Vincent Casser(Google Brain), Soeren Pirk(Google Brain), Reza Mahjourian(Google Brain), Anelia Angelova(Google Brain)

投稿日付

2018/11/15

概要（一言まとめ）

単眼動画からの教師無し学習による3次元推定（Depth Prediction）

手法の概要

SfMとディープラーニングの組み合わせ？インスタンスセグメンテーションでマッチングをとっているっぽい。

コメント

流し読みしかしてない。ちゃんと読む予定。

関連情報

Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos from ShinyaSumikura

次に読む論文

[1704.07804] SfM-Net: Learning of Structure and Motion from Video

自分なりのアウトプット

気になった英単語・英語表現

Riemannian Motion Policies

論文

論文へのリンク

[1801.02854] Riemannian Motion Policies

筆者・所属機関

Nathan D. Ratliff(NVIDIA), Jan Issac(NVIDIA), Daniel Kappler(Max Planck for Intelligent Systems), Stan Birchfield(NVIDIA), Dieter Fox(NVIDIA)

投稿日付

2018/1/9

概要（一言まとめ）

手法の概要

コメント

関連情報

自分用読むべき論文メモ 2019年2月版 - cvl-robot's diary

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現