Googleのエンジニアの動画
機械学習の7つのステップは以下
- データ収集(Gathering Data)
- データの前処理(Preparing that Data)
- モデル選定(Choosing a Model)
- 学習(Training)
- 評価(Evaluation)
- ハイパーパラメータの調整(Hyperparameter Tuning)
- 推論(Prediction)
Googleのエンジニアの動画
機械学習の7つのステップは以下
https://arxiv.org/pdf/1812.05050.pdf
Qiang Wang(CASIA), Li Zhang(University of Oxford), Luca Bertinetto(FiveAI)
2018/12/12
バウンディングボックスを回転させるというアイディアで、高速なトラッキングとセグメンテーションを実現
セグメンテーションされたマスク画像から、Min-max、MBR、Optという3つの方法でバウンディングボックスを生成
トラッキングがあんまり分かってないので、SiamMaskの肝を理解できていない気がする
Fast Online Object Tracking and Segmentation: A Unifying Approach
トラッキング関係の何か
[1904.07850] Objects as Points
Xingyi Zhou(UT Austin), Dequan Wang(UC Berkeley), Philipp Kra ̈henbu ̈hl(UT Austin)
2019/04/25
以下のツイートが分かりやすいので引用(手抜き)
物体検出で領域(矩形)を予測するのは無駄が多いため、中心点のみ予測を行い領域の大きさや角度などはその属性として推定しようという研究。入力画像をストライド幅でダウンサンプルし、ガウシアンカーネルを用いてヒートマップを作製。それを推定するという形をとっている。 https://t.co/wndBTFq1aK
— piqcy (@icoxfog417) 2019年5月19日
略
シンプルなアイディアなのに、効果は絶大。常識を疑うのは大事だなと思わされる。試してみたい
GitHub - xingyizhou/CenterNet: Object detection, 3D detection, and pose estimation using center point detection:
GitHubリポジトリ
[1812.05050] Fast Online Object Tracking and Segmentation: A Unifying Approach
こっちは、セマンティックセグメンテーションの高速度版
試して実際の速度体感したい
[1812.03079] ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst
Mayank Bansal(Waymo), Alex Krizhevsky(Google Brain & Waymo), Abhijit Ogale(Waymo)
2018/12/7
日経Roboticsに記事があった。これから読む
Deep learning based super resolution, without using a GAN
Christopher Thomas BSc Hons. MIAP
2019/2/24
GANを使わない超解像
fast.aiを使った超解像の実践記事
fast.aiもGANを使わない超解像も興味あるので、時間を見つけてやってみる。
GANを使わない超解像についての記事https://t.co/PpUMAFPYKz
— えるエル (@learn_learning3) 2019年2月24日
流行りのfastaiのライブラリを用いている
例としてあげられている解像前後の画像が置いてある著者のdriveへのリンクがあったり,使用するモデルやデータもかなり詳細に書かれている
(ただし,かなり長い)
Definitely living up to the Arthur C Clarke quote “any advanced technology is indistinguishable from magic”.
アーサー・C・クラークの三法則「十分に発達した科学技術は、魔法と見分けがつかない」の原文。
[1811.06152] Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos
Vincent Casser(Google Brain), Soeren Pirk(Google Brain), Reza Mahjourian(Google Brain), Anelia Angelova(Google Brain)
2018/11/15
単眼動画からの教師無し学習による3次元推定(Depth Prediction)
SfMとディープラーニングの組み合わせ?インスタンスセグメンテーションでマッチングをとっているっぽい。
流し読みしかしてない。ちゃんと読む予定。
[1704.07804] SfM-Net: Learning of Structure and Motion from Video
[1801.02854] Riemannian Motion Policies
Nathan D. Ratliff(NVIDIA), Jan Issac(NVIDIA), Daniel Kappler(Max Planck for Intelligent Systems), Stan Birchfield(NVIDIA), Dieter Fox(NVIDIA)
2018/1/9
自分用読むべき論文メモ 2019年2月版 - cvl-robot's diary