からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

天職が見つからない人がいるのはどうしてでしょう？

毎日TED

Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

論文

論文へのリンク

[1810.09381] Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

筆者・所属機関

Eldar Insafutdinov(Intel), Alexey Dosovitskiy(Intel)

投稿日付

2018/10/22

概要（一言まとめ）

2次元画像から3次元モデルを生成

手法の概要

Differentiable Point Cloudsという概念がキーっぽい。後で読む

コメント

関連情報

Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

ロボットのピッキング関係の論文メモ

論文

論文

[1711.00199] PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes

[1804.00175] DeepIM: Deep Iterative Matching for 6D Pose Estimation

[1703.01564] Perceiving and Reasoning About Liquids Using Fully Convolutional Networks
　液体を検出

参考

Piano Genie

論文

論文へのリンク

[1810.05246] Piano Genie

筆者・所属機関

投稿日付

2018/10/11

概要（一言まとめ）

少数の簡単なボタンを押すだけで、誰でもピアノを演奏できるようになるディープラーニングのモデルを開発

手法の概要

コメント

関連情報

AI-Powered Piano Allows Anyone to Compose Music by Pressing a Few Buttons - NVIDIA Developer News CenterNVIDIA Developer News Center

たった8つのボタンで88鍵のピアノをハイレベルに演奏可能なAI「Piano Genie」 - GIGAZINE

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

CVPR18速報その他

顔認識のスライドを追加しました。
--
CVPR18速報++ https://t.co/WGVNwpqwUy
ボケAI https://t.co/9rgYEGmH1I
GANs https://t.co/gYICKYa5VH
VQA https://t.co/cLIzNQGMjs
特徴表現学習 https://t.co/QvLR7WCK0d
動画説明文 https://t.co/BZwYnFFSKg
顔 https://t.co/pCrpvIg47n #cvpaperchallenge https://t.co/4WFpQipsu6
— cvpaper.challenge (@CVpaperChalleng) 2018年9月30日

CVPR18速報

f:id:karaage:20180930184038p:plain CVPR18速報より引用

物体検出問題，未だに根強くFaster R-CNNも残る

YOLO/SSDなど早い手法が提案されているにも関わらず，アンド Mask R-CNNのようにインスタンスセグメンテーションができる手法ができても，である
これは，(1)候補領域抽出(2)物体識別という2-stageの構造から?

論文サマリをCPUが作成，人間と強調

Paper Summary Generation(ICMV18)
PDF入力，論文サマリ出力

新しい評価方法を提案

Neural Joking Machine (CVPR18WS)
大喜利サイト”ボケて”に投稿，訓練されたユーザ評価

ボケAI

ディープラーニングによる物体検出のサーベイ論文その1

論文

論文へのリンク

[1809.02165] Deep Learning for Generic Object Detection: A Survey

筆者・所属機関

Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen

投稿日付

2018/09/06

概要（一言まとめ）

　物体検出のサーベイ論文。ディープラーニングのものが中心。

　ディープラーニングで劇的に性能が上がったよという話（単純な物体判別と同様）

f:id:karaage:20180921223716p:plain:w640

　様々なアルゴリズムの概要を歴史を追って説明している。

手法の概要

　一口に物体検出といっても、色々カテゴリがある。具体的には

Object Classification
Object Detection
Semantic Segmentation
Instance Segmentation

　それぞれの違いは、以下の図がわかりやすい。

f:id:karaage:20180921223752p:plain:w640

　これらの違いは、以下の記事が詳しい。

深層学習による画像処理の概要からChainerCVとFCISで『物体検出ソフト』を作るまで｜はやぶさの技術ノート

　あと、ステージとしてTwo StageのものとOne Stageのものがある。これらに関しては、以下記事が詳しい

ChainerCVとLight-Head R-CNNで『カメラ・動画対応！物体検出ソフト』を作る｜はやぶさの技術ノート

　End-to-End（最初から最後までディープラーニングか）かそうでないかもある。Faster RNNが初めてのEnd-to-Endという認識だったけど、この論文ではFast RNNだと書いてある（領域サーチを除くという但し書きがあるので、Faster RNNが初でも間違いではないと思う）。

　ここらへんは、自分がまとめたけど、ちょっと勘違いしているような気がしてきた。

コメント

関連情報

　以下もサーベイ論文。

　以下に日本語訳のリンクあり

次に読む論文

　Semantic SegmentationかInstance Segmentation関係で何か。

自分なりのアウトプット

　以下でObject Detectionまでは試している。

　Semantic SegmentationやInstance Segmentationも試してみたい

気になった英単語・英語表現

ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解

論文

論文へのリンク

[1806.08756] Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation

筆者・所属機関

Peter R. Florence(MIT), Lucas Manuelli(MIT), Russ Tedrake(MIT)

投稿日付

2018/06/22

概要（一言まとめ）

手法の概要

コメント

関連情報

未来のロボットアームは、人工知能でモノを視覚的に判断できる、はず。 | ギズモード・ジャパン

GitHub - RobotLocomotion/pytorch-dense-correspondence: Code for "Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation"

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

descriptor 記述子、デスクリプタ