からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

論文へのリンク

[1810.09381] Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

筆者・所属機関

Eldar Insafutdinov(Intel), Alexey Dosovitskiy(Intel)

投稿日付

2018/10/22

概要(一言まとめ)

2次元画像から3次元モデルを生成

手法の概要

Differentiable Point Cloudsという概念がキーっぽい。後で読む

コメント

関連情報

Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

Piano Genie

論文へのリンク

[1810.05246] Piano Genie

筆者・所属機関

投稿日付

2018/10/11

概要(一言まとめ)

少数の簡単なボタンを押すだけで、誰でもピアノを演奏できるようになるディープラーニングのモデルを開発

手法の概要

コメント

関連情報

AI-Powered Piano Allows Anyone to Compose Music by Pressing a Few Buttons - NVIDIA Developer News CenterNVIDIA Developer News Center

たった8つのボタンで88鍵のピアノをハイレベルに演奏可能なAI「Piano Genie」 - GIGAZINE

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

CVPR18速報その他

CVPR18速報

f:id:karaage:20180930184038p:plain CVPR18速報より引用

物体検出問題,未だに根強くFaster R-CNNも残る

  • YOLO/SSDなど早い手法が提案されているにも関わらず,アンド Mask R-CNNのようにインスタンスセグメンテーションができる手法ができても,である
  • これは,(1)候補領域抽出(2)物体識別という2-stageの構造から?

論文サマリをCPUが作成,人間と強調

  • Paper Summary Generation(ICMV18)
  • PDF入力,論文サマリ出力

新しい評価方法を提案

  • Neural Joking Machine (CVPR18WS)
  • 大喜利サイト”ボケて”に投稿,訓練されたユーザ評価

ボケAI

ディープラーニングによる物体検出のサーベイ論文その1

論文へのリンク

[1809.02165] Deep Learning for Generic Object Detection: A Survey

筆者・所属機関

Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen

投稿日付

2018/09/06

概要(一言まとめ)

 物体検出のサーベイ論文。ディープラーニングのものが中心。

 ディープラーニングで劇的に性能が上がったよという話(単純な物体判別と同様)

f:id:karaage:20180921223716p:plain:w640

 様々なアルゴリズムの概要を歴史を追って説明している。

手法の概要

 一口に物体検出といっても、色々カテゴリがある。具体的には

  • Object Classification
  • Object Detection
  • Semantic Segmentation
  • Instance Segmentation

 それぞれの違いは、以下の図がわかりやすい。

f:id:karaage:20180921223752p:plain:w640

 これらの違いは、以下の記事が詳しい。

深層学習による画像処理の概要からChainerCVとFCISで『物体検出ソフト』を作るまで|はやぶさの技術ノート

 あと、ステージとしてTwo StageのものとOne Stageのものがある。これらに関しては、以下記事が詳しい

ChainerCVとLight-Head R-CNNで『カメラ・動画対応!物体検出ソフト』を作る|はやぶさの技術ノート

 End-to-End(最初から最後までディープラーニングか)かそうでないかもある。Faster RNNが初めてのEnd-to-Endという認識だったけど、この論文ではFast RNNだと書いてある(領域サーチを除くという但し書きがあるので、Faster RNNが初でも間違いではないと思う)。

 ここらへんは、自分がまとめたけど、ちょっと勘違いしているような気がしてきた。

コメント

関連情報

 以下もサーベイ論文。

 以下に日本語訳のリンクあり

次に読む論文

 Semantic SegmentationかInstance Segmentation関係で何か。

自分なりのアウトプット

 以下でObject Detectionまでは試している。

 Semantic SegmentationやInstance Segmentationも試してみたい

気になった英単語・英語表現

ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解

論文へのリンク

[1806.08756] Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation

筆者・所属機関

Peter R. Florence(MIT), Lucas Manuelli(MIT), Russ Tedrake(MIT)

投稿日付

2018/06/22

概要(一言まとめ)

手法の概要

コメント

関連情報

未来のロボットアームは、人工知能でモノを視覚的に判断できる、はず。 | ギズモード・ジャパン

GitHub - RobotLocomotion/pytorch-dense-correspondence: Code for "Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation"

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

descriptor 記述子、デスクリプタ