Unsupervised Learning of Shape and Pose with Differentiable Point Clouds
論文へのリンク
[1810.09381] Unsupervised Learning of Shape and Pose with Differentiable Point Clouds
筆者・所属機関
Eldar Insafutdinov(Intel), Alexey Dosovitskiy(Intel)
投稿日付
2018/10/22
概要(一言まとめ)
2次元画像から3次元モデルを生成
手法の概要
Differentiable Point Cloudsという概念がキーっぽい。後で読む
コメント
関連情報
Unsupervised Learning of Shape and Pose with Differentiable Point Clouds
次に読む論文
自分なりのアウトプット
気になった英単語・英語表現
Piano Genie
論文へのリンク
筆者・所属機関
投稿日付
2018/10/11
概要(一言まとめ)
少数の簡単なボタンを押すだけで、誰でもピアノを演奏できるようになるディープラーニングのモデルを開発
手法の概要
コメント
関連情報
AI-Powered Piano Allows Anyone to Compose Music by Pressing a Few Buttons - NVIDIA Developer News CenterNVIDIA Developer News Center
たった8つのボタンで88鍵のピアノをハイレベルに演奏可能なAI「Piano Genie」 - GIGAZINE
次に読む論文
自分なりのアウトプット
気になった英単語・英語表現
CVPR18速報その他
顔認識のスライドを追加しました。
— cvpaper.challenge (@CVpaperChalleng) 2018年9月30日
--
CVPR18速報++ https://t.co/WGVNwpqwUy
ボケAI https://t.co/9rgYEGmH1I
GANs https://t.co/gYICKYa5VH
VQA https://t.co/cLIzNQGMjs
特徴表現学習 https://t.co/QvLR7WCK0d
動画説明文 https://t.co/BZwYnFFSKg
顔 https://t.co/pCrpvIg47n#cvpaperchallenge https://t.co/4WFpQipsu6
CVPR18速報
CVPR18速報より引用
物体検出問題,未だに根強くFaster R-CNNも残る
- YOLO/SSDなど早い手法が提案されているにも関わらず,アンド Mask R-CNNのようにインスタンスセグメンテーションができる手法ができても,である
- これは,(1)候補領域抽出(2)物体識別という2-stageの構造から?
論文サマリをCPUが作成,人間と強調
- Paper Summary Generation(ICMV18)
- PDF入力,論文サマリ出力
新しい評価方法を提案
- Neural Joking Machine (CVPR18WS)
- 大喜利サイト”ボケて”に投稿,訓練されたユーザ評価
ボケAI
ディープラーニングによる物体検出のサーベイ論文その1
論文へのリンク
[1809.02165] Deep Learning for Generic Object Detection: A Survey
筆者・所属機関
Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen
投稿日付
2018/09/06
概要(一言まとめ)
物体検出のサーベイ論文。ディープラーニングのものが中心。
ディープラーニングで劇的に性能が上がったよという話(単純な物体判別と同様)
様々なアルゴリズムの概要を歴史を追って説明している。
手法の概要
一口に物体検出といっても、色々カテゴリがある。具体的には
- Object Classification
- Object Detection
- Semantic Segmentation
- Instance Segmentation
それぞれの違いは、以下の図がわかりやすい。
これらの違いは、以下の記事が詳しい。
深層学習による画像処理の概要からChainerCVとFCISで『物体検出ソフト』を作るまで|はやぶさの技術ノート
あと、ステージとしてTwo StageのものとOne Stageのものがある。これらに関しては、以下記事が詳しい
ChainerCVとLight-Head R-CNNで『カメラ・動画対応!物体検出ソフト』を作る|はやぶさの技術ノート
End-to-End(最初から最後までディープラーニングか)かそうでないかもある。Faster RNNが初めてのEnd-to-Endという認識だったけど、この論文ではFast RNNだと書いてある(領域サーチを除くという但し書きがあるので、Faster RNNが初でも間違いではないと思う)。
ここらへんは、自分がまとめたけど、ちょっと勘違いしているような気がしてきた。
コメント
関連情報
以下もサーベイ論文。
以下に日本語訳のリンクあり
次に読む論文
Semantic SegmentationかInstance Segmentation関係で何か。
自分なりのアウトプット
以下でObject Detectionまでは試している。
Semantic SegmentationやInstance Segmentationも試してみたい
気になった英単語・英語表現
ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解
論文へのリンク
[1806.08756] Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation
筆者・所属機関
Peter R. Florence(MIT), Lucas Manuelli(MIT), Russ Tedrake(MIT)
投稿日付
2018/06/22
概要(一言まとめ)
手法の概要
コメント
関連情報
未来のロボットアームは、人工知能でモノを視覚的に判断できる、はず。 | ギズモード・ジャパン
GitHub - RobotLocomotion/pytorch-dense-correspondence: Code for "Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation"
次に読む論文
自分なりのアウトプット
気になった英単語・英語表現
descriptor 記述子、デスクリプタ