いいじゃん
機械学習の中身を理解する
良さそうなスライドメモ
Grasp2Vec
論文へのリンク
[1811.06964] Grasp2Vec: Learning Object Representations from Self-Supervised Grasping
筆者・所属機関
Eric Jang(Google), Coline Devin(Berkeley), Vincent Vanhoucke(Google), and Sergey Levine(Google, Berkeley)
投稿日付
2018/11/16
概要(一言まとめ)
手法の概要
コメント
関連情報
人間の指示なしにロボットが自分で動いて学習できるアルゴリズム「Grasp2Vec」をGoogleが発表 - GIGAZINE
Google AI Blog: Grasp2Vec: Learning Object Representations from Self-Supervised Grasping
Grasp2Vec: Learning Object Representations from Self-Supervised Grasping · Issue #1031 · arXivTimes/arXivTimes · GitHub
次に読む論文
自分なりのアウトプット
気になった英単語・英語表現
物体認識のための畳み込みニューラルネットワークの研究動向(サーベイ論文)
論文へのリンク
筆者・所属機関
内田 祐介(DeNA)、山下 隆義(中部大学)
投稿日付
2019/03(早期公開)
概要(一言まとめ)
ディープラーニングのCNNを使ったネットワークの変遷や性能比較をまとめたサーベイ論文。めちゃめちゃ有用な予感なので、しっかり読む。あとで追記。
画像認識を主に、様々なネットワークを極力同一条件で性能比較を行っている。
以下のスライドも合わせて参照
手法の概要
サーベイ論文のため省略
コメント
ネットワークの改善により、性能は向上しているが、性能自体かなり飽和している印象を受けた。タスクの実用上は、1~2%の違いを求めるより、推論の速度や開発期間の方が重要なケースもあると思う。
また、比較もあくまで実験的なものなので、ハイパーパラメータのチューニングによっては、ネットワークによる性能が逆転することもあるのではないかなという印象も受けた。
もちろん、学習がうまくいっているとき、ネットワークの変更による性能差はこの程度ということを知る意味では、非常に有用な論文であると思う。
関連情報
畳み込みニューラルネットワークに関するサーベイ論文が電子情報通信学会論文誌に採録されました | DeNA×AI
次に読む論文
自分なりのアウトプット
気になった英単語・英語表現
汎用的な画風変換の革命児「pix2pix」
論文へのリンク
[1611.07004] Image-to-Image Translation with Conditional Adversarial Networks
筆者・所属機関
Phillip Isola(Berkeley), Jun-Yan Zhu(Berkeley), Tinghui Zhou(Berkeley), Alexei A. Efros(Berkeley)
投稿日付
2016/11/21
概要(一言まとめ)
ディープラーニングを用いた、汎用的な画像変換。pix2pixとして有名。TensorFlowをはじめとした多くの実装例がある
手法の概要
CGAN(条件付きGAN)を使っている。「変換前の画像とGeneratorが生成した画像のペア」と「変換前の画像と変換後の画像のペア」という画像を条件として学習させる。
Generatorにはセマンティックセグメンテーションに使われるU-Netを使用
U-Netのネットワーク
コメント
U-Netの代わりに別のネットワーク(DeepLabV3+とか)使ったら性能が向上したりするのだろうか?それかもうやられてる?
関連情報
GitHub - affinelayer/pix2pix-tensorflow: Tensorflow port of Image-to-Image Translation with Conditional Adversarial Nets https://phillipi.github.io/pix2pix/
Pix2Pix:CGANによる画像変換 | NegativeMindException
できそうなことはだいたいできる画像生成AI、pix2pixの汎用性に驚く - WirelessWire News(ワイヤレスワイヤーニュース)
GANの基礎からStyleGAN2まで - akira - Medium
Depixelizing Pixel Art
任天堂のドット絵のアップスケーリング。直接は関係ないが、極限までスピードの要求される画像変換という点で取り上げる
次に読む論文
自分なりのアウトプット
ディープラーニングを使ってドット絵を画像に変換してみた - karaage. [からあげ]
気になった英単語・英語表現
Unsupervised Learning of Shape and Pose with Differentiable Point Clouds
論文へのリンク
[1810.09381] Unsupervised Learning of Shape and Pose with Differentiable Point Clouds
筆者・所属機関
Eldar Insafutdinov(Intel), Alexey Dosovitskiy(Intel)
投稿日付
2018/10/22
概要(一言まとめ)
2次元画像から3次元モデルを生成
手法の概要
Differentiable Point Cloudsという概念がキーっぽい。後で読む
コメント
関連情報
Unsupervised Learning of Shape and Pose with Differentiable Point Clouds