今最も軽くて早いニューラルネット「MobileNetV3」

論文

論文へのリンク [1905.02244] Searching for MobileNetV3 筆者・所属機関 Andrew Howard, Mark Sandler, Grace Chu, Liang-Chieh Chen, Bo Chen, Mingxing Tan, Weijun Wang, Yukun Zhu, Ruoming Pang, Vijay Vasudevan, Quoc V. Le, Hartwig Adam 全員所属…

2019-07-02

GAN関係のリンクまとめ

技術メモ論文

GAN関係リンク GAN関係の参考になりそうな情報源のまとめ GANはじめにはじめてのGAN MIRU MIRU わかる GAN スライド GAN Lab: Play with Generative Adversarial Networks in Your Browser! 可視化深層学習の生成モデルパワポの資料 GANsの最新動向: 応用…

2019-07-02

DeNAのAI研究開発エンジニアによるCVPR 2019のレポート

技術メモ論文

CVPR 2019 report (30 papers) from ShunsukeNakamura17

2019-05-21

高速のトラッキングとセグメンテーションの技術「SiamMask」

論文

論文へのリンク https://arxiv.org/pdf/1812.05050.pdf 筆者・所属機関 Qiang Wang(CASIA), Li Zhang(University of Oxford), Luca Bertinetto(FiveAI) 投稿日付 2018/12/12 概要（一言まとめ）バウンディングボックスを回転させるというアイディアで、高速…

2019-05-20

YOLO v3より速い？現時点で最速の物体検出技術「CenterNet」

論文

論文へのリンク [1904.07850] Objects as Points 筆者・所属機関 Xingyi Zhou(UT Austin), Dequan Wang(UC Berkeley), Philipp Kra ̈henbu ̈hl(UT Austin) 投稿日付 2019/04/25 概要（一言まとめ）以下のツイートが分かりやすいので引用（手抜き）物体検出…

2019-03-16

Google Waymoの自動運転技術の論文

論文

論文へのリンク [1812.03079] ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst 筆者・所属機関 Mayank Bansal(Waymo), Alex Krizhevsky(Google Brain & Waymo), Abhijit Ogale(Waymo) 投稿日付 2018/12/7 概要（一言まと…

2019-02-25

ディープラーニングを使った超解像技術の論文

論文

論文へのリンク Deep learning based super resolution, without using a GAN 筆者・所属機関 Christopher Thomas BSc Hons. MIAP 投稿日付 2019/2/24 概要（一言まとめ） GANを使わない超解像手法の概要 fast.aiを使った超解像の実践記事コメント fast.ai…

2019-02-25

Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

論文

論文へのリンク [1811.06152] Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos 筆者・所属機関 Vincent Casser(Google Brain), Soeren Pirk(Google Brain), Reza Mahjourian(Google Brain), A…

2019-02-15

Riemannian Motion Policies

論文

論文へのリンク [1801.02854] Riemannian Motion Policies 筆者・所属機関 Nathan D. Ratliff(NVIDIA), Jan Issac(NVIDIA), Daniel Kappler(Max Planck for Intelligent Systems), Stan Birchfield(NVIDIA), Dieter Fox(NVIDIA) 投稿日付 2018/1/9 概要（一…

2019-02-02

「Papers With Code」は機械学習・ディープラーニングの論文とコードがめっちゃまとまっていて便利

技術メモ論文

メモ。ジャンルごとに有名どころがまとまっている上、今トレンドの論文がプッシュされたり、コードへのリンクもまとまっていたりで、とりあえずここ見ておけば良い感がある

2019-01-31

2018年に発表されたコンピュータビジョンに関する重要な論文１０選とその解説

論文

ざっと見た感じ、ほぼ全部ディープラーニングな予感。後で見る https://t.co/qplry8aOZL— からあげ (@karaage0703) 2019年1月31日メモ、後で読む

2019-01-04

テキスト音声合成技術の変遷と最先端

技術メモ論文

www.jstage.jst.go.jp 音響学会誌2018年7月号に載った音声合成に関する記事、PDFがネットに上がってました -- テキスト音声合成技術の変遷と最先端 https://t.co/KSVMZDptFY— Heiga Zen (全炳河) (@heiga_zen) 2019年1月3日音声合成というと、PARCORを学生…

2018-12-30

google pixel で使われてるポートレートモードのぼかしアルゴリズム解説

論文技術メモ

このPodcastおもしろい。この回は google pixel で使われてるポートレートモードのぼかしアルゴリズム解説してくれてる。 https://t.co/QZslilkxhJ— Tatsuya Kida (@kidapu) 2018年12月29日 [1806.04171] Synthetic Depth-of-Field with a Single-Camera Mob…

2018-12-13

Grasp2Vec

論文

論文へのリンク [1811.06964] Grasp2Vec: Learning Object Representations from Self-Supervised Grasping 筆者・所属機関 Eric Jang(Google), Coline Devin(Berkeley), Vincent Vanhoucke(Google), and Sergey Levine(Google, Berkeley) 投稿日付 2018/11/…

2018-11-15

物体認識のための畳み込みニューラルネットワークの研究動向（サーベイ論文）

論文

論文へのリンク物体認識のための畳み込みニューラルネットワークの研究動向筆者・所属機関内田祐介(DeNA)、山下隆義（中部大学）投稿日付 2019/03（早期公開）概要（一言まとめ）ディープラーニングのCNNを使ったネットワークの変遷や性能比較をまと…

2018-10-30

汎用的な画風変換の革命児「pix2pix」

論文

論文へのリンク [1611.07004] Image-to-Image Translation with Conditional Adversarial Networks 筆者・所属機関 Phillip Isola(Berkeley), Jun-Yan Zhu(Berkeley), Tinghui Zhou(Berkeley), Alexei A. Efros(Berkeley) 投稿日付 2016/11/21 概要（一言ま…

2018-10-29

Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

論文

論文へのリンク [1810.09381] Unsupervised Learning of Shape and Pose with Differentiable Point Clouds 筆者・所属機関 Eldar Insafutdinov(Intel), Alexey Dosovitskiy(Intel) 投稿日付 2018/10/22 概要（一言まとめ） 2次元画像から3次元モデルを生成 …

2018-10-28

ロボットのピッキング関係の論文メモ

論文

論文 [1711.00199] PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes [1804.00175] DeepIM: Deep Iterative Matching for 6D Pose Estimation [1703.01564] Perceiving and Reasoning About Liquids Using Fully…

2018-10-28

Piano Genie

論文

論文へのリンク [1810.05246] Piano Genie 筆者・所属機関投稿日付 2018/10/11 概要（一言まとめ）少数の簡単なボタンを押すだけで、誰でもピアノを演奏できるようになるディープラーニングのモデルを開発手法の概要コメント関連情報 AI-Powered Piano …

2018-09-19

ディープラーニングによる物体検出のサーベイ論文その1

論文

論文へのリンク [1809.02165] Deep Learning for Generic Object Detection: A Survey 筆者・所属機関 Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen 投稿日付 2018/09/06 概要（一言まとめ）物体検出のサ…

2018-09-18

ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解

論文

論文へのリンク [1806.08756] Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation 筆者・所属機関 Peter R. Florence(MIT), Lucas Manuelli(MIT), Russ Tedrake(MIT) 投稿日付 2018/06/22 概要（一言まとめ）手…

2018-09-06

LUCSS: Language-based User-customized Colourization of Scene Sketches

論文

論文へのリンク [1808.10544] LUCSS: Language-based User-customized Colourization of Scene Sketches 筆者・所属機関 Changqing Zou, Haoran Mo, Ruofei Du, Xing Wu, Chengying Gao, Hongbo Fu 投稿日付 2018/08/30 概要（一言まとめ）自然言語でイラス…

2018-09-04

PythonRobotics: a Python code collection of robotics algorithms

論文

論文へのリンク [1808.10703] PythonRobotics: a Python code collection of robotics algorithms 筆者・所属機関 Atsushi Sakai(University of California, Berkeley), Daniel Ingram, Joseph Dinius, Karan Chawla, Antonin Raffin, Alexis Paques 投稿日…

2018-09-02

End-to-end Recovery of Human Shape and Pose

論文

論文へのリンク [1712.06584] End-to-end Recovery of Human Shape and Pose 筆者・所属機関 Angjoo Kanazawa(University of California, Berkeley), Michael J. Black, David W. Jacobs, Jitendra Malik 投稿日付概要（一言まとめ）手法の概要コメント …

2018-08-20

SIGGRAPH 2018個人的まとめ

技術メモ論文

SIGGRAPH（シーグラフ）2018 SIGGRAPH（Special Interest Group on Computer GRAPHics）。個人的メモ Color in Advanced Displays: HDR, OLED, AR & VR Color in advanced displays ACM SIGGRAPH 2018 Courses Deep Video Portraits Deep Video Portraits yo…

2018-08-13

RefineNet

論文

論文へのリンク [1611.06612] RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation 筆者・所属機関 Guosheng Lin, Anton Milan, Chunhua Shen, Ian Reid 投稿日付 2016/11/20 概要（一言まとめ）セマンティックセグメン…

2018-07-23

Single-Shot Object Detection with Enriched Semantics

論文

論文へのリンク [1712.00433] Single-Shot Object Detection with Enriched Semantics 筆者・所属機関投稿日付概要（一言まとめ）セマンティックセグメンテーション的な考え（？）を取り入れることで物体検出の性能をスピード、精度ともに向上させる（？…

2018-07-23

ACL2018読み会

論文

自然言語処理の有名な学会ACL2018の論文を読む会

2018-07-23

NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS（Tacotron 2）

論文

論文へのリンク [1712.05884] Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions 筆者・所属機関投稿日付概要（一言まとめ） Googleが開発したディープラーニングを用いたText to speechの手法。新規性（何が過去の研究に比…

2018-06-05

Uberの遺伝的アルゴリズム（GA）とDNN（ディープラーニング）強化学習を組み合わせた研究

論文

論文へのリンク [1712.06567] Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning 筆者・所属機関投稿日付概要（一言まとめ） Uberの遺伝的アルゴリズム（GA）とDNN（…

からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

論文

今最も軽くて早いニューラルネット「MobileNetV3」

GAN関係のリンクまとめ

DeNAのAI研究開発エンジニアによるCVPR 2019のレポート

高速のトラッキングとセグメンテーションの技術「SiamMask」

YOLO v3より速い？現時点で最速の物体検出技術「CenterNet」

Google Waymoの自動運転技術の論文

ディープラーニングを使った超解像技術の論文

Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

Riemannian Motion Policies

「Papers With Code」は機械学習・ディープラーニングの論文とコードがめっちゃまとまっていて便利

2018年に発表されたコンピュータビジョンに関する重要な論文１０選とその解説

テキスト音声合成技術の変遷と最先端

google pixel で使われてるポートレートモードのぼかしアルゴリズム解説

Grasp2Vec

物体認識のための畳み込みニューラルネットワークの研究動向（サーベイ論文）

汎用的な画風変換の革命児「pix2pix」

Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

ロボットのピッキング関係の論文メモ

Piano Genie

ディープラーニングによる物体検出のサーベイ論文その1

ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解

LUCSS: Language-based User-customized Colourization of Scene Sketches

PythonRobotics: a Python code collection of robotics algorithms

End-to-end Recovery of Human Shape and Pose

SIGGRAPH 2018個人的まとめ

RefineNet

Single-Shot Object Detection with Enriched Semantics

ACL2018読み会

NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS（Tacotron 2）

Uberの遺伝的アルゴリズム（GA）とDNN（ディープラーニング）強化学習を組み合わせた研究