からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

論文

今最も軽くて早いニューラルネット「MobileNetV3」

論文へのリンク [1905.02244] Searching for MobileNetV3 筆者・所属機関 Andrew Howard, Mark Sandler, Grace Chu, Liang-Chieh Chen, Bo Chen, Mingxing Tan, Weijun Wang, Yukun Zhu, Ruoming Pang, Vijay Vasudevan, Quoc V. Le, Hartwig Adam 全員所属…

GAN関係のリンクまとめ

GAN関係リンク GAN関係の参考になりそうな情報源のまとめ GANはじめに はじめてのGAN MIRU MIRU わかる GAN スライド GAN Lab: Play with Generative Adversarial Networks in Your Browser! 可視化 深層学習の生成モデル パワポの資料 GANsの最新動向: 応用…

DeNAのAI研究開発エンジニアによるCVPR 2019のレポート

CVPR 2019 report (30 papers) from ShunsukeNakamura17

高速のトラッキングとセグメンテーションの技術「SiamMask」

論文へのリンク https://arxiv.org/pdf/1812.05050.pdf 筆者・所属機関 Qiang Wang(CASIA), Li Zhang(University of Oxford), Luca Bertinetto(FiveAI) 投稿日付 2018/12/12 概要(一言まとめ) バウンディングボックスを回転させるというアイディアで、高速…

YOLO v3より速い?現時点で最速の物体検出技術「CenterNet」

論文へのリンク [1904.07850] Objects as Points 筆者・所属機関 Xingyi Zhou(UT Austin), Dequan Wang(UC Berkeley), Philipp Kra ̈henbu ̈hl(UT Austin) 投稿日付 2019/04/25 概要(一言まとめ) 以下のツイートが分かりやすいので引用(手抜き) 物体検出…

Google Waymoの自動運転技術の論文

論文へのリンク [1812.03079] ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst 筆者・所属機関 Mayank Bansal(Waymo), Alex Krizhevsky(Google Brain & Waymo), Abhijit Ogale(Waymo) 投稿日付 2018/12/7 概要(一言まと…

ディープラーニングを使った超解像技術の論文

論文へのリンク Deep learning based super resolution, without using a GAN 筆者・所属機関 Christopher Thomas BSc Hons. MIAP 投稿日付 2019/2/24 概要(一言まとめ) GANを使わない超解像 手法の概要 fast.aiを使った超解像の実践記事 コメント fast.ai…

Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

論文へのリンク [1811.06152] Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos 筆者・所属機関 Vincent Casser(Google Brain), Soeren Pirk(Google Brain), Reza Mahjourian(Google Brain), A…

Riemannian Motion Policies

論文へのリンク [1801.02854] Riemannian Motion Policies 筆者・所属機関 Nathan D. Ratliff(NVIDIA), Jan Issac(NVIDIA), Daniel Kappler(Max Planck for Intelligent Systems), Stan Birchfield(NVIDIA), Dieter Fox(NVIDIA) 投稿日付 2018/1/9 概要(一…

「Papers With Code」は機械学習・ディープラーニングの論文とコードがめっちゃまとまっていて便利

メモ。ジャンルごとに有名どころがまとまっている上、今トレンドの論文がプッシュされたり、コードへのリンクもまとまっていたりで、とりあえずここ見ておけば良い感がある

2018年に発表されたコンピュータビジョンに関する重要な論文10選とその解説

ざっと見た感じ、ほぼ全部ディープラーニングな予感。後で見る https://t.co/qplry8aOZL— からあげ (@karaage0703) 2019年1月31日 メモ、後で読む

テキスト音声合成技術の変遷と最先端

www.jstage.jst.go.jp 音響学会誌2018年7月号に載った音声合成に関する記事、PDFがネットに上がってました -- テキスト音声合成技術の変遷と最先端 https://t.co/KSVMZDptFY— Heiga Zen (全 炳河) (@heiga_zen) 2019年1月3日 音声合成というと、PARCORを学生…

google pixel で使われてるポートレートモードのぼかしアルゴリズム解説

このPodcastおもしろい。この回は google pixel で使われてるポートレートモードのぼかしアルゴリズム解説してくれてる。 https://t.co/QZslilkxhJ— Tatsuya Kida (@kidapu) 2018年12月29日 [1806.04171] Synthetic Depth-of-Field with a Single-Camera Mob…

Grasp2Vec

論文へのリンク [1811.06964] Grasp2Vec: Learning Object Representations from Self-Supervised Grasping 筆者・所属機関 Eric Jang(Google), Coline Devin(Berkeley), Vincent Vanhoucke(Google), and Sergey Levine(Google, Berkeley) 投稿日付 2018/11/…

物体認識のための畳み込みニューラルネットワークの研究動向(サーベイ論文)

論文へのリンク 物体認識のための畳み込みニューラルネットワークの研究動向 筆者・所属機関 内田 祐介(DeNA)、山下 隆義(中部大学) 投稿日付 2019/03(早期公開) 概要(一言まとめ) ディープラーニングのCNNを使ったネットワークの変遷や性能比較をまと…

汎用的な画風変換の革命児「pix2pix」

論文へのリンク [1611.07004] Image-to-Image Translation with Conditional Adversarial Networks 筆者・所属機関 Phillip Isola(Berkeley), Jun-Yan Zhu(Berkeley), Tinghui Zhou(Berkeley), Alexei A. Efros(Berkeley) 投稿日付 2016/11/21 概要(一言ま…

Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

論文へのリンク [1810.09381] Unsupervised Learning of Shape and Pose with Differentiable Point Clouds 筆者・所属機関 Eldar Insafutdinov(Intel), Alexey Dosovitskiy(Intel) 投稿日付 2018/10/22 概要(一言まとめ) 2次元画像から3次元モデルを生成 …

ロボットのピッキング関係の論文メモ

論文 [1711.00199] PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes [1804.00175] DeepIM: Deep Iterative Matching for 6D Pose Estimation [1703.01564] Perceiving and Reasoning About Liquids Using Fully…

Piano Genie

論文へのリンク [1810.05246] Piano Genie 筆者・所属機関 投稿日付 2018/10/11 概要(一言まとめ) 少数の簡単なボタンを押すだけで、誰でもピアノを演奏できるようになるディープラーニングのモデルを開発 手法の概要 コメント 関連情報 AI-Powered Piano …

ディープラーニングによる物体検出のサーベイ論文その1

論文へのリンク [1809.02165] Deep Learning for Generic Object Detection: A Survey 筆者・所属機関 Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen 投稿日付 2018/09/06 概要(一言まとめ) 物体検出のサ…

ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解

論文へのリンク [1806.08756] Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation 筆者・所属機関 Peter R. Florence(MIT), Lucas Manuelli(MIT), Russ Tedrake(MIT) 投稿日付 2018/06/22 概要(一言まとめ) 手…

LUCSS: Language-based User-customized Colourization of Scene Sketches

論文へのリンク [1808.10544] LUCSS: Language-based User-customized Colourization of Scene Sketches 筆者・所属機関 Changqing Zou, Haoran Mo, Ruofei Du, Xing Wu, Chengying Gao, Hongbo Fu 投稿日付 2018/08/30 概要(一言まとめ) 自然言語でイラス…

PythonRobotics: a Python code collection of robotics algorithms

論文へのリンク [1808.10703] PythonRobotics: a Python code collection of robotics algorithms 筆者・所属機関 Atsushi Sakai(University of California, Berkeley), Daniel Ingram, Joseph Dinius, Karan Chawla, Antonin Raffin, Alexis Paques 投稿日…

End-to-end Recovery of Human Shape and Pose

論文へのリンク [1712.06584] End-to-end Recovery of Human Shape and Pose 筆者・所属機関 Angjoo Kanazawa(University of California, Berkeley), Michael J. Black, David W. Jacobs, Jitendra Malik 投稿日付 概要(一言まとめ) 手法の概要 コメント …

SIGGRAPH 2018個人的まとめ

SIGGRAPH(シーグラフ)2018 SIGGRAPH(Special Interest Group on Computer GRAPHics)。個人的メモ Color in Advanced Displays: HDR, OLED, AR & VR Color in advanced displays ACM SIGGRAPH 2018 Courses Deep Video Portraits Deep Video Portraits yo…

RefineNet

論文へのリンク [1611.06612] RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation 筆者・所属機関 Guosheng Lin, Anton Milan, Chunhua Shen, Ian Reid 投稿日付 2016/11/20 概要(一言まとめ) セマンティックセグメン…

Single-Shot Object Detection with Enriched Semantics

論文へのリンク [1712.00433] Single-Shot Object Detection with Enriched Semantics 筆者・所属機関 投稿日付 概要(一言まとめ) セマンティックセグメンテーション的な考え(?)を取り入れることで物体検出の性能をスピード、精度ともに向上させる(?…

ACL2018読み会

自然言語処理の有名な学会ACL2018の論文を読む会

NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS(Tacotron 2)

論文へのリンク [1712.05884] Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions 筆者・所属機関 投稿日付 概要(一言まとめ) Googleが開発したディープラーニングを用いたText to speechの手法。 新規性(何が過去の研究に比…

Uberの遺伝的アルゴリズム(GA)とDNN(ディープラーニング)強化学習を組み合わせた研究

論文へのリンク [1712.06567] Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning 筆者・所属機関 投稿日付 概要(一言まとめ) Uberの遺伝的アルゴリズム(GA)とDNN(…