からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

論文

高速のトラッキングとセグメンテーションの技術「SiamMask」

論文へのリンク https://arxiv.org/pdf/1812.05050.pdf 筆者・所属機関 Qiang Wang(CASIA), Li Zhang(University of Oxford), Luca Bertinetto(FiveAI) 投稿日付 2018/12/12 概要(一言まとめ) バウンディングボックスを回転させるというアイディアで、高速…

YOLO v3より速い?現時点で最速の物体検出技術「CenterNet」

論文へのリンク [1904.07850] Objects as Points 筆者・所属機関 Xingyi Zhou(UT Austin), Dequan Wang(UC Berkeley), Philipp Kra ̈henbu ̈hl(UT Austin) 投稿日付 2019/04/25 概要(一言まとめ) 以下のツイートが分かりやすいので引用(手抜き) 物体検出…

Google Waymoの自動運転技術の論文

論文へのリンク [1812.03079] ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst 筆者・所属機関 Mayank Bansal(Waymo), Alex Krizhevsky(Google Brain & Waymo), Abhijit Ogale(Waymo) 投稿日付 2018/12/7 概要(一言まと…

ディープラーニングを使った超解像技術の論文

論文へのリンク Deep learning based super resolution, without using a GAN 筆者・所属機関 Christopher Thomas BSc Hons. MIAP 投稿日付 2019/2/24 概要(一言まとめ) GANを使わない超解像 手法の概要 fast.aiを使った超解像の実践記事 コメント fast.ai…

Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

論文へのリンク [1811.06152] Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos 筆者・所属機関 Vincent Casser(Google Brain), Soeren Pirk(Google Brain), Reza Mahjourian(Google Brain), A…

Riemannian Motion Policies

論文へのリンク [1801.02854] Riemannian Motion Policies 筆者・所属機関 Nathan D. Ratliff(NVIDIA), Jan Issac(NVIDIA), Daniel Kappler(Max Planck for Intelligent Systems), Stan Birchfield(NVIDIA), Dieter Fox(NVIDIA) 投稿日付 2018/1/9 概要(一…

「Papers With Code」は機械学習・ディープラーニングの論文とコードがめっちゃまとまっていて便利

メモ。ジャンルごとに有名どころがまとまっている上、今トレンドの論文がプッシュされたり、コードへのリンクもまとまっていたりで、とりあえずここ見ておけば良い感がある

2018年に発表されたコンピュータビジョンに関する重要な論文10選とその解説

ざっと見た感じ、ほぼ全部ディープラーニングな予感。後で見る https://t.co/qplry8aOZL— からあげ (@karaage0703) 2019年1月31日 メモ、後で読む

テキスト音声合成技術の変遷と最先端

www.jstage.jst.go.jp 音響学会誌2018年7月号に載った音声合成に関する記事、PDFがネットに上がってました -- テキスト音声合成技術の変遷と最先端 https://t.co/KSVMZDptFY— Heiga Zen (全 炳河) (@heiga_zen) 2019年1月3日 音声合成というと、PARCORを学生…

google pixel で使われてるポートレートモードのぼかしアルゴリズム解説

このPodcastおもしろい。この回は google pixel で使われてるポートレートモードのぼかしアルゴリズム解説してくれてる。 https://t.co/QZslilkxhJ— Tatsuya Kida (@kidapu) 2018年12月29日 [1806.04171] Synthetic Depth-of-Field with a Single-Camera Mob…

Grasp2Vec

論文へのリンク [1811.06964] Grasp2Vec: Learning Object Representations from Self-Supervised Grasping 筆者・所属機関 Eric Jang(Google), Coline Devin(Berkeley), Vincent Vanhoucke(Google), and Sergey Levine(Google, Berkeley) 投稿日付 2018/11/…

物体認識のための畳み込みニューラルネットワークの研究動向(サーベイ論文)

論文へのリンク 物体認識のための畳み込みニューラルネットワークの研究動向 筆者・所属機関 内田 祐介(DeNA)、山下 隆義(中部大学) 投稿日付 2019/03(早期公開) 概要(一言まとめ) ディープラーニングのCNNを使ったネットワークの変遷や性能比較をまと…

Image-to-Image Translation with Conditional Adversarial Networks(pix2pix)

論文へのリンク [1611.07004] Image-to-Image Translation with Conditional Adversarial Networks 筆者・所属機関 Phillip Isola(Berkeley), Jun-Yan Zhu(Berkeley), Tinghui Zhou(Berkeley), Alexei A. Efros(Berkeley) 投稿日付 2016/11/21 概要(一言ま…

Unsupervised Learning of Shape and Pose with Differentiable Point Clouds

論文へのリンク [1810.09381] Unsupervised Learning of Shape and Pose with Differentiable Point Clouds 筆者・所属機関 Eldar Insafutdinov(Intel), Alexey Dosovitskiy(Intel) 投稿日付 2018/10/22 概要(一言まとめ) 2次元画像から3次元モデルを生成 …

ロボットのピッキング関係の論文メモ

論文 [1711.00199] PoseCNN: A Convolutional Neural Network for 6D Object Pose Estimation in Cluttered Scenes [1804.00175] DeepIM: Deep Iterative Matching for 6D Pose Estimation [1703.01564] Perceiving and Reasoning About Liquids Using Fully…

Piano Genie

論文へのリンク [1810.05246] Piano Genie 筆者・所属機関 投稿日付 2018/10/11 概要(一言まとめ) 少数の簡単なボタンを押すだけで、誰でもピアノを演奏できるようになるディープラーニングのモデルを開発 手法の概要 コメント 関連情報 AI-Powered Piano …

ディープラーニングによる物体検出のサーベイ論文

論文へのリンク [1809.02165] Deep Learning for Generic Object Detection: A Survey 筆者・所属機関 Li Liu, Wanli Ouyang, Xiaogang Wang, Paul Fieguth, Jie Chen, Xinwang Liu, Matti Pietikäinen 投稿日付 2018/09/06 概要(一言まとめ) 物体検出のサ…

ロボットのピッキングを助けるディープラーニングの学習モデル「Dense Object Nets」とビジョンを使った物体理解

論文へのリンク [1806.08756] Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation 筆者・所属機関 Peter R. Florence(MIT), Lucas Manuelli(MIT), Russ Tedrake(MIT) 投稿日付 2018/06/22 概要(一言まとめ) 手…

LUCSS: Language-based User-customized Colourization of Scene Sketches

論文へのリンク [1808.10544] LUCSS: Language-based User-customized Colourization of Scene Sketches 筆者・所属機関 Changqing Zou, Haoran Mo, Ruofei Du, Xing Wu, Chengying Gao, Hongbo Fu 投稿日付 2018/08/30 概要(一言まとめ) 自然言語でイラス…

PythonRobotics: a Python code collection of robotics algorithms

論文へのリンク [1808.10703] PythonRobotics: a Python code collection of robotics algorithms 筆者・所属機関 Atsushi Sakai(University of California, Berkeley), Daniel Ingram, Joseph Dinius, Karan Chawla, Antonin Raffin, Alexis Paques 投稿日…

End-to-end Recovery of Human Shape and Pose

論文へのリンク [1712.06584] End-to-end Recovery of Human Shape and Pose 筆者・所属機関 Angjoo Kanazawa(University of California, Berkeley), Michael J. Black, David W. Jacobs, Jitendra Malik 投稿日付 概要(一言まとめ) 手法の概要 コメント …

SIGGRAPH 2018個人的まとめ

SIGGRAPH(シーグラフ)2018 SIGGRAPH(Special Interest Group on Computer GRAPHics)。個人的メモ Color in Advanced Displays: HDR, OLED, AR & VR Color in advanced displays ACM SIGGRAPH 2018 Courses Deep Video Portraits Deep Video Portraits yo…

RefineNet

論文へのリンク [1611.06612] RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation 筆者・所属機関 Guosheng Lin, Anton Milan, Chunhua Shen, Ian Reid 投稿日付 2016/11/20 概要(一言まとめ) セマンティックセグメン…

Single-Shot Object Detection with Enriched Semantics

論文へのリンク [1712.00433] Single-Shot Object Detection with Enriched Semantics 筆者・所属機関 投稿日付 概要(一言まとめ) セマンティックセグメンテーション的な考え(?)を取り入れることで物体検出の性能をスピード、精度ともに向上させる(?…

ACL2018読み会

自然言語処理の有名な学会ACL2018の論文を読む会

NATURAL TTS SYNTHESIS BY CONDITIONING WAVENET ON MEL SPECTROGRAM PREDICTIONS(Tacotron 2)

論文へのリンク [1712.05884] Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions 筆者・所属機関 投稿日付 概要(一言まとめ) Googleが開発したディープラーニングを用いたText to speechの手法。 新規性(何が過去の研究に比…

Uberの遺伝的アルゴリズム(GA)とDNN(ディープラーニング)強化学習を組み合わせた研究

論文へのリンク [1712.06567] Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning 筆者・所属機関 投稿日付 概要(一言まとめ) Uberの遺伝的アルゴリズム(GA)とDNN(…

You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery(物体検出)

論文へのリンク [1805.09512] You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery 筆者・所属機関 投稿日付 2018/5/24 概要(一言まとめ) Yoloを活用して、衛星写真の小さい物体を検出する方法 新規性(何が過去の研究に比べて…

SSD: Single Shot MultiBox Detector(物体検出)

論文へのリンク [1512.02325] SSD: Single Shot MultiBox Detector 筆者・所属機関 投稿日付 2015/12/8 概要(一言まとめ) 物体検出をディープラーニングでEnd-to-Endでできるアルゴリズム 新規性(何が過去の研究に比べて凄い?) 従来の物体検出は、Selec…

Open3D: A Modern Library for 3D Data Processing

論文へのリンク Open3D 筆者・所属機関 投稿日付 概要(一言まとめ) 簡単に3次元の画像処理ができる、オープンソースライブラリOpen3Dの紹介 新規性(何が過去の研究に比べて凄い?) オープンソースで3次元処理でプロトタイピングできるようなライブラリは…