からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

論文

植物の病気判定のデータセット

論文へのリンク [1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection 筆者・所属機関 Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra Indian Institute of Technology Gandhinagar, Gujarat, In…

ディープラーニングの物体検出のサーベイ論文まとめ

物体検出のサーベイ論文 サーベイ論文だけでもたくさんありすぎでは? [1907.09408] A Survey of Deep Learning-based Object Detection [1908.03673] Recent Advances in Deep Learning for Object Detection [1809.02165] Deep Learning for Generic Objec…

AIでリアルな音楽生成「Jukebox」

論文へのリンク Jukebox: A Generative Model for Music 筆者・所属機関 Prafulla Dhariwal * 1, Heewoo Jun * 1, Christine Payne * 1, Jong Wook Kim * 1, Alec Radford * 1 ,Ilya Sutskever * 1 1 OpenAI, San Francisco. Correspondence 投稿日付 2020/0…

Dysonの開発したディープラーニングを活用した革新的なリアルタイムSLAM技術「DeepFactors」

論文へのリンク [2001.05049] DeepFactors: Real-Time Probabilistic Dense Monocular SLAM 筆者・所属機関 Jan Czarnowski, Tristan Laidlow, Ronald Clark, and Andrew J. Davison 全員所属はDyson Robotics Laboratory, Imperial College London 注:Dyso…

RGB-D画像から3D画像生成

論文へのリンク 3D Photography using Context-aware Layered Depth Inpainting(Google Drive) [2004.04727] 3D Photography using Context-aware Layered Depth Inpainting 筆者・所属機関 Meng-Li Shih(Virginia Tech, National Tsing Hua University), Sh…

偽のLiDAR?「Pseudo-LiDAR」

論文へのリンク [1812.07179] Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving [1906.06310] Pseudo-LiDAR++: Accurate Depth for 3D Object Detection in Autonomous Driving 筆者・所属機関 …

混ぜたら精度アップ?不思議なData Augmentation手法「Mixup」

論文へのリンク [1710.09412] mixup: Beyond Empirical Risk Minimization mixup: Beyond Empirical Risk Minimization 筆者・所属機関 Hongyi Zhang(MIT), Moustapha Cisse(FAIR), Yann N. Dauphin(FAIR), David Lopez-Paz(FAIR) 投稿日付 2017/10/25 概要…

2019年時点での最強の画像判別ネットワーク「EfficientNet」

論文へのリンク [1905.11946] EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 筆者・所属機関 Mingxing Tan(Google Brain), Quoc V. Le(Google Brain) 投稿日付 2019/05/28 概要(一言まとめ) 2019年時点でState of the artの…

Image Segmentationのサーベイ論文

論文へのリンク [2001.05566] Image Segmentation Using Deep Learning: A Survey 筆者・所属機関 Shervin Minaee(Expedia Inc, and New York University), Yuri Boykov (University of Waterloo), Fatih Porikli(Australian National University, and Huawe…

Center Lossでディープな顔認識

論文へのリンク A Discriminative Feature Learning Approach for Deep Face Recognition 筆者・所属機関 Yandong Wen (1), Kaipeng Zhang (1), Zhifeng Li (1), and Yu Qiao (1,2) Shenzhen Key Lab of Computer Vision and Pattern Recognition Shenzhen I…

CNNの不思議「Deep Image Prior」

論文へのリンク [1711.10925] Deep Image Prior 筆者・所属機関 Dmitry Ulyanov(Skoltech), Andrea Vedaldi(University of Oxford), Victor Lempitsky(Skoltech) 投稿日付 2018/04/05 概要(一言まとめ) CNNモデルに対して、入力をノイズ、出力の教師画像を…

データオーギュメンテーションの決定版?「AUGMIX」

論文へのリンク [1911.06091] EdgeNet: Balancing Accuracy and Performance for Edge-based Convolutional Neural Network Object Detectors 筆者・所属機関 Anonymous authors (匿名でのレビュー中) 投稿日付 2019/11/09 概要(一言まとめ) Data Augmenta…

高解像度動画のエッジデバイス用物体検出手法「EdgeNet」

論文へのリンク [1911.06091] EdgeNet: Balancing Accuracy and Performance for Edge-based Convolutional Neural Network Object Detectors 筆者・所属機関 George Plastiras(University of Cyprus), Christos Kyrkou(University of Cyprus), Theocharis T…

ディープラーニングによる物体検出のサーベイ論文 その2

論文へのリンク [1908.03673] Recent Advances in Deep Learning for Object Detection 筆者・所属機関 Xiongwei Wua(School of Information System, Singapore Management University),Doyen Sahooa, Steven C.H. Hoi(School of Information System, Singap…

オートエンコーダを使った異常検知の性能向上

論文へのリンク [1807.02011] Improving Unsupervised Defect Segmentation by Applying Structural Similarity to Autoencoders 筆者・所属機関 Paul Bergmann(MVTec Software GmbH), Sindy Lo ̈we(MVTec Software GmbH / University of Amsterdam) , Micha…

ディープラーニングでブドウの物体検出

論文へのリンク [1907.11819] Grape detection, segmentation and tracking using deep neural networks and three-dimensional association 筆者・所属機関 Thiago T. Santos(Embrapa Agricultural Informatics), Leonardo L. de Souza(University of Campi…

今最も軽くて早いニューラルネット「MobileNetV3」

論文へのリンク [1905.02244] Searching for MobileNetV3 筆者・所属機関 Andrew Howard, Mark Sandler, Grace Chu, Liang-Chieh Chen, Bo Chen, Mingxing Tan, Weijun Wang, Yukun Zhu, Ruoming Pang, Vijay Vasudevan, Quoc V. Le, Hartwig Adam 全員所属…

GAN関係のリンクまとめ

GAN関係リンク GAN関係の参考になりそうな情報源のまとめ GANはじめに はじめてのGAN MIRU MIRU わかる GAN スライド GAN Lab: Play with Generative Adversarial Networks in Your Browser! 可視化 深層学習の生成モデル パワポの資料 GANsの最新動向: 応用…

DeNAのAI研究開発エンジニアによるCVPR 2019のレポート

CVPR 2019 report (30 papers) from ShunsukeNakamura17

高速のトラッキングとセグメンテーションの技術「SiamMask」

論文へのリンク https://arxiv.org/pdf/1812.05050.pdf 筆者・所属機関 Qiang Wang(CASIA), Li Zhang(University of Oxford), Luca Bertinetto(FiveAI) 投稿日付 2018/12/12 概要(一言まとめ) バウンディングボックスを回転させるというアイディアで、高速…

YOLO v3より速い?現時点で最速の物体検出技術「CenterNet」

論文へのリンク [1904.07850] Objects as Points 筆者・所属機関 Xingyi Zhou(UT Austin), Dequan Wang(UC Berkeley), Philipp Kra ̈henbu ̈hl(UT Austin) 投稿日付 2019/04/25 概要(一言まとめ) 以下のツイートが分かりやすいので引用(手抜き) 物体検出…

Google Waymoの自動運転技術の論文

論文へのリンク [1812.03079] ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst 筆者・所属機関 Mayank Bansal(Waymo), Alex Krizhevsky(Google Brain & Waymo), Abhijit Ogale(Waymo) 投稿日付 2018/12/7 概要(一言まと…

ディープラーニングを使った超解像技術の論文

論文へのリンク Deep learning based super resolution, without using a GAN 筆者・所属機関 Christopher Thomas BSc Hons. MIAP 投稿日付 2019/2/24 概要(一言まとめ) GANを使わない超解像 手法の概要 fast.aiを使った超解像の実践記事 コメント fast.ai…

Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos

論文へのリンク [1811.06152] Depth Prediction Without the Sensors: Leveraging Structure for Unsupervised Learning from Monocular Videos 筆者・所属機関 Vincent Casser(Google Brain), Soeren Pirk(Google Brain), Reza Mahjourian(Google Brain), A…

Riemannian Motion Policies

論文へのリンク [1801.02854] Riemannian Motion Policies 筆者・所属機関 Nathan D. Ratliff(NVIDIA), Jan Issac(NVIDIA), Daniel Kappler(Max Planck for Intelligent Systems), Stan Birchfield(NVIDIA), Dieter Fox(NVIDIA) 投稿日付 2018/1/9 概要(一…

「Papers With Code」は機械学習・ディープラーニングの論文とコードがめっちゃまとまっていて便利

メモ。ジャンルごとに有名どころがまとまっている上、今トレンドの論文がプッシュされたり、コードへのリンクもまとまっていたりで、とりあえずここ見ておけば良い感がある

2018年に発表されたコンピュータビジョンに関する重要な論文10選とその解説

ざっと見た感じ、ほぼ全部ディープラーニングな予感。後で見る https://t.co/qplry8aOZL— からあげ (@karaage0703) 2019年1月31日 メモ、後で読む

テキスト音声合成技術の変遷と最先端

www.jstage.jst.go.jp 音響学会誌2018年7月号に載った音声合成に関する記事、PDFがネットに上がってました -- テキスト音声合成技術の変遷と最先端 https://t.co/KSVMZDptFY— Heiga Zen (全 炳河) (@heiga_zen) 2019年1月3日 音声合成というと、PARCORを学生…

google pixel で使われてるポートレートモードのぼかしアルゴリズム解説

このPodcastおもしろい。この回は google pixel で使われてるポートレートモードのぼかしアルゴリズム解説してくれてる。 https://t.co/QZslilkxhJ— Tatsuya Kida (@kidapu) 2018年12月29日 [1806.04171] Synthetic Depth-of-Field with a Single-Camera Mob…

Grasp2Vec

論文へのリンク [1811.06964] Grasp2Vec: Learning Object Representations from Self-Supervised Grasping 筆者・所属機関 Eric Jang(Google), Coline Devin(Berkeley), Vincent Vanhoucke(Google), and Sergey Levine(Google, Berkeley) 投稿日付 2018/11/…