からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

植物の病気判定のデータセット

論文へのリンク [1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection 筆者・所属機関 Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra Indian Institute of Technology Gandhinagar, Gujarat, In…

ディープラーニングの物体検出のサーベイ論文まとめ

物体検出のサーベイ論文 サーベイ論文だけでもたくさんありすぎでは? [1907.09408] A Survey of Deep Learning-based Object Detection [1908.03673] Recent Advances in Deep Learning for Object Detection [1809.02165] Deep Learning for Generic Objec…

NVIDIA GTC2020 Keynoteメモ

GTC2020 新型コロナの影響で今年はオンライン開催。YouTubeで公開されている Part 1: CEO Jensen Huang Introduces Data-Center-Scale Accelerated Computing CEOのKeynote。 最初はCOVID-19の話 NVIDIAの技術の活用例のイメージビデオ Part 2: NVIDIA RTX –…

AIでリアルな音楽生成「Jukebox」

論文へのリンク Jukebox: A Generative Model for Music 筆者・所属機関 Prafulla Dhariwal * 1, Heewoo Jun * 1, Christine Payne * 1, Jong Wook Kim * 1, Alec Radford * 1 ,Ilya Sutskever * 1 1 OpenAI, San Francisco. Correspondence 投稿日付 2020/0…

中学生・高校生のための人工知能の教養講座(YouTubeリンク)

そもそもコンピューターは知能の大体を目的として作られた。人工知能のつくるためのもの コンパイラは翻訳機。プログライング言語からマシン語への変換 人間の使う言語から言語の変換(翻訳)は難しい

強化学習のメモ

何かに使いたいと思いながら、何にもできていない強化学習。個人的なメモをまとめておいて一回封印します。 まとめ的なリンク 自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常 GitHub - komi1230/Resume 深層強化学習の最前線 - Speaker D…

参考文献は少年ジャンプ「Deep Bleach」と話題の「MangaGAN」

論文へのリンク [2004.10634] Unpaired Photo-to-manga Translation Based on The Methodology of Manga Drawing 筆者・所属機関 Hao Su, Jianwei Niu, Xuefeng Liu, Qingfeng Li, Jiahe Cui, Ji Wan 全員 Beihang University(北京大学) 投稿日付 2020/04/…

Dysonの開発したディープラーニングを活用した革新的なリアルタイムSLAM技術「DeepFactors」

論文へのリンク [2001.05049] DeepFactors: Real-Time Probabilistic Dense Monocular SLAM 筆者・所属機関 Jan Czarnowski, Tristan Laidlow, Ronald Clark, and Andrew J. Davison 全員所属はDyson Robotics Laboratory, Imperial College London 注:Dyso…

RGB-D画像から3D画像生成

論文へのリンク 3D Photography using Context-aware Layered Depth Inpainting(Google Drive) [2004.04727] 3D Photography using Context-aware Layered Depth Inpainting 筆者・所属機関 Meng-Li Shih(Virginia Tech, National Tsing Hua University), Sh…

偽のLiDAR?「Pseudo-LiDAR」

論文へのリンク [1812.07179] Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving [1906.06310] Pseudo-LiDAR++: Accurate Depth for 3D Object Detection in Autonomous Driving 筆者・所属機関 …

混ぜたら精度アップ?不思議なData Augmentation手法「Mixup」

論文へのリンク [1710.09412] mixup: Beyond Empirical Risk Minimization mixup: Beyond Empirical Risk Minimization 筆者・所属機関 Hongyi Zhang(MIT), Moustapha Cisse(FAIR), Yann N. Dauphin(FAIR), David Lopez-Paz(FAIR) 投稿日付 2017/10/25 概要…

深層距離学習のメモ

個人的メモ。いつかちゃんとまとめる。 モダンな深層距離学習 (deep metric learning) 手法: SphereFace, CosFace, ArcFace - Qiita scikit-learn-contrib の Metric Learning を試す - u++の備忘録 FaceNet(顔認識)を動かしてみた - ハードウェア技術者のス…

2019年時点での最強の画像判別ネットワーク「EfficientNet」

論文へのリンク [1905.11946] EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 筆者・所属機関 Mingxing Tan(Google Brain), Quoc V. Le(Google Brain) 投稿日付 2019/05/28 概要(一言まとめ) 2019年時点でState of the artの…

富士フィルムコンペのまとめ

富士フィルムで、写真の撮影された年代を当てるという面白いコンペがあったらしい。 なんと、上位者の商品は、フジフィルムのX100Fだったらしい。めっちゃ良い… FUJIFILM デジタルカメラ X100F シルバー X100F-S発売日: 2017/02/23メディア: エレクトロニク…

高性能なSemantic SegmentationモデルGoogle謹製「DeepLabV3」「DeepLabV3+」

論文へのリンク [1706.05587] Rethinking Atrous Convolution for Semantic Image Segmentation DeepLabV3 [1802.02611] Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation DeepLabV3+ 筆者・所属機関 Liang-Chieh Chen(G…

Image Segmentationのサーベイ論文

論文へのリンク [2001.05566] Image Segmentation Using Deep Learning: A Survey 筆者・所属機関 Shervin Minaee(Expedia Inc, and New York University), Yuri Boykov (University of Waterloo), Fatih Porikli(Australian National University, and Huawe…

Center Lossでディープな顔認識

論文へのリンク A Discriminative Feature Learning Approach for Deep Face Recognition 筆者・所属機関 Yandong Wen (1), Kaipeng Zhang (1), Zhifeng Li (1), and Yu Qiao (1,2) Shenzhen Key Lab of Computer Vision and Pattern Recognition Shenzhen I…

話題のSF小説「三体」読みました

結構昔に読んだきりになっていたので、軽くメモです。 気になったきっかけは以下あたりです。 感想は、面白かったのですが、自分はSFはそこまで得意じゃないかもというしょうもないものでした(笑) 三体作者:劉 慈欣出版社/メーカー: 早川書房発売日: 2019/…

ブラックボックスなディープラーニングを説明する試みは無駄?

論文へのリンク [1811.10154] Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead 筆者・所属機関 Cynthia Rudin(Duke University) 投稿日付 2018/11/26 概要(一言まとめ) 手法の概要 コ…

TensorFlow 2.0関係(一部はそうでもないものも)のメモ

とりあえずメモ TensorFlow Lite Delegateとは? from Mr. Vengineer

CNNの不思議「Deep Image Prior」

論文へのリンク [1711.10925] Deep Image Prior 筆者・所属機関 Dmitry Ulyanov(Skoltech), Andrea Vedaldi(University of Oxford), Victor Lempitsky(Skoltech) 投稿日付 2018/04/05 概要(一言まとめ) CNNモデルに対して、入力をノイズ、出力の教師画像を…

データオーギュメンテーションの決定版?「AUGMIX」

論文へのリンク [1911.06091] EdgeNet: Balancing Accuracy and Performance for Edge-based Convolutional Neural Network Object Detectors 筆者・所属機関 Anonymous authors (匿名でのレビュー中) 投稿日付 2019/11/09 概要(一言まとめ) Data Augmenta…

絵みたいなQRコードを作る

上の図は以下から引用 Generation of Photorealistic QR Codes 今はこんなことまでできちゃうのね。誤り訂正機能を活用しているのかな? 参考サイト MobileHackerz再起動日記: 「真に」デザインされたQRコードのつくりかた ニューラルネットワークでQRコード…

高解像度動画のエッジデバイス用物体検出手法「EdgeNet」

論文へのリンク [1911.06091] EdgeNet: Balancing Accuracy and Performance for Edge-based Convolutional Neural Network Object Detectors 筆者・所属機関 George Plastiras(University of Cyprus), Christos Kyrkou(University of Cyprus), Theocharis T…

ディープラーニングによる物体検出のサーベイ論文 その2

論文へのリンク [1908.03673] Recent Advances in Deep Learning for Object Detection 筆者・所属機関 Xiongwei Wua(School of Information System, Singapore Management University),Doyen Sahooa, Steven C.H. Hoi(School of Information System, Singap…

オートエンコーダを使った異常検知の性能向上

論文へのリンク [1807.02011] Improving Unsupervised Defect Segmentation by Applying Structural Similarity to Autoencoders 筆者・所属機関 Paul Bergmann(MVTec Software GmbH), Sindy Lo ̈we(MVTec Software GmbH / University of Amsterdam) , Micha…

ディープラーニングでブドウの物体検出

論文へのリンク [1907.11819] Grape detection, segmentation and tracking using deep neural networks and three-dimensional association 筆者・所属機関 Thiago T. Santos(Embrapa Agricultural Informatics), Leonardo L. de Souza(University of Campi…

今最も軽くて早いニューラルネット「MobileNetV3」

論文へのリンク [1905.02244] Searching for MobileNetV3 筆者・所属機関 Andrew Howard, Mark Sandler, Grace Chu, Liang-Chieh Chen, Bo Chen, Mingxing Tan, Weijun Wang, Yukun Zhu, Ruoming Pang, Vijay Vasudevan, Quoc V. Le, Hartwig Adam 全員所属…

DeNAのAI研究開発エンジニアによるCVPR 2019のレポート

CVPR 2019 report (30 papers) from ShunsukeNakamura17

GAN関係のリンクまとめ

GAN関係リンク GAN関係の参考になりそうな情報源のまとめ GANはじめに はじめてのGAN MIRU MIRU わかる GAN スライド GAN Lab: Play with Generative Adversarial Networks in Your Browser! 可視化 深層学習の生成モデル パワポの資料 GANsの最新動向: 応用…