からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

ディープラーニング CDLEの動画

なかなか面白い。 CDLE 勉強会 #1 世界初の水質判定AI「DeepLiquid(ディープリキッド)」 具体的な話が少ない?? DeepLiquidでやっていること 水質の認識 からあげを揚げるタイミング認識 イノベーションの話 イノベーションは技術革新でなく新結合 ディー…

ディープラーングの性能はデータ集めて札束で殴り続けると向上し続ける!?「Scaling Law」

論文へのリンク [2001.08361] Scaling Laws for Neural Language Models [2010.14701] Scaling Laws for Autoregressive Generative Modeling 筆者・所属機関 Jared Kaplan(Johns Hopkins University, OpenAI), Sam McCandlish(Open AI), ... Tom Henighan(O…

DataAugmentaionは2回やれ

論文へのリンク [1909.09148] Data Augmentation Revisited: Rethinking the Distribution Gap between Clean and Augmented Data 筆者・所属機関 Zhuoxun He 1 Lingxi Xie 2 Xin Chen 3 Ya Zhang 1 Yanfeng Wang 1 Qi Tian 2 1 Shanghai Jiao Tong Universi…

ニューラルネットワークを用いたRAW現像

論文へのリンク [2101.04442] Joint Demosaicking and Denoising in the Wild: The Case of Training Under Ground Truth Uncertainty 筆者・所属機関 Jierun Chen, Song Wen, S.-H. Gary Chan Department of Computer Science and EngineeringThe Hong Kong…

PFNのSI2020での講演動画「深層学習とロボティクス」

動画 以下は、動画からの引用です。 画像認識 Instance segmentationにより、ロボットがモノを掴めるようになる(PFNのお片付けロボットの場合) 微分可能レンダラー レンダリング結果と目標画像の差をlossとして、バックプロパゲーションしていき、最適化す…

くら寿司がラズパイでエッジAIを活用中

メモ。くら寿司はPepperをやめて、ラズパイにしたのだろうか。 ラズパイ + Google Coralの組み合わせのようだけど、どこらへんにGoogle Coralを使っているのだろう。 QRコードを読み込むだけなら、ラズパイで十分な気がする。他にディープラーニングで画像認…

画像認識にもTransformerの波!?SoTAモデル「ViT」

論文へのリンク An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale | OpenReview 筆者・所属機関 Anonymous authors Paper under double-blind review 目隠しレビュー中のため、著者非公開らしい。でも、きっとFacebookでしょ? …

みんなお馴染みPythonの数値計算ライブラリ「Numpy」の論文

論文へのリンク Array programming with NumPy | Nature 筆者・所属機関 Charles R. Harris(Independent researcher), K. Jarrod Millman(Berkeley) 投稿日付 2020/09/16 概要(一言まとめ) Pythonの数値計算ライブラリとしてお馴染みにのNumpyの論文。なん…

学習済みモデルを使って超速学習

論文へのリンク [2005.14140] Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection 筆者・所属機関 投稿日付 2020/04/22 概要(一言まとめ) 手法の概要 コメント 関連情報 この論文の凄さは、「DNNは学習してい…

深層生成モデルライブラリPixyz

深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて TensorFlow User Group Meetup - ベイズ分科会 - connpassでの発表資料 世界モデルというのは、やっていることはもろSLAMっぽいけど、違いがよく分からない。 Pixyzという深層生成モデ…

Attentionのメカニズム

論文へのリンク An Empirical Study of Spatial Attention Mechanisms in Deep Networks [1904.05873] An Empirical Study of Spatial Attention Mechanisms in Deep Networks 筆者・所属機関 Xizhou Zhu1,3, Dazhi Cheng2,3 ,Zheng Zhang3 ,Stephen Lin3 ,J…

double-descentの謎を解明?

論文へのリンク [1912.02292] Deep Double Descent: Where Bigger Models and More Data Hurt 筆者・所属機関 Preetum Nakkiran(Harvard University), Gal Kaplun(Harvard University), Yamini Bansal(Harvard University), Tristan Yang(Harvard University…

CVPR2020メモ

CVPR2020 みつけたものをメモ CVPR2020まとめ CVPR 2020 報告 xpaper.challenge(Hirokatsu KATAOKA) cvpaper. challenge’s Presentations on SlideShare CVPR2020 Report - Speaker Deck CVPR2020サーベイまとめ(一覧) CVPR2020話題 【ボタ山話#13】CVPR20…

技育祭(Geek SAI)まとめ

技育祭とは 内容のアーカイブ 400人以上のインターン生を受け入れ成長させてきたCTOが考える若手エンジニアが成長するコツ / Three Tips for Young Engineers to Grow and Examples of VOYAGE GROUP Practice - Speaker Deck 国内最大級の学生エンジニア向け…

色々なSegmentation

物体検出といえば、Object Detection、Semantic Segmentation, Instance Segmentationだと思っていたのですが、更にPanoptic Segmentationなるものもあるらしいです。 引用元:コンピュータビジョンの最新論文調査 Segmentation 編 · DeNA Engineers' Blog S…

ノイズか?シグナルか?それが問題だ

論文へのリンク [2006.09994] Noise or Signal: The Role of Image Backgrounds in Object Recognition 筆者・所属機関 Kai Xiao, Logan Engstrom, Andrew Ilyas, Aleksander Madry 全員 MIT 投稿日付 2020/06/17 概要(一言まとめ) 物体認識のとき、ニュー…

Tramsformerを取り入れた素早く手軽な物体検出「DETR」

論文へのリンク End-to-End Object Detection with Transformers 筆者・所属機関 Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko 全員 Facebook 投稿日付 2020/05/27 概要(一言まとめ) BERT…

植物の病気判定のデータセット

論文へのリンク [1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection 筆者・所属機関 Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra Indian Institute of Technology Gandhinagar, Gujarat, In…

ディープラーニングの物体検出のサーベイ論文まとめ

物体検出のサーベイ論文 サーベイ論文だけでもたくさんありすぎでは? [1907.09408] A Survey of Deep Learning-based Object Detection [1908.03673] Recent Advances in Deep Learning for Object Detection [1809.02165] Deep Learning for Generic Objec…

NVIDIA GTC2020 Keynoteメモ

GTC2020 新型コロナの影響で今年はオンライン開催。YouTubeで公開されている Part 1: CEO Jensen Huang Introduces Data-Center-Scale Accelerated Computing CEOのKeynote。 最初はCOVID-19の話 NVIDIAの技術の活用例のイメージビデオ Part 2: NVIDIA RTX –…

AIでリアルな音楽生成「Jukebox」

論文へのリンク Jukebox: A Generative Model for Music 筆者・所属機関 Prafulla Dhariwal * 1, Heewoo Jun * 1, Christine Payne * 1, Jong Wook Kim * 1, Alec Radford * 1 ,Ilya Sutskever * 1 1 OpenAI, San Francisco. Correspondence 投稿日付 2020/0…

中学生・高校生のための人工知能の教養講座(YouTubeリンク)

そもそもコンピューターは知能の大体を目的として作られた。人工知能のつくるためのもの コンパイラは翻訳機。プログライング言語からマシン語への変換 人間の使う言語から言語の変換(翻訳)は難しい

強化学習のメモ

何かに使いたいと思いながら、何にもできていない強化学習。個人的なメモをまとめておいて一回封印します。 まとめ的なリンク 自分が読んだ強化学習の資料達 - 下町データサイエンティストの日常 GitHub - komi1230/Resume 深層強化学習の最前線 - Speaker D…

参考文献は少年ジャンプ「Deep Bleach」と話題の「MangaGAN」

論文へのリンク [2004.10634] Unpaired Photo-to-manga Translation Based on The Methodology of Manga Drawing 筆者・所属機関 Hao Su, Jianwei Niu, Xuefeng Liu, Qingfeng Li, Jiahe Cui, Ji Wan 全員 Beihang University(北京大学) 投稿日付 2020/04/…

Dysonの開発したディープラーニングを活用した革新的なリアルタイムSLAM技術「DeepFactors」

論文へのリンク [2001.05049] DeepFactors: Real-Time Probabilistic Dense Monocular SLAM 筆者・所属機関 Jan Czarnowski, Tristan Laidlow, Ronald Clark, and Andrew J. Davison 全員所属はDyson Robotics Laboratory, Imperial College London 注:Dyso…

RGB-D画像から3D画像生成

論文へのリンク 3D Photography using Context-aware Layered Depth Inpainting(Google Drive) [2004.04727] 3D Photography using Context-aware Layered Depth Inpainting 筆者・所属機関 Meng-Li Shih(Virginia Tech, National Tsing Hua University), Sh…

偽のLiDAR?「Pseudo-LiDAR」

論文へのリンク [1812.07179] Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving [1906.06310] Pseudo-LiDAR++: Accurate Depth for 3D Object Detection in Autonomous Driving 筆者・所属機関 …

混ぜたら精度アップ?不思議なData Augmentation手法「Mixup」

論文へのリンク [1710.09412] mixup: Beyond Empirical Risk Minimization mixup: Beyond Empirical Risk Minimization 筆者・所属機関 Hongyi Zhang(MIT), Moustapha Cisse(FAIR), Yann N. Dauphin(FAIR), David Lopez-Paz(FAIR) 投稿日付 2017/10/25 概要…

深層距離学習のメモ

個人的メモ。いつかちゃんとまとめる。 モダンな深層距離学習 (deep metric learning) 手法: SphereFace, CosFace, ArcFace - Qiita scikit-learn-contrib の Metric Learning を試す - u++の備忘録 FaceNet(顔認識)を動かしてみた - ハードウェア技術者のス…

2019年時点での最強の画像判別ネットワーク「EfficientNet」

論文へのリンク [1905.11946] EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 筆者・所属機関 Mingxing Tan(Google Brain), Quoc V. Le(Google Brain) 投稿日付 2019/05/28 概要(一言まとめ) 2019年時点でState of the artの…