からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

Collage Diffusion お弁当箱Diffusion

論文へのリンク [2303.00262] Collage Diffusion 筆者・所属機関 投稿日付 概要(一言まとめ) 手法の概要 コメント 関連情報 次に読む論文 自分なりのアウトプット 気になった英単語・英語表現

MOO

論文へのリンク robot-moo.github.io 筆者・所属機関 投稿日付 概要(一言まとめ) 手法の概要 コメント 関連情報 次に読む論文 自分なりのアウトプット 気になった英単語・英語表現

Transformerを勉強するためのメモ

概要 Transformerを勉強するための情報元。 解説 zenn.dev www.hello-statisticians.com nlpillustration.tech agirobots.com agirobots.com euske.github.io toukei-lab.com gigazine.net isobe324649.hatenablog.com isobe324649.hatenablog.com cvml-expe…

GANで高品質なtext-to-image「Stylegan-t」

論文へのリンク [2301.09515] StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis 筆者・所属機関 Axel Sauer12 Tero Karras2 Samuli Laine2 Andreas Geiger1 Timo Aila2 1 University of Tubingen, T ¨ ubingen AI Cen…

InstructPix2Pix: Learning to Follow Image Editing Instructions

論文へのリンク [2211.09800] InstructPix2Pix: Learning to Follow Image Editing Instructions 筆者・所属機関 Tim Brooks Aleksander Holynski Alexei A. Efros University of California, Berkeley 投稿日付 2022/11/17 概要(一言まとめ) プロジェクト…

Open-Set Grounded Text-to-Image Generation

論文へのリンク [2301.07093] GLIGEN: Open-Set Grounded Text-to-Image Generation 筆者・所属機関 Hao Su, Jianwei Niu, Xuefeng Liu, Qingfeng Li, Jiahe Cui, Ji Wan 全員 Beihang University(北京大学) 投稿日付 2020/04/22 概要(一言まとめ) プロ…

Pretraining is All You Need for Image-to-Image Translation

論文へのリンク [2205.12952] Pretraining is All You Need for Image-to-Image Translation 筆者・所属機関 Tengfei Wang1 , Ting Zhang2, Bo Zhang2, Hao Ouyang1, Dong Chen2, Qifeng Chen1, Fang Wen2 1 The Hong Kong University of Science and Techno…

強化学習のサーベイ論文

論文へのリンク [2211.03959] Pretraining in Deep Reinforcement Learning: A Survey *1 [2301.03044] A Survey on Transformers in Reinforcement Learning *2 筆者・所属機関 投稿日付 2022/11/8 *1 2023/1/8 *2 概要(一言まとめ) サーベイ論文 手法の…

Transformer vs CNN仁義なき戦い

speakerdeck.com (現時点での)結論に草www https://t.co/8GtbOTjca2 pic.twitter.com/Yg2EVjuuB3— からあげ (@karaage0703) 2022年10月23日

ディープラーニング CDLEの動画

なかなか面白い。 CDLE 勉強会 #1 世界初の水質判定AI「DeepLiquid(ディープリキッド)」 具体的な話が少ない?? DeepLiquidでやっていること 水質の認識 からあげを揚げるタイミング認識 イノベーションの話 イノベーションは技術革新でなく新結合 ディー…

ディープラーングの性能はデータ集めて札束で殴り続けると向上し続ける!?「Scaling Law」

論文へのリンク [2001.08361] Scaling Laws for Neural Language Models [2010.14701] Scaling Laws for Autoregressive Generative Modeling 筆者・所属機関 Jared Kaplan(Johns Hopkins University, OpenAI), Sam McCandlish(Open AI), ... Tom Henighan(O…

DataAugmentaionは2回やれ

論文へのリンク [1909.09148] Data Augmentation Revisited: Rethinking the Distribution Gap between Clean and Augmented Data 筆者・所属機関 Zhuoxun He 1 Lingxi Xie 2 Xin Chen 3 Ya Zhang 1 Yanfeng Wang 1 Qi Tian 2 1 Shanghai Jiao Tong Universi…

ニューラルネットワークを用いたRAW現像

論文へのリンク [2101.04442] Joint Demosaicking and Denoising in the Wild: The Case of Training Under Ground Truth Uncertainty 筆者・所属機関 Jierun Chen, Song Wen, S.-H. Gary Chan Department of Computer Science and EngineeringThe Hong Kong…

PFNのSI2020での講演動画「深層学習とロボティクス」

動画 以下は、動画からの引用です。 画像認識 Instance segmentationにより、ロボットがモノを掴めるようになる(PFNのお片付けロボットの場合) 微分可能レンダラー レンダリング結果と目標画像の差をlossとして、バックプロパゲーションしていき、最適化す…

くら寿司がラズパイでエッジAIを活用中

メモ。くら寿司はPepperをやめて、ラズパイにしたのだろうか。 ラズパイ + Google Coralの組み合わせのようだけど、どこらへんにGoogle Coralを使っているのだろう。 QRコードを読み込むだけなら、ラズパイで十分な気がする。他にディープラーニングで画像認…

画像認識にもTransformerの波!?SoTAモデル「ViT」

論文へのリンク An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale | OpenReview 筆者・所属機関 Anonymous authors Paper under double-blind review 目隠しレビュー中のため、著者非公開らしい。でも、きっとFacebookでしょ? …

みんなお馴染みPythonの数値計算ライブラリ「Numpy」の論文

論文へのリンク Array programming with NumPy | Nature 筆者・所属機関 Charles R. Harris(Independent researcher), K. Jarrod Millman(Berkeley) 投稿日付 2020/09/16 概要(一言まとめ) Pythonの数値計算ライブラリとしてお馴染みにのNumpyの論文。なん…

学習済みモデルを使って超速学習

論文へのリンク [2005.14140] Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection 筆者・所属機関 投稿日付 2020/04/22 概要(一言まとめ) 手法の概要 コメント 関連情報 この論文の凄さは、「DNNは学習してい…

深層生成モデルライブラリPixyz

深層生成モデルと世界モデル, 深層生成モデルライブラリPixyzについて TensorFlow User Group Meetup - ベイズ分科会 - connpassでの発表資料 世界モデルというのは、やっていることはもろSLAMっぽいけど、違いがよく分からない。 Pixyzという深層生成モデ…

Attentionのメカニズム

論文へのリンク An Empirical Study of Spatial Attention Mechanisms in Deep Networks [1904.05873] An Empirical Study of Spatial Attention Mechanisms in Deep Networks 筆者・所属機関 Xizhou Zhu1,3, Dazhi Cheng2,3 ,Zheng Zhang3 ,Stephen Lin3 ,J…

double-descentの謎を解明?

論文へのリンク [1912.02292] Deep Double Descent: Where Bigger Models and More Data Hurt 筆者・所属機関 Preetum Nakkiran(Harvard University), Gal Kaplun(Harvard University), Yamini Bansal(Harvard University), Tristan Yang(Harvard University…

CVPR2020メモ

CVPR2020 みつけたものをメモ CVPR2020まとめ CVPR 2020 報告 xpaper.challenge(Hirokatsu KATAOKA) cvpaper. challenge’s Presentations on SlideShare CVPR2020 Report - Speaker Deck CVPR2020サーベイまとめ(一覧) CVPR2020話題 【ボタ山話#13】CVPR20…

技育祭(Geek SAI)まとめ

技育祭とは 内容のアーカイブ 400人以上のインターン生を受け入れ成長させてきたCTOが考える若手エンジニアが成長するコツ / Three Tips for Young Engineers to Grow and Examples of VOYAGE GROUP Practice - Speaker Deck 国内最大級の学生エンジニア向け…

色々なSegmentation

物体検出といえば、Object Detection、Semantic Segmentation, Instance Segmentationだと思っていたのですが、更にPanoptic Segmentationなるものもあるらしいです。 引用元:コンピュータビジョンの最新論文調査 Segmentation 編 · DeNA Engineers' Blog S…

ノイズか?シグナルか?それが問題だ

論文へのリンク [2006.09994] Noise or Signal: The Role of Image Backgrounds in Object Recognition 筆者・所属機関 Kai Xiao, Logan Engstrom, Andrew Ilyas, Aleksander Madry 全員 MIT 投稿日付 2020/06/17 概要(一言まとめ) 物体認識のとき、ニュー…

Tramsformerを取り入れた素早く手軽な物体検出「DETR」

論文へのリンク End-to-End Object Detection with Transformers 筆者・所属機関 Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko 全員 Facebook 投稿日付 2020/05/27 概要(一言まとめ) BERT…

植物の病気判定のデータセット

論文へのリンク [1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection 筆者・所属機関 Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra Indian Institute of Technology Gandhinagar, Gujarat, In…

ディープラーニングの物体検出のサーベイ論文まとめ

物体検出のサーベイ論文 サーベイ論文だけでもたくさんありすぎでは? [1907.09408] A Survey of Deep Learning-based Object Detection [1908.03673] Recent Advances in Deep Learning for Object Detection [1809.02165] Deep Learning for Generic Objec…

NVIDIA GTC2020 Keynoteメモ

GTC2020 新型コロナの影響で今年はオンライン開催。YouTubeで公開されている Part 1: CEO Jensen Huang Introduces Data-Center-Scale Accelerated Computing CEOのKeynote。 最初はCOVID-19の話 NVIDIAの技術の活用例のイメージビデオ Part 2: NVIDIA RTX –…

AIでリアルな音楽生成「Jukebox」

論文へのリンク Jukebox: A Generative Model for Music 筆者・所属機関 Prafulla Dhariwal * 1, Heewoo Jun * 1, Christine Payne * 1, Jong Wook Kim * 1, Alec Radford * 1 ,Ilya Sutskever * 1 1 OpenAI, San Francisco. Correspondence 投稿日付 2020/0…