Collage Diffusion　お弁当箱Diffusion

論文

論文へのリンク [2303.00262] Collage Diffusion 筆者・所属機関投稿日付概要（一言まとめ）手法の概要コメント関連情報次に読む論文自分なりのアウトプット気になった英単語・英語表現

2023-03-07

MOO

論文技術メモ

論文へのリンク robot-moo.github.io 筆者・所属機関投稿日付概要（一言まとめ）手法の概要コメント関連情報次に読む論文自分なりのアウトプット気になった英単語・英語表現

2023-02-20

Transformerを勉強するためのメモ

技術メモ

概要 Transformerを勉強するための情報元。解説 zenn.dev www.hello-statisticians.com nlpillustration.tech agirobots.com agirobots.com euske.github.io toukei-lab.com gigazine.net isobe324649.hatenablog.com isobe324649.hatenablog.com cvml-expe…

2023-01-25

GANで高品質なtext-to-image「Stylegan-t」

論文

論文へのリンク [2301.09515] StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis 筆者・所属機関 Axel Sauer12 Tero Karras2 Samuli Laine2 Andreas Geiger1 Timo Aila2 1 University of Tubingen, T ¨ ubingen AI Cen…

2023-01-19

InstructPix2Pix: Learning to Follow Image Editing Instructions

論文へのリンク [2211.09800] InstructPix2Pix: Learning to Follow Image Editing Instructions 筆者・所属機関 Tim Brooks Aleksander Holynski Alexei A. Efros University of California, Berkeley 投稿日付 2022/11/17 概要（一言まとめ）プロジェクト…

2023-01-19

Open-Set Grounded Text-to-Image Generation

論文へのリンク [2301.07093] GLIGEN: Open-Set Grounded Text-to-Image Generation 筆者・所属機関 Hao Su, Jianwei Niu, Xuefeng Liu, Qingfeng Li, Jiahe Cui, Ji Wan 全員 Beihang University（北京大学）投稿日付 2020/04/22 概要（一言まとめ）プロ…

2023-01-19

Pretraining is All You Need for Image-to-Image Translation

論文へのリンク [2205.12952] Pretraining is All You Need for Image-to-Image Translation 筆者・所属機関 Tengfei Wang1 , Ting Zhang2, Bo Zhang2, Hao Ouyang1, Dong Chen2, Qifeng Chen1, Fang Wen2 1 The Hong Kong University of Science and Techno…

2023-01-17

強化学習のサーベイ論文

論文

論文へのリンク [2211.03959] Pretraining in Deep Reinforcement Learning: A Survey *1 [2301.03044] A Survey on Transformers in Reinforcement Learning *2 筆者・所属機関投稿日付 2022/11/8 *1 2023/1/8 *2 概要（一言まとめ）サーベイ論文手法の…

2022-10-23

Transformer vs CNN仁義なき戦い

技術メモ

speakerdeck.com （現時点での）結論に草www https://t.co/8GtbOTjca2 pic.twitter.com/Yg2EVjuuB3— からあげ (@karaage0703) 2022年10月23日

2021-04-08

ディープラーニング CDLEの動画

技術メモ

なかなか面白い。 CDLE 勉強会 #1 世界初の水質判定AI「DeepLiquid（ディープリキッド）」具体的な話が少ない？？ DeepLiquidでやっていること水質の認識からあげを揚げるタイミング認識イノベーションの話イノベーションは技術革新でなく新結合ディー…

2021-01-30

ディープラーングの性能はデータ集めて札束で殴り続けると向上し続ける！？「Scaling Law」

論文

論文へのリンク [2001.08361] Scaling Laws for Neural Language Models [2010.14701] Scaling Laws for Autoregressive Generative Modeling 筆者・所属機関 Jared Kaplan(Johns Hopkins University, OpenAI), Sam McCandlish(Open AI), ... Tom Henighan(O…

2021-01-30

DataAugmentaionは2回やれ

論文

論文へのリンク [1909.09148] Data Augmentation Revisited: Rethinking the Distribution Gap between Clean and Augmented Data 筆者・所属機関 Zhuoxun He 1 Lingxi Xie 2 Xin Chen 3 Ya Zhang 1 Yanfeng Wang 1 Qi Tian 2 1 Shanghai Jiao Tong Universi…

2021-01-30

ニューラルネットワークを用いたRAW現像

論文

論文へのリンク [2101.04442] Joint Demosaicking and Denoising in the Wild: The Case of Training Under Ground Truth Uncertainty 筆者・所属機関 Jierun Chen, Song Wen, S.-H. Gary Chan Department of Computer Science and EngineeringThe Hong Kong…

2021-01-06

PFNのSI2020での講演動画「深層学習とロボティクス」

技術メモ

動画以下は、動画からの引用です。画像認識 Instance segmentationにより、ロボットがモノを掴めるようになる（PFNのお片付けロボットの場合）微分可能レンダラーレンダリング結果と目標画像の差をlossとして、バックプロパゲーションしていき、最適化す…

2020-11-02

くら寿司がラズパイでエッジAIを活用中

技術メモ

メモ。くら寿司はPepperをやめて、ラズパイにしたのだろうか。ラズパイ + Google Coralの組み合わせのようだけど、どこらへんにGoogle Coralを使っているのだろう。 QRコードを読み込むだけなら、ラズパイで十分な気がする。他にディープラーニングで画像認…

2020-10-13

画像認識にもTransformerの波！？SoTAモデル「ViT」

論文

論文へのリンク An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale | OpenReview 筆者・所属機関 Anonymous authors Paper under double-blind review 目隠しレビュー中のため、著者非公開らしい。でも、きっとFacebookでしょ？ …

2020-09-21

みんなお馴染みPythonの数値計算ライブラリ「Numpy」の論文

論文

論文へのリンク Array programming with NumPy | Nature 筆者・所属機関 Charles R. Harris(Independent researcher), K. Jarrod Millman(Berkeley) 投稿日付 2020/09/16 概要（一言まとめ） Pythonの数値計算ライブラリとしてお馴染みにのNumpyの論文。なん…

2020-09-21

学習済みモデルを使って超速学習

論文

論文へのリンク [2005.14140] Modeling the Distribution of Normal Data in Pre-Trained Deep Features for Anomaly Detection 筆者・所属機関投稿日付 2020/04/22 概要（一言まとめ）手法の概要コメント関連情報この論文の凄さは、「DNNは学習してい…

2020-09-08

深層生成モデルライブラリPixyz

技術メモ

深層生成モデルと世界モデル，深層生成モデルライブラリPixyzについて TensorFlow User Group Meetup - ベイズ分科会 - connpassでの発表資料世界モデルというのは、やっていることはもろSLAMっぽいけど、違いがよく分からない。 Pixyzという深層生成モデ…

2020-09-02

Attentionのメカニズム

論文

論文へのリンク An Empirical Study of Spatial Attention Mechanisms in Deep Networks [1904.05873] An Empirical Study of Spatial Attention Mechanisms in Deep Networks 筆者・所属機関 Xizhou Zhu1,3, Dazhi Cheng2,3 ,Zheng Zhang3 ,Stephen Lin3 ,J…

2020-07-28

double-descentの謎を解明？

論文

論文へのリンク [1912.02292] Deep Double Descent: Where Bigger Models and More Data Hurt 筆者・所属機関 Preetum Nakkiran(Harvard University), Gal Kaplun(Harvard University), Yamini Bansal(Harvard University), Tristan Yang(Harvard University…

2020-07-17

CVPR2020メモ

技術メモ

CVPR2020 みつけたものをメモ CVPR2020まとめ CVPR 2020 報告 xpaper.challenge(Hirokatsu KATAOKA) cvpaper. challenge’s Presentations on SlideShare CVPR2020 Report - Speaker Deck CVPR2020サーベイまとめ（一覧） CVPR2020話題【ボタ山話#13】CVPR20…

2020-07-13

技育祭（Geek SAI）まとめ

技術メモ

技育祭とは内容のアーカイブ 400人以上のインターン生を受け入れ成長させてきたCTOが考える若手エンジニアが成長するコツ / Three Tips for Young Engineers to Grow and Examples of VOYAGE GROUP Practice - Speaker Deck 国内最大級の学生エンジニア向け…

2020-07-13

色々なSegmentation

技術メモ

物体検出といえば、Object Detection、Semantic Segmentation, Instance Segmentationだと思っていたのですが、更にPanoptic Segmentationなるものもあるらしいです。引用元：コンピュータビジョンの最新論文調査 Segmentation 編 · DeNA Engineers' Blog S…

2020-06-29

ノイズか？シグナルか？それが問題だ

論文

論文へのリンク [2006.09994] Noise or Signal: The Role of Image Backgrounds in Object Recognition 筆者・所属機関 Kai Xiao, Logan Engstrom, Andrew Ilyas, Aleksander Madry 全員 MIT 投稿日付 2020/06/17 概要（一言まとめ）物体認識のとき、ニュー…

2020-06-10

Tramsformerを取り入れた素早く手軽な物体検出「DETR」

論文

論文へのリンク End-to-End Object Detection with Transformers 筆者・所属機関 Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko 全員 Facebook 投稿日付 2020/05/27 概要（一言まとめ） BERT…

2020-05-26

植物の病気判定のデータセット

論文

論文へのリンク [1911.10317] PlantDoc: A Dataset for Visual Plant Disease Detection 筆者・所属機関 Davinder Singh, Naman Jain, Pranjali Jain, Pratik Kayal Sudhakar Kumawat, Nipun Batra Indian Institute of Technology Gandhinagar, Gujarat, In…

2020-05-18

ディープラーニングの物体検出のサーベイ論文まとめ

論文

物体検出のサーベイ論文サーベイ論文だけでもたくさんありすぎでは？ [1907.09408] A Survey of Deep Learning-based Object Detection [1908.03673] Recent Advances in Deep Learning for Object Detection [1809.02165] Deep Learning for Generic Objec…

2020-05-15

NVIDIA GTC2020 Keynoteメモ

GTC2020 新型コロナの影響で今年はオンライン開催。YouTubeで公開されている Part 1: CEO Jensen Huang Introduces Data-Center-Scale Accelerated Computing CEOのKeynote。最初はCOVID-19の話 NVIDIAの技術の活用例のイメージビデオ Part 2: NVIDIA RTX –…

2020-05-03

AIでリアルな音楽生成「Jukebox」

論文

論文へのリンク Jukebox: A Generative Model for Music 筆者・所属機関 Prafulla Dhariwal * 1, Heewoo Jun * 1, Christine Payne * 1, Jong Wook Kim * 1, Alec Radford * 1 ,Ilya Sutskever * 1 1 OpenAI, San Francisco. Correspondence 投稿日付 2020/0…

からログ

からあげが鳥並の頭で学んだことを記録する場所だよ

Collage Diffusion　お弁当箱Diffusion

MOO

Transformerを勉強するためのメモ

GANで高品質なtext-to-image「Stylegan-t」

InstructPix2Pix: Learning to Follow Image Editing Instructions

Open-Set Grounded Text-to-Image Generation

Pretraining is All You Need for Image-to-Image Translation

強化学習のサーベイ論文

Transformer vs CNN仁義なき戦い

ディープラーニング CDLEの動画

ディープラーングの性能はデータ集めて札束で殴り続けると向上し続ける！？「Scaling Law」

DataAugmentaionは2回やれ

ニューラルネットワークを用いたRAW現像

PFNのSI2020での講演動画「深層学習とロボティクス」

くら寿司がラズパイでエッジAIを活用中

画像認識にもTransformerの波！？SoTAモデル「ViT」

みんなお馴染みPythonの数値計算ライブラリ「Numpy」の論文

学習済みモデルを使って超速学習

深層生成モデルライブラリPixyz

Attentionのメカニズム

double-descentの謎を解明？

CVPR2020メモ

技育祭（Geek SAI）まとめ

色々なSegmentation

ノイズか？シグナルか？それが問題だ

Tramsformerを取り入れた素早く手軽な物体検出「DETR」

植物の病気判定のデータセット

ディープラーニングの物体検出のサーベイ論文まとめ

NVIDIA GTC2020 Keynoteメモ

AIでリアルな音楽生成「Jukebox」