2023-03-07

Collage Diffusion　お弁当箱Diffusion

論文

論文へのリンク

[2303.00262] Collage Diffusion

筆者・所属機関

投稿日付

概要（一言まとめ）

手法の概要

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

2023-03-07

MOO

論文技術メモ

論文へのリンク

robot-moo.github.io

筆者・所属機関

投稿日付

概要（一言まとめ）

手法の概要

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

2023-02-20

Transformerを勉強するためのメモ

技術メモ

概要

　Transformerを勉強するための情報元。

論文

　おおもとの論文 arxiv.org

　様々なTransformer arxiv.org

blog.brainpad.co.jp

書籍

Vision Transformer入門 Computer Vision Library

作者:山本晋太郎,徳永匡臣,箕浦大晃,邱玥（QIU YUE）,品川政太朗
技術評論社

Amazon

Pythonで学ぶ画像認識機械学習実践シリーズ

作者:田村雅人,中村克行
インプレス

Amazon

karalog.hatenablog.com

zenn.dev

2023-01-25

GANで高品質なtext-to-image「Stylegan-t」

論文

論文へのリンク

[2301.09515] StyleGAN-T: Unlocking the Power of GANs for Fast Large-Scale Text-to-Image Synthesis

筆者・所属機関

Axel Sauer¹² Tero Karras² Samuli Laine² Andreas Geiger¹ Timo Aila²

1 University of Tubingen, T ¨ ubingen AI Center ¨
2 NVIDIA. Correspondence to: Axel Sauer a.sauer@uni-tuebingen.de

投稿日付

2023/01/23

概要（一言まとめ）

GANで高品質なtext-to-imagehttps://t.co/ZtAXenb3oF

拡散モデルよりも非常に高速だぞという主張と、地味に生成画像間の内挿がスムーズにできることをアピールしてますね。GANの論文はお久しぶりなんですが、テキスト情報の使い方に興味があったのでチェックしました（続） pic.twitter.com/ozVqHS9SWS
— mi141 (@mi141) January 25, 2023

プロジェクトページ sites.google.com

手法の概要

次に読む論文

www.microsoft.com

自分なりのアウトプット

気になった英単語・英語表現

2023-01-19

InstructPix2Pix: Learning to Follow Image Editing Instructions

論文へのリンク

[2211.09800] InstructPix2Pix: Learning to Follow Image Editing Instructions

筆者・所属機関

Tim Brooks Aleksander Holynski Alexei A. Efros

University of California, Berkeley

投稿日付

2022/11/17

概要（一言まとめ）

プロジェクトページ

www.timothybrooks.com

人間の指示から数秒で画像編集できる「InstructPix2Pix」のコードが公開！

「ひまわりとバラを交換」「空に花火を追加」「雪が降っていたら？」などを入力すると画像が編集できる

Project: https://t.co/H3iY5qQpXm
code: https://t.co/sZueY6UG4R
demo: https://t.co/8bPVHiWkB3 pic.twitter.com/ox5pUUtOh8
— やまかず (@Yamkaz) January 20, 2023

手法の概要

高性能なPix2Pixを実現するために、Diffusion Modelをファインチューニング。

教師データは、GPT-3、Stable Diffusionを組み合わせて生成。

次に読む論文

自分なりのアウトプット

Instruct Pix2PixのGoogle Colab版があったので試してみた。凄いですが、簡単に細かいところまで思い通りとはなかなかいかないですねhttps://t.co/tQ9Izr5vAw pic.twitter.com/3XEX6wHtZi
— からあげ (@karaage0703) January 21, 2023

学習の考え方は、以下に近い部分があるかも

karaage.hatenadiary.jp

気になった英単語・英語表現

2023-01-19

Open-Set Grounded Text-to-Image Generation

論文へのリンク

[2301.07093] GLIGEN: Open-Set Grounded Text-to-Image Generation

筆者・所属機関

Hao Su, Jianwei Niu, Xuefeng Liu, Qingfeng Li, Jiahe Cui, Ji Wan

全員 Beihang University（北京大学）

投稿日付

2020/04/22

概要（一言まとめ）

プロジェクトページ

物体の位置や説明を条件とした画像生成を、学習済み拡散モデルを活用して実現。条件情報は全てトークン化し、拡散モデルに追加したattention層を介して入力。この層だけfine-tune。https://t.co/11JFTKPA5j

（引用されてないが）PITIに似てるが、条件の入れ方が異なる。https://t.co/e8rVszOxzJ pic.twitter.com/OmREZEOCOt
— mi141 (@mi141) January 19, 2023

手法の概要

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

2023-01-19

Pretraining is All You Need for Image-to-Image Translation

論文へのリンク

[2205.12952] Pretraining is All You Need for Image-to-Image Translation

筆者・所属機関

Tengfei Wang¹ , Ting Zhang², Bo Zhang², Hao Ouyang¹, Dong Chen², Qifeng Chen¹, Fang Wen²

論文へのリンク

筆者・所属機関

投稿日付

概要（一言まとめ）

手法の概要

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

論文へのリンク

筆者・所属機関

投稿日付

概要（一言まとめ）

手法の概要

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

概要

解説

スライド

実装

動画

論文

書籍

関連記事

論文へのリンク

筆者・所属機関

投稿日付

概要（一言まとめ）

手法の概要

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

論文へのリンク

筆者・所属機関

投稿日付

概要（一言まとめ）

手法の概要

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

論文へのリンク

筆者・所属機関

投稿日付

概要（一言まとめ）

手法の概要

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現

論文へのリンク

筆者・所属機関

投稿日付

概要（一言まとめ）

手法の概要

コメント

関連情報

次に読む論文

自分なりのアウトプット

気になった英単語・英語表現