論文へのリンク
[2301.07093] GLIGEN: Open-Set Grounded Text-to-Image Generation
筆者・所属機関
Hao Su, Jianwei Niu, Xuefeng Liu, Qingfeng Li, Jiahe Cui, Ji Wan
全員 Beihang University(北京大学)
投稿日付
2020/04/22
概要(一言まとめ)
プロジェクトページ
物体の位置や説明を条件とした画像生成を、学習済み拡散モデルを活用して実現。条件情報は全てトークン化し、拡散モデルに追加したattention層を介して入力。この層だけfine-tune。https://t.co/11JFTKPA5j
— mi141 (@mi141) January 19, 2023
(引用されてないが)PITIに似てるが、条件の入れ方が異なる。https://t.co/e8rVszOxzJ pic.twitter.com/OmREZEOCOt