[B! diffusion] lilpacyのブックマーク

lilpacy id:lilpacy

diffusionに関するlilpacyのブックマーク (3)

stablediffusion/ldm/modules/karlo/kakao/modules/unet.py at cf1d67a6fd5ea1aa600c4df58e5b47da45f6bdbf · Stability-AI/stablediffusion
lilpacy 2025/01/09
unet

diffusion
リンク
シンプルなDiffusion Transformerを実装してみる
最近はTransf ormerベースのDiffusionモデル、いわゆるDiT(Diffusion Transf ormer)がUNetベースのDiffusionモデルよりも性能がいいと聞くもののコードレベルで理解ができなったのでMNISTの手書き数字の学習と生成を題材にシンプルなDiTを実装してみる。 (この記事はLLM・LLM活用 Advent Calendar 2024の16日目の記事です！テーマは画像生成ですが、 GPTなどLLMで広く使われているTransf ormerを画像生成に応用したという意味で許してください🙏) 出力比較 UNetベースのシンプルなDiffusionモデルソースコード Transf ormerベースのシンプルなDiffusionモデル(DiT) ソースコード 10epochずつ学習させてみたが精度が出る学習率も違うし、どの段階で比較すればいいかがわからなかっ
lilpacy 2024/12/17
書きました。

dit

vit

diffusion

transformer
リンク
Scalable Diffusion Models with Transformers - Qiita
1. 概要トランスフォーマーを用いた拡散モデル(Diffusion Models with Transf ormers)の新しいアーキテクチャを提案している。通常はU-Netをバックボーンとして使用し潜在空間でパッチ毎にトランスフォーマーで演算をするが、この部分をシーケンスに変換するDiffution Transf ormers Block(DiT-block)を新たに提案しており、従来手法と比べて潜在空間上で高い表現力を獲得できるようにした。ImageNet512/256のベンチマークで従来の拡散モデルよりも高精度な2.27のFIDを達成している。 2. 新規性 Diffusion Transf ormers(DiT, 拡散トランスフォーマー)を提案しており、通常IxIxCで構成されるパッチをT=(I/p)^2の長さのシーケンスにシェイプ変換するDiT Blockを挿入することで、小さなパッ
lilpacy 2024/07/23
>ImageNet512/256のベンチマークで従来の拡散モデルよりも高精度な2.27のFIDを達成している

ai

diffusion

transformer
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx