- ComfyUI を使用すると、Stable Diffusion のための柔軟で再現可能なビジュアル フローを構築できます。
- 主要ノードを使用して、テキストから画像への変換、i2i、SDXL、イン/アウトペインティング、アップスケール、ControlNet を習得します。
- 埋め込み、LoRA、カスタム ノードで強化し、マネージャーを使用してそれらを管理します。
- ベスト プラクティス、ショートカット、トラブルシューティングを使用して、パフォーマンスと安定性を最適化します。
¿初心者のための究極の ComfyUI ガイド? ComfyUI を初めて使用する場合、ノード、ボックス、ケーブルの多さに圧倒されても心配しないでください。ここでは、最初から重要な部分を省略しない、本物のガイドが見つかります。 目標は、各部分が何をするのか、それらがどのように組み合わさるのか、よくある間違いをどのように解決するのかを理解することです。 実験だけで学ぼうとするとイライラしてしまいます。
古典的なテキストから画像、画像から画像、インペインティング、アウトペインティング、SDXL、アップスケーリング、ControlNet、埋め込み、LoRAワークフローに加えて、インストール、構成、 管理者によるカスタムノード管理ショートカットと、CPUとGPUの実際のパフォーマンスに関する推奨事項を含む実践的なセクション。そしてもちろん、以下の内容も取り上げます… Wan 2.1タイプのモデルを使用してビデオを操作する方法 (テキストからビデオ、画像からビデオ、ビデオからビデオ) を ComfyUI エコシステム内で実現します。
ComfyUI とは何ですか? 他の GUI と比べてどうですか?
ComfyUIは、ノードベースのビジュアルインターフェースで、 安定拡散 機能ブロックを接続してワークフローを設定できます。 各ノードは特定のタスク(モデルのロード、テキストのエンコード、サンプル、デコード)を実行します。 そして、エッジは、まるで視覚的なレシピを組み立てているかのように、入口と出口を結び付けます。
AUTOMATIC1111と比較すると、ComfyUIは 軽量、柔軟、透明性があり、共有も非常に簡単 (各ワークフローファイルは再現可能です)。欠点は、ワークフローの作成者によってインターフェースが異なる場合があり、一般ユーザーにとっては、 これほど詳しく説明すると過剰と思われるかもしれません。.
ノードの背後にある「理由」を理解すると、学習曲線はスムーズになります。 ComfyUIは、画像の完全なパスが表示されるダッシュボードと考えてください。: 潜在的な形式の最初のテキストとノイズから、最終的なピクセルへのデコードまで。
最初からインストール:迅速かつ手間いらず
最も直接的な方法は、システムの公式パッケージをダウンロードし、解凍して実行することです。 Python は組み込まれているため、別途インストールする必要はありません。これにより、初期の摩擦が大幅に軽減されます。
基本的な手順: 圧縮ファイルをダウンロードし、解凍し (たとえば、7-Zip を使用)、適切なランチャーを実行します。 GPU がない場合、またはグラフィック カードに互換性がない場合は、CPU 実行可能ファイルを使用します。時間はかかりますが、機能します。
すべてを開始するには、チェックポイント フォルダーに少なくとも 1 つのモデルを配置します。 Hugging FaceやCivitaiなどのリポジトリから入手できます。 それらを ComfyUI モデル パスに配置します。
他のフォルダーにモデル ライブラリが既にある場合は、名前から「example」を削除し、場所を追加して、追加パス ファイル (extra_model_paths.yaml) を編集します。 新しいディレクトリを検出するためにComfyUIを再起動します。.
基本的なコントロールとインターフェース要素
キャンバス上では、マウスホイールまたはピンチジェスチャでズームを制御し、左ボタンでドラッグしてスクロールします。 ノードを接続するには、出力コネクタから入力コネクタまでドラッグします。、放してエッジを作成します。
ComfyUI は実行キューを管理します。ワークフローを構成してキュー ボタンを押します。 キュー ビューからステータスをチェックして、何が実行中か確認できます。 または何を期待しているか。
便利なショートカット: Ctrl+C/Ctrl+V でノードのコピー/貼り付け、Ctrl+Shift+V でエントリを維持しながら貼り付け、Ctrl+Enter でキューに追加、Ctrl+M でノードをミュートします。 左上隅のドットをクリックすると、ノードが最小化され、キャンバスがクリアされます。.
テキストから画像へ:基本的な流れ
最小限のフローは、チェックポイントの読み込み、CLIP による肯定的および否定的なプロンプトのエンコード、空の潜在画像の作成、KSampler によるサンプリング、VAE によるピクセルへのデコードで構成されます。 キューボタンを押すと最初の画像が表示されます.
ロードチェックポイントでモデルを選択する
ロード チェックポイント ノードは、MODEL (ノイズ予測子)、CLIP (テキスト エンコーダー)、VAE (画像エンコーダー/デコーダー) の 3 つのコンポーネントを返します。 MODEL は KSampler に、CLIP はテキスト ノードに、VAE はデコーダーに送られます。.
CLIP Text Encodeによる肯定的および否定的なプロンプト
上に肯定的なプロンプトを入力し、下に否定的なプロンプトを入力します。両方とも埋め込みとしてエンコードされます。 構文 (word:1.2) または (word:0.8) で単語に重みを付けることができます。 特定の用語を強めたり和らげたりすること。
潜在空隙と最適なサイズ
空の潜在画像は潜在空間内のキャンバスを定義します。 SD 1.5 の場合は 512×512 または 768×768 が推奨されます。SDXL の場合は 1024×1024 が推奨されます。エラーを回避し、アーキテクチャを尊重するには、幅と高さは 8 の倍数にする必要があります。
VAE: 潜在からピクセルへ
VAEは画像を潜在値に圧縮し、それをピクセルに再構成します。テキストから画像への変換では、通常、最後に潜在値をデコードするためにのみ使用されます。 圧縮はプロセスを高速化するが、小さな損失が生じる可能性がある。その代わりに、潜在空間での細かい制御が可能になります。
KSamplerとキーパラメータ
KSampler は、埋め込みガイドに従ってノイズを除去するために逆拡散を適用します。 シード、ステップ、サンプラー、スケジューラー、ノイズ除去 これらがメインのダイヤルです。ステップ数を増やすと通常はより詳細な情報が得られ、denoise=1 にすると元のノイズが完全に書き換えられます。
画像ごとに:ガイド付きでやり直す
i2i フローは入力画像とプロンプトから始まり、ノイズ除去によって元の画像からどれだけ逸脱するかを制御します。 ノイズ除去を低くすると微妙な変化が得られ、ノイズ除去を高くすると大きな変化が得られます。.
一般的なシーケンス: チェックポイントを選択し、イメージを入力として読み込み、プロンプトを調整し、KSampler でノイズ除去を定義してキューに追加します。 最初からやり直すことなく、構成を改善したり、スタイルを移行したりするのに最適です。.
ComfyUI 上の SDXL
ComfyUIはモジュール設計により、SDXLの早期サポートを提供しています。SDXL対応のフローを使用し、プロンプトを確認して実行するだけです。 注意: ネイティブ サイズが大きいほど、より多くの VRAM と処理時間が必要になります。しかし、細部の質的飛躍がそれを補っています。
インペインティング:興味のある部分だけを編集する
画像の特定の領域を修正したい場合は、インペインティングというツールを使うのが最適です。画像を読み込み、マスクエディタを開き、再生成したい部分をペイントして、対応するノードに保存します。 編集をガイドし、ノイズ除去を調整するためのプロンプトを定義します(例:0.6).
標準モデルを使用する場合、VAE Encode および Set Noise Latent Mask で動作します。 専用のインペインティングモデルの場合は、それらのノードをVAE Encode(インペインティング)に置き換えます。、そのタスクに最適化されています。
アウトペインティング:キャンバスの端を拡大する
画像を境界を超えて拡大するには、アウトペイント用のパディング ノードを追加し、各辺の拡大量を設定します。 フェザリングパラメータは、オリジナルと拡張の間の遷移を滑らかにします.
アウトペインティング フローで、VAE エンコード (インペインティング用) と grow_mask_by パラメータを調整します。 10より大きい値は通常より自然な統合を実現します 拡大したエリア内。
ComfyUIのアップスケール:ピクセルと潜在
方法は 2 つあります。ピクセル アップスケーリング (高速、新しい情報を追加しない) と、スケーリング時に詳細を再解釈する潜在アップスケーリング (Hi-res Latent Fix とも呼ばれる) です。 1つ目は高速で、2つ目はテクスチャを豊かにするが、逸脱する可能性がある.
アルゴリズムベースのアップスケーリング(ピクセル)
方法による再スケーリング ノードでは、双三次法、双一次法、または最も近い正確な方法とスケール係数を選択できます。 プレビューやスピードが必要な場合に最適です。 推論コストを追加せずに。
モデル(ピクセル)で拡大
Load Upscale Model と対応するアップスケール ノードを使用して、適切なモデル (リアルやアニメなど) を選択し、×2 または ×4 を選択します。 特殊モデルは従来のアルゴリズムよりも輪郭と鮮明度を良好に回復します.
潜在的に高級
潜在変数をスケーリングし、KSampler を使用して再サンプリングして、プロンプトと一致する詳細を追加します。 速度は遅いですが、解像度と視覚的な複雑さを高めたい場合に特に便利です。.
ControlNet: 高度な構造ガイド
ControlNet を使用すると、参照マップ (エッジ、ポーズ、深度、セグメンテーション) を挿入して構成をガイドできます。 安定拡散と組み合わせることで、構造を細かく制御できます モデルの創造性を犠牲にすることなく。
ComfyUI では、統合はモジュール式です。必要なマップを読み込み、それを ControlNet ブロックに接続し、サンプラーにリンクします。 さまざまなコントローラーを試してみて、自分のスタイルや目的に合ったものを見つけてください。.
ComfyUI 管理者: ターミナルレスカスタムノード
マネージャーを使用すると、インターフェースからカスタムノードをインストールおよび更新できます。キューメニューにあります。 ノードエコシステムを最新の状態に保つ最も簡単な方法です.
不足しているノードをインストールする
ワークフローでノードが見つからないという警告が表示された場合は、マネージャーを開いて「不足しているノードをインストール」をクリックし、ComfyUI を再起動して、ブラウザを更新します。 これにより、数回のクリックでほとんどの依存関係が解決されます。.
カスタムノードを更新する
マネージャーから、更新を確認してインストールし、利用可能な各パッケージの更新ボタンをクリックします。 変更を適用するには、ComfyUI を再起動します。 矛盾を避けます。
フローにノードをロードする
空の領域をダブルクリックしてノードファインダーを開き、必要なノードの名前を入力します。 これは、図に新しいピースを素早く挿入する方法です.
埋め込み(テキスト反転)
埋め込みは、キーワード embedding:name を使用して、トレーニングされた概念またはスタイルをプロンプトに挿入します。 ComfyUI が検出できるように、ファイルを models/embeddings フォルダーに配置します。.
カスタム スクリプト パッケージをインストールすると、オートコンプリート機能が有効になります。「embedding:」と入力すると、使用可能なリストが表示されます。 これにより、多数のテンプレートを管理する際の反復処理が大幅に高速化されます。.
また、重み付けすることもできます。たとえば、(embedding:Name:1.2) とすると、20% 強化されます。 通常のプロンプト用語と同じように重みを調整します スタイルと内容のバランスをとるため。
LoRA: VAE に触れることなくスタイルを適応させる
LoRA は、VAE を変更せずに、チェックポイントの MODEL および CLIP コンポーネントを変更します。 特定のスタイル、文字、またはオブジェクトを挿入するために使用されます 軽量で共有しやすいファイルです。
基本的なフロー: 基本チェックポイントを選択し、1 つ以上の LoRA を追加して生成します。 LoRA を積み重ねて、美観と効果を組み合わせることができます。ワークフローで許可されている場合は、強度を調整します。
ショートカット、トリック、埋め込みワークフロー
説明したショートカットに加えて、非常に実用的なヒントが 2 つあります。離れたノードを調整するときにシード値を修正してチェーン全体の再計算を回避することと、グループを使用して複数のノードを一度に移動することです。 Ctrl キーを押しながらドラッグすると複数の項目を選択でき、Shift キーを押すとグループを移動できます。.
もう一つの重要な機能: ComfyUI は、生成した PNG のメタデータにワークフローを保存します。 PNGをキャンバスにドラッグすると、ワンクリックで図全体を取得できます。これにより、結果の共有と再現が容易になります。
ComfyUIオンライン:インストールせずに作成

何もインストールしたくない場合は、ComfyUI が事前設定され、数百のノードと人気のあるモデルを備えたクラウド サービスがあります。 PC に触れることなく SDXL、ControlNet、または複雑なワークフローをテストするのに最適です。、そして多くのものには既成のワークフローのギャラリーが含まれています。
ゼロからビデオまで: ComfyUI の Wan 2.1
一部のカスタム ノードを使用すると、テキストからビデオを作成したり、画像をシーケンスに変換したり、既存のクリップを編集したりできます。 Wan 2.1タイプのモデルでは、テキストからビデオ、画像からビデオ、ビデオからビデオのパイプラインを設定できます。 ComfyUI で直接。
必要なノードをインストールし (管理者経由または手動で)、対応するモデルをダウンロードして、サンプルフローに従います。プロンプトとモーション パラメータをエンコードし、フレームごとの遅延を生成してから、フレームまたはビデオ コンテナにデコードします。 時間とVRAMのコストは解像度と持続時間に応じて増加することに注意してください.
CPU vs GPU: 期待できるパフォーマンス
CPUを使って生成することも可能ですが、速度の面では理想的とは言えません。実際のテストでは、高性能なCPUでも1画像あたり数分かかる場合がありますが、適切なGPUを使えば数秒で処理が完了します。 互換性のある GPU をお持ちの場合は、それを使用してパフォーマンスを大幅に高速化します。.
CPU では、サイズ、ステップ、ノードの複雑さを減らします。GPU では、VRAM に応じてバッチと解像度を調整します。 ボトルネックや予期せぬ閉鎖を回避するために消費を監視する.
カスタムノード: 手動インストールとベストプラクティス
従来の方法を好む場合は、git を使用して custom_nodes フォルダー内のリポジトリのクローンを作成し、再起動することができます。 この方法により、バージョンとブランチを細かく制御できます。特定の機能が必要な場合に便利です。
定期的な更新と互換性に関する注意事項に従って、ノードを整理しておきます。 一度にあまり多くの実験バージョンを混在させないようにしてください。 追跡が困難なエラーの発生を避けるためです。
一般的なトラブルシューティング
「不足しているノードをインストール」しても問題が解決しない場合は、コンソール/ログで正確なエラー(依存関係、パス、バージョン)を確認してください。 幅と高さが 8 の倍数であること、およびテンプレートが正しいフォルダーにあることを確認します。.
ワークフローがモデル選択に反応しない場合は、有効なチェックポイントを強制的に読み込むと、通常はグラフが復元されます。 更新後にノードが壊れた場合は、そのパッケージを無効にするか、安定したバージョンに戻してみてください。.
固定シード、調整されたサイズ、適切なプロンプトによりデバッグが容易になります。 調整しすぎて結果が悪化した場合は、基本プリセットに戻して、変更を 1 つずつ再度導入します。.
追加のヘルプについては、/r/StableDiffusion などのコミュニティが非常に活発に活動しており、まれなバグが解決されることも多々あります。 ログ、グラフキャプチャ、ノードバージョンを共有することでサポートが迅速化されます.
上記のすべてにより、完全なマップが提供されます。各ノードが何であるか、それらがどのように接続されるか、モデルをどこに配置するか、キューをスムーズに動かすために何に触れる必要があるかがわかります。 テキストから画像へのワークフロー、i2i、SDXL、イン/アウトペインティング、アップスケーリング、ControlNet、埋め込み、LoRA、さらに WAN 2.1 を使用したビデオにより、非常に本格的な制作キットが完成します。 お客様と共に成長していきます。詳細については、 ComfyUI公式サイト.
幼い頃からテクノロジーに熱中。私はこの分野の最新情報を知ること、そして何よりもそれを伝えることが大好きです。だからこそ、私は長年テクノロジーとビデオゲームのウェブサイトでのコミュニケーションに専念してきました。 Android、Windows、MacOS、iOS、Nintendo、またはその他の思いついた関連トピックについて書いているのを見つけることができます。

