- ComfyUI به شما امکان میدهد جریانهای بصری انعطافپذیر و قابل تکرار برای انتشار پایدار (Stable Diffusion) بسازید.
- تسلط بر تبدیل متن به تصویر، i2i، SDXL، رنگآمیزی داخلی/خارجی، ارتقاء مقیاس و ControlNet با گرههای کلیدی.
- با تعبیهها، LoRA و گرههای سفارشی، بهبود پیدا کنید؛ از Manager برای مدیریت آنها استفاده کنید.
- بهینهسازی عملکرد و پایداری با بهترین شیوهها، میانبرها و عیبیابی.
¿راهنمای جامع ComfyUI برای مبتدیان؟ اگر اولین قدمهایتان را با ComfyUI برمیدارید و از وجود این همه گره، جعبه و کابل سردرگم شدهاید، نگران نباشید: اینجا یک راهنمای واقعی پیدا خواهید کرد، راهنمایی که از صفر شروع میکند و هیچ نکتهی مهمی را از قلم نمیاندازد. هدف این است که شما بفهمید هر قطعه چه کاری انجام میدهد، چگونه با هم جور میشوند و چگونه اشتباهات رایج را حل کنید. که وقتی سعی میکنید فقط با آزمایش یاد بگیرید، ناامیدکننده هستند.
علاوه بر پوشش گردشهای کاری کلاسیک تبدیل متن به تصویر، تصویر به تصویر، inpainting، outpainting، SDXL، upscaling، ControlNet، embeddings و LoRA، ما نصب، پیکربندی، مدیریت گره سفارشی با مدیرمیانبرها و یک بخش کاربردی با توصیههای عملکرد واقعی برای CPU و GPU. و بله، ما همچنین ... را پوشش خواهیم داد. نحوه کار با ویدیو با استفاده از مدلهای نوع Wan 2.1 (متن به ویدیو، تصویر به ویدیو و ویدیو به ویدیو) در اکوسیستم ComfyUI.
ComfyUI چیست و چگونه با سایر رابطهای کاربری گرافیکی مقایسه میشود؟
ComfyUI یک رابط بصری مبتنی بر گره است که بر اساس ... ساخته شده است. انتشار پایدار که به شما امکان میدهد با اتصال بلوکهای عملکردی، گردشهای کاری را تنظیم کنید. هر گره یک کار خاص را انجام میدهد (بارگذاری مدل، رمزگذاری متن، نمونهبرداری، رمزگشایی) و لبهها ورودیها و خروجیهای آن را به هم متصل میکنند، گویی در حال گردآوری یک دستور پخت تصویری هستید.
در مقایسه با AUTOMATIC1111، ComfyUI از این نظر متمایز است که سبک، انعطافپذیر، شفاف و اشتراکگذاری بسیار آسان (هر فایل گردش کار قابل تکثیر است). نکته منفی این است که رابط کاربری میتواند بسته به نویسنده گردش کار متفاوت باشد و برای کاربران عادی، پرداختن به این همه جزئیات شاید بیش از حد به نظر برسد..
منحنی یادگیری وقتی که «چرایی» پشت گرهها را بفهمید، هموارتر میشود. ComfyUI را به عنوان یک داشبورد در نظر بگیرید که در آن مسیر کامل تصویر را مشاهده میکنید.از متن اولیه و نویز به شکل نهفته، تا رمزگشایی نهایی به پیکسلها.
نصب از ابتدا: سریع و بدون دردسر
مستقیمترین راه این است که بسته رسمی مربوط به سیستم خود را دانلود کنید، آن را از حالت فشرده خارج کنید و اجرا کنید. لازم نیست پایتون را جداگانه نصب کنید زیرا به صورت توکار (embedded) ارائه میشود.که اصطکاک اولیه را تا حد زیادی کاهش میدهد.
مراحل اولیه: فایل فشرده را دانلود کنید، آن را از حالت فشرده خارج کنید (برای مثال، با 7-Zip) و لانچری را که مناسب شماست اجرا کنید. اگر پردازنده گرافیکی (GPU) ندارید یا کارت گرافیک شما سازگار نیست، از فایل اجرایی CPU استفاده کنید.بیشتر طول خواهد کشید، اما مؤثر است.
برای شروع، حداقل یک مدل را در پوشهی Checkpoints قرار دهید. میتوانید آنها را از مخازنی مانند Hugging Face یا Civitai دریافت کنید. و آنها را در مسیر مدل ComfyUI قرار دهید.
اگر از قبل یک کتابخانه مدل در پوشههای دیگر دارید، فایل مسیرهای اضافی (extra_model_paths.yaml) را با حذف «example» از نام و اضافه کردن مکانهای خود ویرایش کنید. ComfyUI را مجدداً راهاندازی کنید تا دایرکتوریهای جدید را شناسایی کند..
کنترلهای پایه و عناصر رابط
روی بوم، زوم با چرخ ماوس یا حرکت نیشگون گرفتن کنترل میشود و با کشیدن دکمه سمت چپ، اسکرول میکنید. برای اتصال گرهها، از کانکتور خروجی به کانکتور ورودی بکشید.و رها کنید تا لبه ایجاد شود.
ComfyUI صف اجرا را مدیریت میکند: گردش کار خود را پیکربندی کنید و دکمه صف را فشار دهید. میتوانید وضعیت را از نمای صف بررسی کنید تا ببینید چه چیزهایی در حال اجرا هستند. یا اینکه چه انتظاری دارد.
میانبرهای مفید: Ctrl+C/Ctrl+V برای کپی/پیست کردن گرهها، Ctrl+Shift+V برای پیست کردن در عین حفظ ورودیها، Ctrl+Enter برای قرار دادن در صف، Ctrl+M برای بیصدا کردن یک گره. برای کوچک کردن یک گره و پاک کردن بوم، روی نقطه گوشه بالا سمت چپ کلیک کنید.
از متن تا تصویر: جریان اساسی
حداقل جریان شامل بارگذاری نقطه بررسی، رمزگذاری اعلان مثبت و منفی با CLIP، ایجاد یک تصویر پنهان خالی، نمونهبرداری با KSampler و رمزگشایی به پیکسلها با VAE است. دکمه صف را فشار دهید و اولین تصویر خود را دریافت خواهید کرد.
مدل را در Load Checkpoint انتخاب کنید
گره Load Checkpoint سه مؤلفه را برمیگرداند: MODEL (پیشبینیکننده نویز)، CLIP (رمزگذار متن) و VAE (رمزگذار/رمزگشای تصویر). MODEL به KSampler، CLIP به گرههای متنی و VAE به رمزگشا میرود..
دستورات مثبت و منفی با رمزگذاری متن CLIP
عبارت مثبت خود را در بالا و عبارت منفی خود را در پایین وارد کنید؛ هر دو به صورت جاسازی کدگذاری شدهاند. شما میتوانید کلمات را با استفاده از سینتکس (word:1.2) یا (word:0.8) وزندهی کنید. برای تقویت یا تعدیل اصطلاحات خاص.
حفرههای پنهان و اندازههای بهینه
تصویر پنهان خالی، بوم را در فضای پنهان تعریف میکند. برای SD 1.5، 512×512 یا 768×768 توصیه میشود؛ برای SDXL، 1024×1024.عرض و ارتفاع باید مضربی از ۸ باشند تا از خطا جلوگیری شود و به معماری سایت احترام گذاشته شود.
VAE: از نهان تا پیکسلها
VAE تصاویر را به مقادیر پنهان فشرده میکند و آنها را به پیکسلها بازسازی میکند. در تبدیل متن به تصویر، معمولاً فقط در انتها برای رمزگشایی مقدار پنهان استفاده میشود. فشردهسازی سرعت فرآیند را افزایش میدهد اما میتواند تلفات کمی ایجاد کنددر عوض، کنترل دقیقی در فضای پنهان ارائه میدهد.
KSampler و پارامترهای کلیدی
KSampler طبق راهنمای تعبیهها، از انتشار معکوس برای حذف نویز استفاده میکند. مرحله، نمونهبرداری، زمانبندی و حذف نویز اینها تنظیمات اصلی هستند. گامهای بیشتر معمولاً جزئیات بیشتری را ارائه میدهند و denoise=1 نویز اولیه را کاملاً بازنویسی میکند.
تصویر به تصویر: با راهنما از نو انجام دهید
جریان i2i با یک تصویر ورودی به علاوهی دستورات شما شروع میشود؛ نویززدایی میزان انحراف آن از تصویر اصلی را کنترل میکند. با نویز کم، تغییرات ظریفی خواهید داشت؛ با نویز زیاد، دگرگونیهای عمیقی..
توالی معمول: انتخاب نقطه بررسی، بارگذاری تصویر به عنوان ورودی، تنظیم اعلانها، تعریف نویززدایی در KSampler و قرار دادن در صف. این برای بهبود ترکیببندیها یا انتقال سبکها بدون شروع از ابتدا ایدهآل است..
SDXL در ComfyUI
به لطف طراحی ماژولار، ComfyUI پشتیبانی اولیه از SDXL را ارائه میدهد. کافیست از یک جریان سازگار با SDXL استفاده کنید، دستورالعملها را بررسی کنید و آن را اجرا کنید. به یاد داشته باشید: اندازههای بزرگتر به VRAM و زمان پردازش بیشتری نیاز دارند.اما جهش کیفی در جزئیات، این نقص را جبران میکند.
ویرایش: فقط مواردی را که به آنها علاقه دارید ویرایش کنید
وقتی میخواهید قسمتهای خاصی از یک تصویر را تغییر دهید، ابزار inpainting مناسب است. تصویر را بارگذاری کنید، ویرایشگر ماسک را باز کنید، قسمتی را که میخواهید بازسازی کنید، رنگآمیزی کنید و آن را در گره مربوطه ذخیره کنید. دستورالعمل خود را برای هدایت ویرایش و تنظیم نویز (مثلاً 0.6) تعریف کنید..
اگر از یک مدل استاندارد استفاده میکنید، با VAE Encode و Set Noise Latent Mask کار میکند. برای مدلهای رنگآمیزی اختصاصی، آن گرهها را با VAE Encode (رنگآمیزی) جایگزین کنید.، که برای آن کار بهینه شده است.
رنگآمیزی بیرونی: بزرگ کردن لبههای بوم
برای گسترش یک تصویر فراتر از مرزهای آن، گره padding را برای outpainting اضافه کنید و میزان رشد هر ضلع را پیکربندی کنید. پارامتر feathering، انتقال بین تصویر اصلی و تصویر الحاقی را هموار میکند..
در جریانهای رنگآمیزی بیرونی، VAE Encode (برای رنگآمیزی درونی) و پارامتر grow_mask_by را تنظیم کنید. مقدار بالاتر از ۱۰ معمولاً ادغامهای طبیعیتری ارائه میدهد. در منطقه گسترش یافته.
ارتقاء کیفیت در رابط کاربری ComfyUI: پیکسل در مقابل پنهان
دو راه وجود دارد: افزایش مقیاس پیکسل (سریع، بدون اضافه کردن اطلاعات جدید) و افزایش مقیاس پنهان، که به آن Hi-res Latent Fix نیز گفته میشود، که هنگام تغییر مقیاس، جزئیات را دوباره تفسیر میکند. اولی سریع است؛ دومی بافتها را غنی میکند اما میتواند منحرف شود.
ارتقاء مبتنی بر الگوریتم (پیکسل)
با روش تغییر مقیاس گره به روش گره، میتوانید دومکعبی، دوخطی یا نزدیکترین دقیق و ضریب مقیاس را انتخاب کنید. برای پیشنمایش یا زمانی که به سرعت نیاز دارید، ایدهآل است. بدون اضافه کردن هزینه استنتاج.
مدل ارتقا یافته (پیکسل)
از Load Upscale Model و گره upscale مربوطه استفاده کنید، یک مدل مناسب (مثلاً واقعگرایانه یا انیمه) انتخاب کنید و ×2 یا ×4 را انتخاب کنید. مدلهای تخصصی، خطوط و وضوح را بهتر از الگوریتمهای کلاسیک بازیابی میکنند.
مجلل در نهان
لایه پنهان را مقیاسبندی کنید و با استفاده از KSampler نمونهبرداری مجدد انجام دهید تا جزئیاتی مطابق با دستورالعمل اضافه شود. کندتر است، اما به ویژه زمانی مفید است که میخواهید وضوح و پیچیدگی بصری را افزایش دهید..
ControlNet: راهنمای ساختاری پیشرفته
ControlNet به شما امکان میدهد نقشههای مرجع (لبهها، حالت، عمق، تقسیمبندی) را برای هدایت ترکیببندی تزریق کنید. همراه با انتشار پایدار، به شما کنترل دقیقی بر ساختار میدهد بدون اینکه خلاقیت مدل از بین برود.
در ComfyUI، یکپارچهسازی به صورت ماژولار انجام میشود: شما نقشه مورد نظر را بارگذاری میکنید، آن را به بلوک ControlNet متصل میکنید و آن را به نمونهگیر پیوند میدهید. کنترلرهای مختلف را امتحان کنید تا ببینید کدام یک با سبک و هدف شما مطابقت دارد..
مدیر ComfyUI: گرههای سفارشی بدون ترمینال
مدیر به شما امکان میدهد گرههای سفارشی را از رابط نصب و بهروزرسانی کنید. میتوانید آن را در منوی صفبندی پیدا کنید. این سادهترین راه برای بهروز نگه داشتن اکوسیستم گره شماست..
گرههای از دست رفته را نصب کنید
اگر یک گردش کار به شما هشدار میدهد که گرههایتان از دست رفتهاند، Manager را باز کنید، روی Install Missing کلیک کنید، ComfyUI را مجدداً راهاندازی کنید و مرورگر خود را بهروزرسانی کنید. این اکثر وابستگیها را با چند کلیک برطرف میکند..
بهروزرسانی گرههای سفارشی
از طریق مدیریت، بهروزرسانیها را بررسی کنید، آنها را نصب کنید و روی دکمه بهروزرسانی برای هر بسته موجود کلیک کنید. برای اعمال تغییرات، ComfyUI را مجدداً راهاندازی کنید. و از ناهماهنگیها جلوگیری شود.
بارگذاری گرهها در جریان
برای باز کردن ابزار یافتن گره، روی یک قسمت خالی دوبار کلیک کنید و نام گره مورد نظر خود را تایپ کنید. اینگونه است که شما به سرعت قطعات جدید را در نمودارهای خود وارد میکنید.
جاسازیها (وارونگی متن)
جاسازیها با استفاده از کلمه کلیدی embedding:name مفاهیم یا سبکهای آموزشدیده را به اعلانهای شما تزریق میکنند. فایلها را در پوشه models/embeddings قرار دهید تا ComfyUI بتواند آنها را شناسایی کند..
اگر بسته اسکریپتهای سفارشی را نصب کنید، تکمیل خودکار را خواهید داشت: شروع به تایپ کردن "embedding:" کنید و لیست موجود را مشاهده خواهید کرد. این امر هنگام مدیریت بسیاری از قالبها، تکرار را تا حد زیادی سرعت میبخشد..
همچنین میتوانید به آنها وزن بدهید، مثلاً (embedding:Name:1.2) تا 20٪ تقویت شوند. وزن را مانند عبارات سریع معمولی تنظیم کنید برای ایجاد تعادل بین سبک و محتوا.
LoRA: بدون دست زدن به VAE، سبک را تطبیق میدهد
LoRA اجزای MODEL و CLIP نقطه کنترل را بدون تغییر VAE اصلاح میکند. آنها برای تزریق استایلها، کاراکترها یا اشیاء خاص استفاده میشوند. با فایلهای سبک و آسان برای اشتراکگذاری.
روند کلی: ایست بازرسی پایه خود را انتخاب کنید، یک یا چند LoRA اضافه کنید و تولید کنید. شما میتوانید LoRA را روی هم قرار دهید تا زیباییشناسی و جلوهها را با هم ترکیب کنید.اگر گردش کار اجازه دهد، شدت آنها را تنظیم کنید.
میانبرها، ترفندها و گردشهای کاری تعبیهشده
علاوه بر میانبرهای ذکر شده، دو نکته بسیار کاربردی وجود دارد: هنگام تنظیم گرههای دور، نقطه شروع را ثابت کنید تا از محاسبه مجدد کل زنجیره جلوگیری شود و از گروهها برای جابجایی چندین گره به طور همزمان استفاده کنید. با Ctrl+drag میتوانید چندین مورد را انتخاب کنید و با Shift گروه را جابجا کنید..
یکی دیگر از ویژگیهای کلیدی: ComfyUI گردش کار را در متادیتای فایل PNG که تولید میکند، ذخیره میکند. کشیدن PNG روی بوم، کل نمودار را با یک کلیک بازیابی میکند.این امر اشتراکگذاری و بازتولید نتایج را آسانتر میکند.
ComfyUI آنلاین: بدون نصب، ایجاد کنید

اگر نمیخواهید چیزی نصب کنید، سرویسهای ابری با ComfyUI از پیش پیکربندیشده، صدها گره و مدلهای محبوب وجود دارند. آنها برای آزمایش SDXL، ControlNet یا گردشهای کاری پیچیده بدون تماس با رایانه شما ایدهآل هستند.و بسیاری از آنها شامل گالریهایی از گردشهای کاری آماده هستند.
از ابتدا تا ویدیو: Wan 2.1 در ComfyUI
برخی از گرههای سفارشی به شما امکان میدهند از متن ویدیو بسازید، یک تصویر را به یک دنباله تبدیل کنید یا یک کلیپ موجود را ویرایش کنید. با مدلهای نوع Wan 2.1 میتوانید خطوط لوله تبدیل متن به ویدیو، تصویر به ویدیو و ویدیو به ویدیو را تنظیم کنید. مستقیماً در ComfyUI.
گرههای مورد نیاز را نصب کنید (از طریق مدیر یا به صورت دستی)، مدل مربوطه را دانلود کنید و جریان مثال را دنبال کنید: پارامترهای اعلان و حرکت را رمزگذاری کنید، تأخیرهای فریم به فریم ایجاد کنید و سپس به فریمها یا یک کانتینر ویدیویی رمزگشایی کنید. به یاد داشته باشید که هزینه زمان و VRAM با افزایش وضوح و مدت زمان افزایش مییابد..
CPU در مقابل GPU: چه عملکردی را میتوان انتظار داشت
میتوان آن را با استفاده از یک CPU تولید کرد، اما از نظر سرعت ایدهآل نیست. در آزمایشهای دنیای واقعی، یک CPU قدرتمند میتواند چندین دقیقه برای هر تصویر زمان ببرد، در حالی که با یک GPU مناسب این فرآیند به چند ثانیه کاهش مییابد. اگر پردازنده گرافیکی (GPU) سازگار دارید، از آن برای افزایش چشمگیر عملکرد استفاده کنید..
روی CPU، اندازه، مراحل و پیچیدگی گرهها را کاهش دهید؛ روی GPU، دسته و وضوح را مطابق با VRAM خود تنظیم کنید. نظارت بر مصرف برای جلوگیری از تنگناها و تعطیلیهای غیرمنتظره.
گرههای سفارشی: نصب دستی و بهترین شیوهها
اگر روش کلاسیک را ترجیح میدهید، میتوانید مخازن را در پوشه custom_nodes با استفاده از git کلون کنید و سپس سیستم را مجدداً راهاندازی کنید. این روش به شما کنترل دقیقی بر نسخهها و شاخهها میدهد.وقتی به عملکردهای خاصی نیاز دارید، مفید است.
گرههای خود را با بهروزرسانیهای منظم و یادداشتهای سازگاری، سازماندهی کنید. از ترکیب همزمان چندین نسخه آزمایشی خودداری کنید. برای جلوگیری از ایجاد خطاهایی که ردیابی آنها دشوار است.
حل مسئله معمولی
اگر «نصب گرههای گمشده» مشکل را حل نکرد، کنسول/لاگ را برای یافتن خطای دقیق بررسی کنید: وابستگیها، مسیرها یا نسخهها. بررسی کنید که عرض و ارتفاع مضربی از ۸ باشند و قالبها در پوشههای صحیح قرار داشته باشند..
وقتی یک گردش کار نتواند به انتخاب مدل واکنش نشان دهد، بارگذاری اجباری یک چکپوینت معتبر معمولاً نمودار را بازیابی میکند. اگر گرهای پس از بهروزرسانی دچار مشکل شد، آن بسته را غیرفعال کنید یا به یک نسخه پایدار برگردید..
مقادیر ثابت، اندازههای تنظیمشده و دستورالعملهای منطقی، اشکالزدایی را آسانتر میکنند. اگر نتیجه پس از دستکاریهای زیاد افت کرد، به تنظیمات پیشفرض اولیه برگردید و تغییرات را یکییکی اعمال کنید..
برای کمک بیشتر، انجمنهایی مانند /r/StableDiffusion بسیار فعال هستند و اغلب اشکالات نادر را برطرف میکنند. اشتراکگذاری لاگ، گرافهای گرفته شده و نسخههای گره، سرعت پشتیبانی را افزایش میدهد..
تمام موارد فوق یک نقشه کامل به شما میدهد: شما میدانید هر گره چیست، چگونه به هم متصل میشوند، مدلها را کجا قرار دهید و برای روان نگه داشتن صف، چه چیزی را لمس کنید. با گردشهای کاری تبدیل متن به تصویر، i2i، SDXL، in/outpainting، upscaling، ControlNet، embeddings و LoRA، به علاوه ویدئو با WAN 2.1، شما یک کیت تولید بسیار جدی دارید. آماده رشد با شما. برای اطلاعات بیشتر، لطفاً به وبسایت رسمی رابط کاربری ComfyUI.
از کودکی علاقه زیادی به فناوری داشت. من عاشق به روز بودن در این بخش و مهمتر از همه، برقراری ارتباط با آن هستم. به همین دلیل است که من سالهاست که به ارتباطات در وبسایتهای فناوری و بازیهای ویدیویی اختصاص دادهام. میتوانید در مورد Android، Windows، MacOS، iOS، Nintendo یا هر موضوع مرتبط دیگری که به ذهنم میآید بنویسم.

