- ComfyUI cho phép bạn xây dựng luồng trực quan linh hoạt và có thể tái tạo cho Stable Diffusion.
- Làm chủ chuyển văn bản thành hình ảnh, i2i, SDXL, in/outpainting, upscale và ControlNet với các nút chính.
- Nâng cao bằng nhúng, LoRA và các nút tùy chỉnh; sử dụng Trình quản lý để quản lý chúng.
- Tối ưu hóa hiệu suất và tính ổn định bằng các biện pháp tốt nhất, phím tắt và cách khắc phục sự cố.
¿Hướng dẫn ComfyUI tối ưu dành cho người mới bắt đầu? Nếu bạn đang thực hiện những bước đầu tiên với ComfyUI và cảm thấy choáng ngợp trước vô số nút, hộp và dây cáp, đừng lo lắng: tại đây, bạn sẽ tìm thấy hướng dẫn thực sự, hướng dẫn từ đầu và không bỏ qua bất kỳ điều quan trọng nào. Mục tiêu là để bạn hiểu chức năng của từng bộ phận, cách chúng kết hợp với nhau và cách giải quyết những lỗi thường gặp. thật khó chịu khi bạn cố gắng học chỉ bằng cách thử nghiệm.
Ngoài việc bao gồm các quy trình làm việc cổ điển từ văn bản sang hình ảnh, từ hình ảnh sang hình ảnh, vẽ trong, vẽ ngoài, SDXL, nâng cấp, ControlNet, nhúng và LoRA, chúng tôi cũng sẽ tích hợp cài đặt, cấu hình, quản lý nút tùy chỉnh với Quản trị viênCác phím tắt và phần thực hành với các khuyến nghị hiệu suất thực tế cho CPU và GPU. Và vâng, chúng tôi cũng sẽ đề cập đến... Cách làm việc với video bằng mô hình loại Wan 2.1 (văn bản thành video, hình ảnh thành video và video thành video) trong hệ sinh thái ComfyUI.
ComfyUI là gì và nó khác biệt như thế nào so với các GUI khác?
ComfyUI là một giao diện trực quan dựa trên nút được xây dựng trên Khuếch tán ổn định cho phép bạn thiết lập quy trình làm việc bằng cách kết nối các khối chức năng. Mỗi nút thực hiện một nhiệm vụ cụ thể (tải mô hình, mã hóa văn bản, lấy mẫu, giải mã) và các cạnh kết nối lối vào và lối ra, như thể bạn đang lắp ráp một công thức trực quan.
So với AUTOMATIC1111, ComfyUI nổi bật hơn vì Nhẹ, linh hoạt, trong suốt và rất dễ chia sẻ (Mỗi tệp quy trình làm việc đều có thể sao chép được). Nhược điểm là giao diện có thể thay đổi tùy thuộc vào tác giả quy trình làm việc và đối với người dùng thông thường, Đi sâu vào quá nhiều chi tiết có vẻ hơi quá..
Quá trình học tập sẽ trở nên dễ dàng hơn khi bạn hiểu được "lý do" đằng sau các nút. Hãy nghĩ về ComfyUI như một bảng điều khiển nơi bạn có thể thấy đường dẫn hình ảnh đầy đủ: từ văn bản và tiếng ồn ban đầu ở dạng tiềm ẩn, đến quá trình giải mã cuối cùng thành pixel.
Cài đặt từ đầu: nhanh chóng và dễ dàng
Cách trực tiếp nhất là tải xuống gói chính thức cho hệ thống của bạn, giải nén và chạy nó. Bạn không cần phải cài đặt Python riêng vì nó đã được nhúng sẵn., giúp giảm đáng kể ma sát ban đầu.
Các bước cơ bản: Tải xuống tệp nén, giải nén (ví dụ: bằng 7-Zip) và chạy trình khởi chạy phù hợp với bạn. Nếu bạn không có GPU hoặc card đồ họa của bạn không tương thích, hãy sử dụng tệp thực thi CPU.Sẽ mất nhiều thời gian hơn, nhưng nó hiệu quả.
Để bắt đầu mọi thứ, hãy đặt ít nhất một mô hình vào thư mục điểm kiểm tra. Bạn có thể lấy chúng từ các kho lưu trữ như Hugging Face hoặc Civitai và đặt chúng vào đường dẫn mô hình ComfyUI.
Nếu bạn đã có thư viện mô hình trong các thư mục khác, hãy chỉnh sửa tệp đường dẫn bổ sung (extra_model_paths.yaml) bằng cách xóa "example" khỏi tên và thêm vị trí của bạn. Khởi động lại ComfyUI để nó phát hiện các thư mục mới.
Các điều khiển cơ bản và các thành phần giao diện
Trên canvas, chức năng phóng to được điều khiển bằng bánh xe chuột hoặc cử chỉ chụm, và bạn cuộn bằng cách kéo bằng nút bên trái. Để kết nối các nút, hãy kéo từ đầu nối đầu ra đến đầu nối đầu vào.và thả ra để tạo thành cạnh.
ComfyUI quản lý hàng đợi thực thi: cấu hình quy trình làm việc của bạn và nhấn nút hàng đợi. Bạn có thể kiểm tra trạng thái từ chế độ xem hàng đợi để xem chương trình nào đang chạy. hoặc những gì anh ấy/cô ấy mong đợi.
Các phím tắt hữu ích: Ctrl+C/Ctrl+V để sao chép/dán các nút, Ctrl+Shift+V để dán trong khi vẫn giữ nguyên các mục, Ctrl+Enter để xếp hàng, Ctrl+M để tắt tiếng một nút. Nhấp vào dấu chấm ở góc trên bên trái để thu nhỏ một nút và xóa khung vẽ.
Từ văn bản đến hình ảnh: dòng chảy thiết yếu
Luồng tối thiểu bao gồm tải điểm kiểm tra, mã hóa lời nhắc dương và âm bằng CLIP, tạo ảnh tiềm ẩn trống, lấy mẫu bằng KSampler và giải mã thành pixel bằng VAE. Nhấn nút xếp hàng và bạn sẽ nhận được hình ảnh đầu tiên.
Chọn mô hình trong Load Checkpoint
Nút Load Checkpoint trả về ba thành phần: MODEL (bộ dự đoán nhiễu), CLIP (bộ mã hóa văn bản) và VAE (bộ mã hóa/giải mã hình ảnh). MODEL chuyển đến KSampler, CLIP chuyển đến các nút văn bản và VAE chuyển đến bộ giải mã..
Lời nhắc tích cực và tiêu cực với CLIP Text Encode
Nhập lời nhắc tích cực ở trên và lời nhắc tiêu cực ở dưới; cả hai đều được mã hóa dưới dạng nhúng. Bạn có thể cân nhắc các từ bằng cú pháp (word:1.2) hoặc (word:0.8) để củng cố hoặc làm dịu đi các thuật ngữ cụ thể.
Khoảng trống tiềm ẩn và kích thước tối ưu
Hình ảnh tiềm ẩn trống xác định khung vẽ trong không gian tiềm ẩn. Đối với SD 1.5, độ phân giải khuyến nghị là 512×512 hoặc 768×768; đối với SDXL, độ phân giải khuyến nghị là 1024×1024.Chiều rộng và chiều cao phải là bội số của 8 để tránh lỗi và tôn trọng kiến trúc.
VAE: từ tiềm ẩn đến điểm ảnh
VAE nén hình ảnh thành các giá trị tiềm ẩn và tái tạo chúng thành các pixel. Trong chuyển đổi văn bản sang hình ảnh, nó thường chỉ được sử dụng ở giai đoạn cuối để giải mã giá trị tiềm ẩn. Nén làm tăng tốc quá trình nhưng có thể gây ra tổn thất nhỏĐổi lại, nó cung cấp khả năng kiểm soát tốt trong không gian tiềm ẩn.
KSampler và các tham số chính
KSampler áp dụng phương pháp khuếch tán ngược để loại bỏ nhiễu theo hướng dẫn nhúng. Hạt giống, các bước, bộ lấy mẫu, bộ lập lịch và khử nhiễu Đây là các mặt số chính. Nhiều bước hơn thường cung cấp nhiều chi tiết hơn, và denoise=1 sẽ ghi đè hoàn toàn nhiễu ban đầu.
Hình ảnh theo hình ảnh: làm lại với hướng dẫn
Luồng i2i bắt đầu bằng một hình ảnh đầu vào cùng với lời nhắc của bạn; chức năng khử nhiễu kiểm soát mức độ lệch so với hình ảnh gốc. Với độ nhiễu thấp, bạn sẽ có được những biến đổi tinh tế; với độ nhiễu cao, bạn sẽ có được những chuyển đổi sâu sắc..
Trình tự điển hình: chọn điểm kiểm tra, tải hình ảnh của bạn làm đầu vào, điều chỉnh lời nhắc, xác định khử nhiễu trong KSampler và xếp hàng. Nó lý tưởng để cải thiện các tác phẩm hoặc di chuyển các phong cách mà không cần phải bắt đầu từ đầu..
SDXL trên ComfyUI
ComfyUI hỗ trợ SDXL từ sớm nhờ thiết kế mô-đun. Chỉ cần sử dụng luồng tương thích SDXL, kiểm tra lời nhắc và chạy. Hãy nhớ: kích thước gốc lớn hơn yêu cầu nhiều VRAM và thời gian xử lý hơn.Nhưng bước nhảy vọt về chất lượng chi tiết đã bù đắp cho điều đó.
Inpainting: chỉ chỉnh sửa những gì bạn quan tâm
Khi bạn muốn chỉnh sửa các vùng cụ thể của hình ảnh, công cụ inpainting là công cụ cần sử dụng. Tải hình ảnh, mở trình chỉnh sửa mặt nạ, tô màu những gì bạn muốn tái tạo và lưu vào nút tương ứng. Xác định lời nhắc của bạn để hướng dẫn chỉnh sửa và điều chỉnh độ nhiễu (ví dụ: 0.6).
Nếu bạn sử dụng mô hình chuẩn, nó sẽ hoạt động với VAE Encode và Set Noise Latent Mask. Đối với các mô hình inpainting chuyên dụng, hãy thay thế các nút đó bằng VAE Encode (Inpaint), được tối ưu hóa cho nhiệm vụ đó.
Vẽ thêm: phóng to các cạnh của bức tranh
Để mở rộng hình ảnh ra ngoài ranh giới của nó, hãy thêm nút đệm để vẽ thêm và cấu hình mức độ mở rộng của mỗi cạnh. Tham số làm mịn làm mượt quá trình chuyển đổi giữa bản gốc và phần mở rộng.
Trong luồng outpainting, hãy điều chỉnh VAE Encode (cho Inpainting) và tham số grow_mask_by. Giá trị cao hơn 10 thường mang lại sự tích hợp tự nhiên hơn trong khu vực mở rộng.
Nâng cấp trong ComfyUI: pixel so với tiềm ẩn
Có hai cách: nâng cấp pixel (nhanh, không cần thêm thông tin mới) và nâng cấp tiềm ẩn, còn gọi là Hi-res Latent Fix, giúp diễn giải lại các chi tiết khi thay đổi kích thước. Đầu tiên là nhanh; thứ hai làm phong phú thêm kết cấu nhưng có thể đi chệch hướng.
Nâng cấp dựa trên thuật toán (pixel)
Với nút thay đổi tỷ lệ theo phương pháp, bạn có thể chọn bicubic, bilinear hoặc nearest-exact và hệ số tỷ lệ. Thích hợp để xem trước hoặc khi bạn cần tốc độ. mà không cần thêm chi phí suy luận.
Nâng cấp với mô hình (pixel)
Sử dụng Load Upscale Model và nút upscale tương ứng, chọn một mô hình phù hợp (ví dụ: mô hình thực tế hoặc mô hình anime) và chọn ×2 hoặc ×4. Các mô hình chuyên biệt phục hồi đường viền và độ sắc nét tốt hơn các thuật toán cổ điển.
Cao cấp trong tiềm ẩn
Điều chỉnh mức độ tiềm ẩn và lấy mẫu lại bằng KSampler để thêm chi tiết phù hợp với lời nhắc. Chậm hơn nhưng đặc biệt hữu ích khi bạn muốn tăng độ phân giải và độ phức tạp về mặt hình ảnh..
ControlNet: Hướng dẫn cấu trúc nâng cao
ControlNet cho phép bạn chèn các bản đồ tham chiếu (cạnh, tư thế, độ sâu, phân đoạn) để hướng dẫn bố cục. Kết hợp với Stable Diffusion, nó giúp bạn kiểm soát tốt cấu trúc mà không làm mất đi tính sáng tạo của mô hình.
Trong ComfyUI, tích hợp được thực hiện theo mô-đun: bạn tải bản đồ mong muốn, kết nối nó với khối ControlNet và liên kết nó với trình lấy mẫu. Hãy thử nhiều bộ điều khiển khác nhau để xem bộ điều khiển nào phù hợp với phong cách và mục đích của bạn..
Quản trị viên ComfyUI: Các nút tùy chỉnh không cần thiết bị đầu cuối
Trình quản lý cho phép bạn cài đặt và cập nhật các nút tùy chỉnh từ giao diện. Bạn sẽ tìm thấy nó trong menu xếp hàng. Đây là cách đơn giản nhất để giữ cho hệ sinh thái nút của bạn được cập nhật.
Cài đặt các nút bị thiếu
Nếu quy trình làm việc cảnh báo bạn về các nút bị thiếu, hãy mở Trình quản lý, nhấp vào Cài đặt bị thiếu, khởi động lại ComfyUI và cập nhật trình duyệt của bạn. Thao tác này sẽ giải quyết hầu hết các vấn đề phụ thuộc chỉ bằng vài cú nhấp chuột..
Cập nhật các nút tùy chỉnh
Từ Trình quản lý, hãy kiểm tra các bản cập nhật, cài đặt chúng và nhấp vào nút cập nhật trên mỗi gói có sẵn. Khởi động lại ComfyUI để áp dụng các thay đổi. và tránh sự không nhất quán.
Tải các nút vào luồng
Nhấp đúp vào vùng trống để mở trình tìm nút và nhập tên nút bạn cần. Đây là cách bạn nhanh chóng chèn các phần mới vào sơ đồ của mình.
Nhúng (đảo ngược văn bản)
Nhúng sẽ đưa các khái niệm hoặc phong cách đã được đào tạo vào lời nhắc của bạn bằng cách sử dụng từ khóa nhúng:tên. Đặt các tệp vào thư mục models/embeddings để ComfyUI có thể phát hiện chúng..
Nếu bạn cài đặt gói tập lệnh tùy chỉnh, bạn sẽ có tính năng tự động hoàn thành: bắt đầu nhập "embedding:" và bạn sẽ thấy danh sách có sẵn. Điều này giúp tăng tốc đáng kể quá trình lặp lại khi quản lý nhiều mẫu..
Bạn cũng có thể cân nhắc chúng, ví dụ (nhúng: Tên: 1.2) để tăng cường thêm 20%. Điều chỉnh trọng số như bạn làm với các thuật ngữ nhắc nhở thông thường để cân bằng giữa phong cách và nội dung.
LoRA: điều chỉnh phong cách mà không cần chạm vào VAE
LoRA sửa đổi các thành phần MODEL và CLIP của điểm kiểm tra mà không làm thay đổi VAE. Chúng được sử dụng để chèn các kiểu, ký tự hoặc đối tượng cụ thể với các tập tin nhẹ và dễ chia sẻ.
Luồng cơ bản: Chọn điểm kiểm tra cơ sở, thêm một hoặc nhiều LoRA và tạo. Bạn có thể xếp chồng LoRA để kết hợp tính thẩm mỹ và hiệu ứng.điều chỉnh cường độ của chúng nếu quy trình làm việc cho phép.
Các phím tắt, thủ thuật và quy trình làm việc nhúng
Ngoài các phím tắt đã đề cập, còn có hai mẹo rất thực tế: sửa hạt giống khi điều chỉnh các nút ở xa để tránh phải tính toán lại toàn bộ chuỗi và sử dụng nhóm để di chuyển nhiều nút cùng một lúc. Với Ctrl+kéo, bạn có thể chọn nhiều mục và với Shift để di chuyển nhóm..
Một tính năng quan trọng khác: ComfyUI lưu quy trình làm việc trong siêu dữ liệu của PNG mà nó tạo ra. Kéo PNG vào canvas để lấy toàn bộ sơ đồ chỉ bằng một cú nhấp chuộtĐiều này giúp việc chia sẻ và tái tạo kết quả dễ dàng hơn.
ComfyUI trực tuyến: tạo mà không cần cài đặt

Nếu bạn không muốn cài đặt bất cứ thứ gì, vẫn có các dịch vụ đám mây với ComfyUI được cấu hình sẵn, hàng trăm nút và các mô hình phổ biến. Chúng lý tưởng để thử nghiệm SDXL, ControlNet hoặc các quy trình làm việc phức tạp mà không cần chạm vào PC của bạn.và nhiều phần mềm còn bao gồm cả thư viện các quy trình làm việc có sẵn.
Từ đầu đến video: Wan 2.1 trên ComfyUI
Một số nút tùy chỉnh cho phép bạn tạo video từ văn bản, chuyển đổi hình ảnh thành chuỗi hoặc chỉnh sửa clip hiện có. Với các mô hình loại Wan 2.1, bạn có thể thiết lập các đường ống chuyển văn bản thành video, hình ảnh thành video và video thành video trực tiếp trong ComfyUI.
Cài đặt các nút cần thiết (thông qua Administrator hoặc thủ công), tải xuống mô hình tương ứng và làm theo quy trình mẫu: mã hóa các tham số nhắc nhở và chuyển động, tạo độ trễ từng khung hình rồi giải mã thành các khung hình hoặc vùng chứa video. Hãy nhớ rằng chi phí thời gian và VRAM tăng theo độ phân giải và thời lượng.
CPU so với GPU: Hiệu suất mong đợi
Nó có thể được tạo bằng CPU, nhưng tốc độ không lý tưởng. Trong các thử nghiệm thực tế, một CPU mạnh có thể mất vài phút cho mỗi hình ảnh, trong khi với một GPU phù hợp, quá trình này chỉ mất vài giây. Nếu bạn có GPU tương thích, hãy sử dụng nó để tăng tốc hiệu suất đáng kể..
Trên CPU, giảm kích thước, các bước và độ phức tạp của nút; trên GPU, điều chỉnh lô và độ phân giải theo VRAM của bạn. Theo dõi mức tiêu thụ để tránh tình trạng tắc nghẽn và đóng cửa bất ngờ.
Các nút tùy chỉnh: cài đặt thủ công và các phương pháp hay nhất
Nếu bạn thích phương pháp cổ điển, bạn có thể sao chép kho lưu trữ trong thư mục custom_nodes bằng git rồi khởi động lại. Phương pháp này giúp bạn kiểm soát tốt các phiên bản và nhánh.hữu ích khi bạn cần những chức năng cụ thể.
Giữ cho các nút của bạn được ngăn nắp bằng cách cập nhật thường xuyên và ghi chú về khả năng tương thích. Tránh trộn quá nhiều phiên bản thử nghiệm cùng một lúc. để tránh đưa ra những lỗi khó theo dõi.
Khắc phục sự cố điển hình
Nếu "cài đặt các nút bị thiếu" không giúp ích được gì, hãy kiểm tra bảng điều khiển/nhật ký để biết lỗi chính xác: phụ thuộc, đường dẫn hoặc phiên bản. Kiểm tra xem chiều rộng và chiều cao có phải là bội số của 8 không và các mẫu có nằm trong đúng thư mục không..
Khi quy trình công việc không phản ứng với lựa chọn mô hình, việc buộc tải điểm kiểm tra hợp lệ thường khôi phục lại đồ thị. Nếu một nút bị hỏng sau khi cập nhật, hãy thử vô hiệu hóa gói đó hoặc quay lại phiên bản ổn định..
Hạt giống cố định, kích thước được điều chỉnh và lời nhắc hợp lý giúp việc gỡ lỗi dễ dàng hơn. Nếu kết quả không như mong đợi sau khi chỉnh sửa quá nhiều, hãy quay lại cài đặt cơ bản và thực hiện lại từng thay đổi một..
Để được trợ giúp thêm, các cộng đồng như /r/StableDiffusion rất tích cực và thường giải quyết được các lỗi hiếm gặp. Chia sẻ nhật ký, ảnh chụp biểu đồ và phiên bản nút giúp tăng tốc hỗ trợ.
Tất cả những điều trên cung cấp cho bạn một bản đồ hoàn chỉnh: bạn biết từng nút là gì, chúng kết nối như thế nào, đặt mô hình ở đâu và chạm vào đâu để hàng đợi di chuyển trơn tru. Với quy trình làm việc từ văn bản sang hình ảnh, i2i, SDXL, in/outpainting, nâng cấp, ControlNet, nhúng và LoRA, cùng với video với WAN 2.1, bạn có một bộ công cụ sản xuất rất nghiêm túc. Sẵn sàng phát triển cùng bạn. Để biết thêm thông tin, vui lòng xem Trang web chính thức của ComfyUI.
Đam mê công nghệ từ khi còn nhỏ. Tôi thích được cập nhật về lĩnh vực này và trên hết là truyền đạt nó. Đó là lý do tại sao tôi đã cống hiến hết mình cho việc truyền thông trên các trang web công nghệ và trò chơi điện tử trong nhiều năm nay. Bạn có thể thấy tôi viết về Android, Windows, MacOS, iOS, Nintendo hoặc bất kỳ chủ đề liên quan nào khác mà bạn nghĩ đến.

