穩定擴散指南 2024：逐步使用 AI 產生影像

Stable Diffusion 是一個開源模型，可讓您使用 AI 從文字生成逼真且藝術的圖像。
有幾種使用 Stable Diffusion 的方法：在線、本地安裝以及具有自訂擴充功能和模板的高級選項。
影像的品質很大程度上取決於提示的編寫方式及其內部參數的調整方式。
透過 ControlNet、LoRA 等先進工具以及平台內建的編輯技術，進一步擴展了創造可能性。

的宇宙 人工智能 近年來取得了巨大的進步，讓任何人，無論其技術知識或藝術經驗如何，都可以 用簡單的短語創作引人注目的圖像. 穩定擴散是生成人工智慧領域最具革命性和最受讚譽的發展之一，它為那些想要進行實驗的人以及設計和插畫專業人士提供了強大的工具。

在本指南中，我們將向您介紹有關穩定擴散的所有資訊。 從初學者的第一步到高級提示和編輯技術，包括有關工具、模板和擴展的建議，可將您的創作提升到一個新的水平。

什麼是穩定擴散？為什麼它徹底改變了成像？

穩定擴散 它是一個開源人工智慧模型，利用深度學習技術實現了圖像創建的民主化。得益於其創新設計， 允許您將簡單的文字描述（提示）轉換為令人難以置信的圖像、細緻、高品質。無論您身在何處，您都可以免費利用其引擎，將其安裝在您喜歡的任何地方，甚至可以根據您的需求進行升級，這使它有別於其他商業和封閉的解決方案。

穩定擴散的運作是基於 擴散模型：它從像壞掉的電視機一樣的隨機噪音開始，然後通過文字引導的多個步驟和改進，消除噪音，直到創建連貫且具有視覺吸引力的圖像。

此功能使其成為 藝術家、內容創作者、開發者和家庭用戶的理想選擇 想要超越傳統形象的人。事實上，它是開源的，這為無限定制、與專有工具的整合和本地生成打開了大門，而無需依賴第三方伺服器或月費（如果您願意的話）。

穩定擴散能做什麼？

穩定的擴散應用程式不僅僅是從文字創建圖像。 人工智慧不僅僅是從零開始生成圖像，但也能：

編輯現有影像： 您可以上傳照片並要求它添加物件、刪除細節或更改樣式。
外塗： 根據提示中給予的線索延伸你的作品的邊緣。
填充特定區域（修復）： 僅修改您選擇的影像的一部分，例如修復手、更改背景或增強面部表情。
變換影像（img2img）： 您可以使用真實圖像作為參考，以便 Stable Diffusion 可以以另一種風格重新解釋它，改變燈光或顏色...
融合藝術風格： 它在一個提示中混合了不同的技術和參考（例如，古典藝術、動漫、照相寫實主義等）。

獨家內容 - 點擊這裡如何支付背書 2022 Morelos

此 通用性 使其成為數位創意、插圖、平面設計的理想伴侶，甚至可以為視訊遊戲、行銷活動產生資源，或只是享受探索人工智慧極限的樂趣。

穩定擴散在內部如何發揮作用？

穩定擴散源於 訓練數百萬張有字幕的圖像 由於大型資料集（例如 LAION-5B），AI 可以學會將文字概念與視覺模式關聯起來。該模型使用所謂的 擴散模型：首先透過將圖像變成雜訊來破壞圖像，然後學習根據使用者輸入的文字從頭開始重建它。

在每一步中，模型都會完善圖像， 降低噪音並提高細節水平，直到結果接近我們所描述的場景。此外，穩定擴散可讓您調節某些字詞的“權重”，以優先考慮（或減弱）場景的特定元素、操縱風格並避免不必要的結果。

La 專案的不斷發展及其對程式碼的開放性 使得社區出現了無數的變體和改進，例如新模型、新風格和技術，以實現更現實或具體的結果。

與其他工具相比，Stable Diffusion 有哪些優勢？

穩定擴散的主要差異是 它的免費和開源特性。與 MidJourney 或 DALL-E 等其他模型不同，您可以在自己的電腦上運行它，將其安裝在伺服器上，嘗試新事物，並根據自己的喜好進行修改。其他顯著優勢包括：

免費（高級平台除外）：您可以免費使用大多數網路服務和本地安裝，除非您選擇高級伺服器或想要存取非常特定的高級功能。
隱私： 您無需離開系統即可建立影像，從而避免雲端資料或連接速度慢的問題。
模組化和客製化： 支援無限的自訂模型、樣式、擴展和社區開發的資源。
品質和細節： 最新一代車型（SDXL、Juggernaut、Realistic Vision 等）可與付費影像製作相媲美，甚至經常超越後者。

有鑑於此，也必須指出一些弱點或懸而未決的問題。最重要的是，應該注意的是，穩定擴散呈現 比其他解決方案更陡峭的學習曲線 商業。

入門：如何在本地安裝和配置穩定擴散

在電腦上安裝穩定擴散比看起來容易，尤其是使用流行的介面 自動1111，這已經盡可能地簡化了 Windows 的流程。

前往官方儲存庫 GitHub 上的 Automatic 1111，尋找“資產”部分並下載安裝程式（.exe）。
運行下載的檔案。安裝過程可能需要一些時間，具體取決於您的電腦的速度。
完成後，您的桌面或目標資料夾中將有一個名為「A1111 WebUI」的捷徑。雙擊將在瀏覽器中開啟圖形介面，準備開始建立。
如果您的電腦效能不是很強大，我們建議啟用介面和擴充功能的自動更新以及「低 VRAM」選項。

獨家內容 - 點擊這裡如何打開SWF文件

如果您使用的是 Mac 或 Linux，則可以從其開源儲存庫中找到安裝 Stable Diffusion 的具體指南。

如何在穩定擴散中寫出有效的提示：結構、語法和技巧

影像的成功幾乎完全取決於提示。 良好的結構將使您獲得專業的結果 與那些透過模糊描述產生的圖像有很大不同。

建議的提示應該顯示：

圖像類型： 攝影、繪畫、插畫、3D渲染等
主題： 影像中出現的人（人、動物、物體…），以及您想要的所有細節（年齡、種族、表情等）
行動： 那傢伙在幹嘛。
背景/場景： 場景發生的地點、燈光、時間、主要顏色等。
修飾符： 繪畫風格、鏡頭和相機、一天中的時間、調色板、參考藝術家、解析度、品質、特殊效果（如散景、模糊、紋理）...

至 負面提示，只需添加圖像中您不想要的所有特徵：「模糊、醜陋、變形的手、太多手指、文字、浮水印、低解析度、比例不正確、病態、重複...」以及任何其他結果中令您困擾的內容。

如何改進穩定擴散中的提示？

為了獲得最佳效果，請遵循以下提示。建議正確調整重量和編程。穩定擴散允許你賦予某些字詞更多或更少的重要性 使用語法 “詞：因素”. word:factor 越高，這個術語的相關性就越高；您可以使用額外的括號來進一步增加單字或概念的權重。

此外，語法驅動的提示編程可讓您在單一圖像中組合想法或樣式，從而按照您定義的步驟從一個概念過渡到另一個概念。

如果您遇到困難或正在尋找快速靈感，Lexica、Civitai 或 Stable Diffusion 自己的 PNG Info 選項卡等平台可讓您拖曳 AI 生成的圖像並查看用於創建它們的確切提示。

超現實主義和藝術圖像的最佳穩定擴散模型

穩定擴散宇宙比其基本模型廣闊得多。 目前有大量適合特定風格的自訂模型（檢查點），例如照片寫實主義、動漫、技術插圖等。 其中一些最推薦和最受歡迎的是：

SD 1.5 的型號：

巨像重生： 擅長逼真的肌膚、差異化的背景、自然的色彩。溫暖的 RAW 風格效果。
現實願景 v5.1： 對肖像、情感和臉部細節的掌握很好。背景和主題非常平衡。
我簡直不敢相信這不是攝影： 用途廣泛，光線和角度都很出色。適合肖像和各種主題。
光子V1： 質量和多功能性之間的平衡，尤其是人類主題。
現實庫存照片： 非常精緻，目錄風格的圖像，沒有皮膚瑕疵。
aZovya 照片真實： 較不為人所知，但能產生出色的結果，並可用於與其他模型合併技術。

獨家內容 - 點擊這裡入門並學習 Excel 公式所需的基本 Excel 公式

SDXL 的型號（最新一代）：

巨無霸 XL (x): 電影構圖，擅長肖像和理解長提示。
RealVisXL： 在產生皮膚真實瑕疵、紋理和色調變化方面無與倫比。
HelloWorld XL v6.0： 它帶來了模擬方法、良好的身體比例和復古美感。使用 GPT4v 標記來獲得更複雜的提示。
榮譽提名： PhotoPedia XL、Realism Engine SDXL、Fully Real XL（不太新但仍然有效）。

所有這些模型都可以從以下儲存庫免費下載：奇維泰，然後簡單地將它們放在適當的文件夾中即可出現在穩定擴散界面中。

如何在 Stable Diffusion 中安裝和管理自訂模型

下載新範本非常簡單：

存取 Civitai 等儲存庫並透過「檢查點」進行過濾。
選擇您想要的型號（確保它具有 .safetensor 擴充功能以增加安全性）。
下載檔案並將其複製到路徑/stable-diffusion-webui/models/Stable-diffusion。
重新啟動介面並從“檢查點”面板中選擇模型。

使用穩定擴散獲得真正令人驚嘆的圖像的專業技巧

掌握穩定擴散需要進行實驗、從結果中學習、磨練你的技術和想像：

玩嵌入： 為了微調圖像的美感，請嘗試模型創建者建議的嵌入（例如，BadDream、UnrealisticDream、FastNegativeV2、JuggernautNegative-neg）。嵌入可讓您調整手、眼睛等特徵。
使用臉部細節擴展： A1111 的 Adetailer 擴充功能或 ComfyUI 中的 Face Detailer Pipe 節點將幫助您在臉部和手部獲得完美的效果，對於逼真的肖像尤其有用。
完美主義者的 ControlNets： 如果您對對手、姿勢或身體有要求，請探索不同類型的 ControlNet 來微調您的構圖。
反覆試驗： 不要期望第一張圖片是完美的；關鍵在於迭代、修改提示和調整底片，直到達到所需的品質。
注意提示的結構： 避免矛盾（例如，同一句話中出現“長髮”和“短髮”），並在開始時優先考慮概念，這將在最終形像中佔有更大的比重。

在了解了穩定擴散的各種可能性之後，很明顯，人工智慧正在徹底改變我們創造的方式， 嘗試並轉換圖像，獲得越來越令人驚訝、專業和自然的效果。如果您對數位創意感興趣，現在是探索人工智慧視覺生成世界的最佳時機：有了好的提示、正確的工具和一點練習，任何人都可以將他們想像的圖像變為現實，從簡單的草圖到與專業攝影難以區分的超現實主義構圖。

丹尼爾·特拉薩（Daniel Terrasa）

專門研究技術和互聯網問題的編輯，在不同數位媒體領域擁有十多年的經驗。我曾在電子商務、通訊、線上行銷和廣告公司擔任編輯和內容創作者。我還在經濟、金融和其他領域的網站上撰寫過文章。我的工作也是我的熱情所在。現在，透過我的文章 Tecnobits，我嘗試探索科技世界每天為我們提供的所有新聞和新機會，以改善我們的生活。