稳定扩散是什么意思?它有什么作用?

最后更新: 16/05/2025

  • Stable Diffusion 是一个开源模型,允许您使用 AI 从文本生成逼真且艺术的图像。
  • 有几种使用 Stable Diffusion 的方法:在线、本地安装以及具有自定义扩展和模板的高级选项。
  • 图像的质量很大程度上取决于提示的编写方式及其内部参数的调整方式。
  • 通过 ControlNet、LoRA 等先进工具以及平台内置的编辑技术,进一步扩展了创造可能性。
稳定扩散

的宇宙 人工智能 近年来取得了巨大的进步,让任何人,无论其技术知识或艺术经验如何,都可以 用简单的短语创作引人注目的图像. 稳定扩散是生成人工智能领域最具革命性和最受赞誉的发展之一,它为那些想要进行实验的人以及设计和插画专业人士提供了强大的工具。

在本指南中,我们将向您介绍有关稳定扩散的所有信息。 从初学者的第一步到高级提示和编辑技术,包括有关工具、模板和扩展的建议,可将您的创作提升到一个新的水平。

什么是稳定扩散?为什么它彻底改变了成像?

稳定扩散 它是一个开源人工智能模型,利用深度学习技术实现了图像创建的民主化。得益于其创新设计, 允许您将简单的文本描述(提示)转换为令人难以置信的图像、细致、高品质。无论您身在何处,您都可以免费利用其引擎,将其安装在您喜欢的任何地方,甚至可以根据您的需要进行升级,这使它有别于其他商业和封闭的解决方案。

稳定扩散的运作基于 扩散模型:它从像坏掉的电视机一样的随机噪音开始,然后通过文本引导的多个步骤和改进,消除噪音,直到创建连贯且具有视觉吸引力的图像。

此功能使其成为 艺术家、内容创作者、开发者和家庭用户的理想选择 想要超越传统形象的人。事实上,它是开源的,这为无限的定制、与您自己的工具集成以及本地生成打开了大门,而无需依赖第三方服务器或每月费用(如果您愿意的话)。

稳定扩散

稳定扩散能做什么?

稳定的扩散应用程序不仅仅是从文本创建图像。 人工智能不仅仅是从零开始生成图像,但也能:

  • 编辑现有图像: 您可以上传照片并要求它添加对象、删除细节或更改样式。
  • 外涂: 根据提示中给出的线索延伸你的作品的边缘。
  • 填充特定区域(修复): 仅修改您选择的图像的一部分,例如修复手、更改背景或增强面部表情。
  • 变换图像(img2img): 您可以使用真实图像作为参考,以便 Stable Diffusion 可以以另一种风格重新解释它,改变灯光或颜色......
  • 融合艺术风格: 它在一个提示中混合了不同的技术和参考(例如,古典艺术、动漫、照相写实主义等)。
独家内容 - 点击这里  如何支付背书 2022 Morelos

多功能性 使其成为数字创意、插图、平面设计的理想伴侣,甚至可以为视频游戏、营销活动生成资源,或者只是享受探索人工智能极限的乐趣。

稳定扩散在内部如何发挥作用?

稳定扩散源于 训练数百万张带字幕的图像 得益于大型数据集(例如 LAION-5B),AI 可以学会将文本概念与视觉模式关联起来。该模型使用所谓的 扩散模型:首先通过将图像变成噪声来破坏图像,然后学习根据用户输入的文本从头开始重建它。

在每一步中,模型都会完善图像, 降低噪音并提高细节水平,直到结果接近我们所描述的场景。此外,稳定扩散允许您调节某些词语的“权重”,以优先考虑(或减弱)场景的特定元素、操纵风格并避免不必要的结果。

La 项目的不断发展及其对代码的开放性 使得社区出现了无数的变体和改进,例如新模型、新风格和技术,以实现更加现实或具体的结果。

稳定扩散-7指南

与其他工具相比,Stable Diffusion 有哪些优势?

稳定扩散的主要区别是 它的免费和开源特性。与 MidJourney 或 DALL-E 等其他模型不同,您可以在自己的计算机上运行它,将其安装在服务器上,尝试新事物,并根据自己的喜好进行修改。其他显著优势包括:

  • 免费(高级平台除外):您可以免费使用大多数网络服务和本地安装,除非您选择高级服务器或想要访问非常具体的高级功能。
  • 隐私: 您无需离开系统即可创建图像,从而避免云数据或连接速度慢的问题。
  • 模块化和定制化: 支持无限的自定义模型、样式、扩展和社区开发的资源。
  • 质量和细节: 最新一代模型(SDXL、Juggernaut、Realistic Vision 等)可与付费图像制作相媲美,甚至经常超越后者。

鉴于此,还必须指出一些弱点或悬而未决的问题。最重要的是,应该注意的是,稳定扩散呈现 比其他解决方案更陡峭的学习曲线 商业。 

入门:如何在本地安装和配置稳定扩散

在计算机上安装稳定扩散比看起来要容易,尤其是使用流行的界面 自动1111,这已经尽可能地简化了 Windows 的流程。

  1. 前往官方存储库 GitHub 上的 Automatic 1111,查找“资产”部分并下载安装程序(.exe)。
  2. 运行下载的文件。安装过程可能需要一些时间,具体取决于您的计算机的速度。
  3. 完成后,您的桌面或目标文件夹中将有一个名为“A1111 WebUI”的快捷方式。双击将在浏览器中打开图形界面,准备开始创建。
  4. 如果您的计算机性能不是很强大,我们建议启用界面和扩展的自动更新以及“低 VRAM”选项。
独家内容 - 点击这里  如何打开SWF文件

如果您使用的是 Mac 或 Linux,则可以从其开源存储库中找到安装 Stable Diffusion 的具体指南。

如何在稳定扩散中编写有效的提示:结构、语法和技巧

图像的成功几乎完全取决于提示。 良好的结构将使您获得专业的结果 与那些通过模糊描述生成的图像有很大不同。

建议的提示应该表明:

  • 图像类型: 摄影、绘画、插图、3D渲染等
  • 主题: 图像中出现的人(人、动物、物体……),以及您想要的所有细节(年龄、种族、表情等)
  • 动作: 那家伙在干什么。
  • 背景/场景: 场景发生的地点、灯光、时间、主要颜色等。
  • 修饰符: 绘画风格、镜头和相机、一天中的时间、调色板、参考艺术家、分辨率、质量、特殊效果(如散景、模糊、纹理)......

负面提示,只需添加图像中您不想要的所有特征:“模糊、丑陋、变形的手、太多手指、文字、水印、低分辨率、比例不正确、病态、重复......”以及结果中令您困扰的任何其他内容。

稳定扩散

如何改进稳定扩散中的提示?

为了获得最佳效果,请遵循以下提示。建议正确调整重量和编程。稳定扩散允许你赋予某些词语更多或更少的重要性 使用语法 “词:因素”. word:factor 越高,该术语的相关性就越高;您可以使用额外的括号来进一步增加单词或概念的权重。

此外,语法驱动的提示编程允许您在单个图像中组合想法或样式,从而按照您定义的步骤从一个概念过渡到另一个概念。

如果您遇到困难或正在寻找快速灵感,Lexica、Civitai 或 Stable Diffusion 自己的 PNG Info 选项卡等平台可让您拖动 AI 生成的图像并查看用于创建它们的确切提示。

超现实主义和艺术图像的最佳稳定扩散模型

稳定扩散宇宙比其基本模型要广阔得多。 目前有大量适合特定风格的自定义模型(检查点),例如照片写实主义、动漫、技术插图等。 其中一些最受推荐和最受欢迎的是:

SD 1.5 的型号:

  • 巨像重生: 擅长逼真的皮肤、差异化的背景和自然的色彩。温暖的 RAW 风格效果。
  • 现实愿景 v5.1: 对肖像、情感和面部细节的掌握很好。背景和主题非常平衡。
  • 我不敢相信这不是摄影: 用途广泛,光线和角度都很出色。适合肖像和各种主题。
  • 光子V1: 质量和多功能性之间的平衡,尤其是对于人类主题。
  • 现实库存照片: 非常精致,目录风格的图像,没有皮肤瑕疵。
  • aZovya 照片真实: 不太为人所知,但能产生出色的结果,并可用于与其他模型合并技术。
独家内容 - 点击这里  入门和学习 Excel 公式所需的基本 Excel 公式

SDXL(最新一代)的型号:

  • 巨无霸 XL (x): 电影构图,擅长肖像和理解长提示。
  • RealVisXL: 在产生皮肤真实瑕疵、纹理和色调变化方面无与伦比。
  • HelloWorld XL v6.0: 它带来了模拟方法、良好的身体比例和复古美感。使用 GPT4v 标记来获得更复杂的提示。
  • 荣誉提名: PhotoPedia XL、Realism Engine SDXL、Fully Real XL(不太新但仍然有效)。

所有这些模型都可以从以下存储库免费下载: 奇维泰,然后简单地将它们放在适当的文件夹中即可出现在稳定扩散界面中。

稳定扩散

如何在 Stable Diffusion 中安装和管理自定义模型

下载新模板非常简单:

  1. 访问 Civitai 等存储库并通过“检查点”进行过滤。
  2. 选择您想要的模型(确保它具有 .safetensor 扩展以增加安全性)。
  3. 下载文件并将其复制到路径/stable-diffusion-webui/models/Stable-diffusion。
  4. 重新启动界面并从“检查点”面板中选择模型。

使用稳定扩散获得真正令人惊叹的图像的专业技巧

掌握稳定扩散需要进行实验、从结果中学习以及磨练你的技术和想象力:

  • 玩转嵌入: 为了微调图像的美感,请尝试模型创建者推荐的嵌入(例如,BadDream、UnrealisticDream、FastNegativeV2、JuggernautNegative-neg)。嵌入允许您调整手、眼睛等特征。
  • 使用面部细节扩展: A1111 的 Adetailer 扩展或 ComfyUI 中的 Face Detailer Pipe 节点将帮助您在脸部和手部获得完美的效果,对于逼真的肖像尤其有用。
  • 完美主义者的 ControlNets: 如果您对手、姿势或身体有要求,请探索不同类型的 ControlNet 来微调您的构图。
  • 反复试验: 不要期望第一张图片是完美的;关键在于迭代、修改提示和调整底片,直到达到所需的质量。
  • 注意提示的结构: 避免矛盾(例如,同一句话中出现“长发”和“短发”),并在开始时优先考虑概念,这将在最终形象中占有更大的比重。

在了解了稳定扩散的各种可能性之后,很明显,人工智能正在彻底改变我们创造的方式, 尝试并转换图像,获得越来越令人惊讶、专业和自然的效果。如果您对数字创意感兴趣,那么现在是探索人工智能视觉生成世界的最佳时机:有了好的提示、正确的工具和一点练习,任何人都可以将他们想象的图像变为现实,从简单的草图到与专业摄影难以区分的超现实主义构图。