- GPT-4o 现在可以本地生成图像,取代 ChatGPT 中的 DALL-E。
- 提高了在图像中生成文本和多个对象的准确性和视觉一致性。
- 付费和免费用户均可使用,未来将扩展到其他服务。
- 安全措施和对版权的尊重,避免模仿在世艺术家。
OpenAI 在生成人工智能的演进中又迈出了一步,通过整合 使用 GPT-4o 直接在 ChatGPT 中生成图像。这一变化代表着 与基于 DALL-E 模型的先前版本相比有显著的进步, 为用户提供更加流畅和一致的体验。要了解有关此集成的更多信息,请访问我们的文章 如何使用 DALL-E 3 创建图像.
新功能 现在可供 Plus、Pro 和 Team 计划订阅者使用,对于免费用户来说,他们可以生成的图像数量也有一些限制。它将很快通过 API 和 ChatGPT Edu 教育服务向开发人员推出。
追求更高精度的模型

GPT-4o 的突出之处在于它能够 生成更精确、更详细的图像,克服了之前的局限性,例如文本渲染效果差以及难以在场景内一致地定位物体。对于那些有兴趣 免费使用 ChatGPT 4,这个新版本代表了图像生成方面的显著进步。
通过放弃 DALL-E 中使用的扩散技术并采用自回归方法, 现在创建的图像具有更大的结构逻辑。这意味着可以在海报或视觉文档上生成具有特定位置的多个对象的插图和清晰的文本。
主要应用和增强功能
ChatGPT 中的新一代图像开辟了多种实际用途,包括:
- 平面设计:创建横幅、海报和自适应视觉内容。
- 教育:多种格式的信息图表、图表和解释方案。
- 数字营销:为社交媒体和在线活动生成内容。
- 电子游戏开发:人物和场景的概念化。
此外,该技术在该领域的集成 聊天机器人的数量 正在不断发展,让更多用户受益于这些创新功能。
安全措施和限制
为了避免法律和道德冲突,OpenAI 实施了 严格的政策防止直接模仿在世艺术家的风格。此外,所有生成的图像都包含 C2PA 元数据,以证明其来源并防止错误信息。此外,该公司还 加强了审核力度,以检测和阻止不当内容的创建,例如露骨暴力或欺诈性操纵的图片。
凭借这一新突破, OpenAI 加强其在生成人工智能领域的领导地位适应用户需求并响应市场需求 更精确、更易于获得的解决方案.
我是一名技术爱好者,已将自己的“极客”兴趣变成了职业。出于纯粹的好奇心,我花了 10 多年的时间使用尖端技术并修改各种程序。现在我专攻计算机技术和视频游戏。这是因为 5 年多来,我一直在为各种技术和视频游戏网站撰写文章,旨在以每个人都能理解的语言为您提供所需的信息。
如果您有任何疑问,我的知识范围涵盖与 Windows 操作系统以及手机 Android 相关的所有内容。我对您的承诺是,我总是愿意花几分钟帮助您解决在这个互联网世界中可能遇到的任何问题。