StableDiffusionXL：StableDiffusion的新版本正在面向公众测试

新知榜官方账号

2023-07-03 10:22:46

StableDiffusionXL：StableDiffusion的新版本正在面向公众测试

自从Midjourney发布v5之后，在生成图像的人物真实程度、手指细节等方面都有了显著改善，并且在prompt理解的准确性、审美多样性和语言理解方面也都取得了进步。相比之下，StableDiffusion虽然免费、开源，但每次都要写一大长串的prompt，想生成高质量的图像全靠多次抽卡。最近StabilityAI的官宣，正在研发的StableDiffusionXL开始面向公众测试，目前可以在Clipdrop平台免费试用。试用链接：https://clipdrop.co/stable-diffusion

StabilityAI的创始人兼首席执行官EmadMostaque表示，目前该模型仍然处于训练阶段，等参数稳定后将会开源；SD-XL在「握手」等图像细节方面会表现更好，几乎完全可控。StableDiffusionXL也并不是最终发布版的名字，并且也并非是v3，因为SD-XL的架构和SD-v2系列的模型架构非常相似。

简约的家庭健身房

Minimalistichomegymwithrubberflooring,wall-mountedTV,weightbench,medicineball,dumbbells,yogamats,high-techequipment,highdetail,organizedandefficient.简约的家庭健身房，橡胶地板，壁挂式电视，举重凳，药球，哑铃，瑜伽垫，高科技设备，高细节，组织和效率

SD-XL官方发布的例图

下面几张SD-XL官方发布的例图，可以看出图像的质量已经非常能打了。不过有时候less并不代表more，有网友认为SD-XL为了摆脱「糟糕的品味」，设定了太多的规则，定制化空间越来越小，不符合大多数人的喜好。目前v1.5的StableDiffusion仍然是社区内最流行的基座模型。网友表示希望新版SD能够和SD2.1版本的嵌入、hypernetworkds和Lora模型保持兼容，再从零开始重训的话就太难受了。也有网友认为，SD-XL的表现和civit网站上网友分享的模型差不多，新模型的效果也并不是特别惊艳，也就是平均水平。

SD-XL的特点

StableDiffusionXL模型具有以下特点：

使用较短的描述性prompt即可生成高质量图像
可以生成更贴合prompt的图像
图像中的人体结构更合理
生成的肖像图更逼真
图像中的文本更清晰

需要注意的是，SD-XL可能与之前版本的插件不兼容。清晰可读的文字在v1系列和v2.1版本的StableDiffusion模型中，并不具备在图片中生成可读文本的能力。虽然SD-XL生成的文本信息并不总是准确，但确实得到了巨大的提升。

StableDiffusion的改进

StableDiffusion在生成人体结构方面一直存在诸多问题，多几条腿、少个胳膊实在是太常见不过的问题，通常需要使用inpaint功能进一步对图像细节进行修正；或者是使用ControlNet的OpenPose功能从参考图像中复制人体的姿态。比如说SD-v1.5生成瑜伽的图像，经常会出现扭曲的人体。

SD-XL虽然生成的图像并不完美，不过在人体姿态方面已经有了显著的进步。更有美感（moreaesthetic）比如同样以屋子为主题，SD-XL可以生成更对称、视觉效果更好的照片。SD-XL在肖像照片上也有显著改进。

SD-XL的局限性

SD-XL虽然有很多优点，但仍然存在一些局限性。比如在添加一些无关紧要的关键字后，模型的风格可能会突然转变。问题的故障可能源于预览问题，在正式发布后该问题不知能否得到解决。

本页网址：https://www.xinzhibang.net/article_detail-4852.html

寻求报道，请

关键词

StableDiffusion SD-XL Clipdrop 人体结构肖像照片 prompt

分享至微信：

相关工具

Ribbet.ai

AI图片处理工具箱

6pen Art

面包多团队推出的从文本描述生成绘画艺术作品

Upscayl

免费开源的AI图片无损放大工具

造梦日记

AI一下，妙笔生画

Photosonic

Writesonic推出的AI艺术插画生成工具

Craiyon

免费在线文本到图像生成

11月科技投资：AI领域融资超5亿，VRAR领域融资近2亿，第三代半导体和钠离子电池也有动静

11月科技投资：AI领域融资超5亿，VRAR领域融资近2亿，第三代半导体和钠离子电池也有动静11月，科技领域发生了多笔重大融资，其中包括AI、VRAR、第三代半导体和钠离子电池等领域。本文将对这些领域的融资情况进行介绍，并提供相应的投资策略和风险提示。AI领域11月，德国AlephAlphaGmbH

分类标签 AI领域VRAR领域第三代半导体钠离子电池投资策略风险提示

12-09 16:02

百度文心大模型3.5超越ChatGPT3.5，未来国内只有少量大模型

近日，IDC发布AI大模型技术能力评估报告显示，百度文心大模型3.5拿下12项指标的7个满分，综合评分第一。在面向新浪科技等媒体沟通中，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出，新版本文心一言3.5已超越ChatGPT3.5，未来国内将只会有少量大模型。吴甜指出，大模型的终

分类标签百度文心大模型ChatGPT3.5大模型产业化

12-04 02:50

百度文心一言的起源、意义和技术原理

百度文心一言的起源百度文心一言最初是由百度公司推出的一种短语句生成工具，旨在为用户提供有趣、富有启示性的语句。每个一言都包含了深刻的思想和有趣的灵感，有时会通过幽默和巧妙的比喻来传达某些概念和情感。随着时间的推移，百度文心一言已经成为了一种文化现象，在中国的网络社区中广泛使用。百度文心一言的意义百度

分类标签百度文心一言起源意义技术原理

12-04 02:49

ChatGPT：AI已具备人类智能？

2022年12月，人工智能聊天机器人ChatGPT刷爆网络，网友们争先恐后去领略它的超高情商和巨大威力。参加高考、修改代码、构思小说......它在广大网友的“鞭策”下不断突破自我，甚至可以用一整段程序，为你拼接出一只小狗。那么，ChatGPT是如何炼成的？是否意味着AI已具有人类智能呢？ChatG

分类标签 ChatGPT人工智能自然语言生成

12-02 22:01

ChatGPT：从GPT-2到GPT-4，AI技术的边界不断扩展

ChatGPT：从GPT-2到GPT-4，AI技术的边界不断扩展ChatGPT作为一款革命性的人工智能产品，其成长历程是技术创新和社会影响力相结合的典范。自从OpenAI于2019年推出GPT-2以来，ChatGPT的发展经历了几个关键阶段，每一步都在推动着AI技术的边界。初创时期：GPT-2的问世

分类标签 ChatGPTGPT-2GPT-3

11-25 08:12

StabilityAI发布基于StableDiffusion的视频生成模型StableVideoDiffusion

StabilityAI发布基于StableDiffusion的视频生成模型StableVideoDiffusionStabilityAI发布了基于StableDiffusion的视频生成模型StableVideoDiffusion，可以根据静态图像生成几秒钟的视频，已经超越了用户偏好研究中领先的闭源

分类标签 StabilityAI视频生成模型StableVideoDiffusion

11-24 06:06

人工智能思维与人类思维的本质区别

人工智能思维与人类思维的本质区别一篇新论文认为，从ChatGPT等系统中看到的人工智能，由于缺乏体现和理解，与人类智能有着本质区别。加州大学的安东尼-切梅罗（AnthonyChemero）最近发表了一篇论文，解释了与人类思维相对的人工智能思维。人工智能的兴起引起了技术高管、政府官员和普通大众的不同反

分类标签人工智能人类智能LLMs

11-23 02:04

ChatGPT 4.0升级，更聪明、更高效、更亲切

ChatGPT 4.0升级，更聪明、更高效、更亲切大家有没有觉得，现在的手机助手越来越智能，可以回答我们各种问题，提供各种服务？这是因为人工智能技术不断发展，推出了更厉害的新版本。最近，一款名叫ChatGPT的人工智能助手就升级到了4.0版本，让我们一起来看看它有哪些新变化吧！ChatGPT 4.0

分类标签 ChatGPT人工智能助手4.0版本

11-23 02:03

ChatGPT之父山姆·阿尔特曼回归OpenAI担任首席执行官

ChatGPT之父山姆·阿尔特曼回归OpenAI担任首席执行官经过5天的反转再反转，“ChatGPT之父”山姆·阿尔特曼将回归OpenAI，担任首席执行官一职。就在几分钟前，OpenAI官方在社交平台上表示：“我们已在原则上达成协议，让SamAltman重返OpenAI担任首席执行官，并组建由Bre

分类标签 OpenAI山姆·阿尔特曼人工智能

11-23 02:02

OpenAI创始人辞职引发科技行业动荡

OpenAI创始人辞职引发科技行业动荡据路透社20日援引科技媒体“TheInformation”报道，美国人工智能公司OpenAI董事会成员伊尔亚·苏茨克维当天在给公司员工的一份声明中称，OpenAI创始人山姆·奥特曼将不会重新担任公司首席执行官（CEO），视频流媒体网站Twitch的联合创始人埃米

分类标签 OpenAI人工智能CEO

11-21 02:01