新知榜官方账号
2023-07-03 10:22:46
自从Midjourney发布v5之后,在生成图像的人物真实程度、手指细节等方面都有了显著改善,并且在prompt理解的准确性、审美多样性和语言理解方面也都取得了进步。相比之下,StableDiffusion虽然免费、开源,但每次都要写一大长串的prompt,想生成高质量的图像全靠多次抽卡。最近StabilityAI的官宣,正在研发的StableDiffusionXL开始面向公众测试,目前可以在Clipdrop平台免费试用。试用链接:https://clipdrop.co/stable-diffusion
StabilityAI的创始人兼首席执行官EmadMostaque表示,目前该模型仍然处于训练阶段,等参数稳定后将会开源;SD-XL在「握手」等图像细节方面会表现更好,几乎完全可控。StableDiffusionXL也并不是最终发布版的名字,并且也并非是v3,因为SD-XL的架构和SD-v2系列的模型架构非常相似。
Minimalistichomegymwithrubberflooring,wall-mountedTV,weightbench,medicineball,dumbbells,yogamats,high-techequipment,highdetail,organizedandefficient.简约的家庭健身房,橡胶地板,壁挂式电视,举重凳,药球,哑铃,瑜伽垫,高科技设备,高细节,组织和效率
下面几张SD-XL官方发布的例图,可以看出图像的质量已经非常能打了。不过有时候less并不代表more,有网友认为SD-XL为了摆脱「糟糕的品味」,设定了太多的规则,定制化空间越来越小,不符合大多数人的喜好。目前v1.5的StableDiffusion仍然是社区内最流行的基座模型。网友表示希望新版SD能够和SD2.1版本的嵌入、hypernetworkds和Lora模型保持兼容,再从零开始重训的话就太难受了。也有网友认为,SD-XL的表现和civit网站上网友分享的模型差不多,新模型的效果也并不是特别惊艳,也就是平均水平。
StableDiffusionXL模型具有以下特点:
需要注意的是,SD-XL可能与之前版本的插件不兼容。清晰可读的文字在v1系列和v2.1版本的StableDiffusion模型中,并不具备在图片中生成可读文本的能力。虽然SD-XL生成的文本信息并不总是准确,但确实得到了巨大的提升。
StableDiffusion在生成人体结构方面一直存在诸多问题,多几条腿、少个胳膊实在是太常见不过的问题,通常需要使用inpaint功能进一步对图像细节进行修正;或者是使用ControlNet的OpenPose功能从参考图像中复制人体的姿态。比如说SD-v1.5生成瑜伽的图像,经常会出现扭曲的人体。
SD-XL虽然生成的图像并不完美,不过在人体姿态方面已经有了显著的进步。更有美感(moreaesthetic)比如同样以屋子为主题,SD-XL可以生成更对称、视觉效果更好的照片。SD-XL在肖像照片上也有显著改进。
SD-XL虽然有很多优点,但仍然存在一些局限性。比如在添加一些无关紧要的关键字后,模型的风格可能会突然转变。问题的故障可能源于预览问题,在正式发布后该问题不知能否得到解决。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49