新知榜官方账号
2023-09-22 03:21:31
Prompt不存在了?DALL·E3忽然合并进ChatGPT,作图精准,细节逼真,OpenAI今天真的炸翻了AI绘画圈。
早上醒来,AI绘画圈已被炸翻。OpenAI丢下一枚重磅炸弹——合并ChatGPT的DALL·E3,官宣了!一个是史上最强大语言模型,一个是史上最强文生图模型,二者一合体,势必要颠覆整个AIGC圈。
经过最强变身后的DALL·E3,能够理解语义的细微差别,细节逼真到可怕。Prompt:「一幅鳄梨坐在治疗师椅子上的插图,说『Ijustfeelsoemptyinside』,中间有一个坑大小的洞。治疗师,一把勺子,涂鸦笔记」网友惊呼:「如果DALL·E3真的能准确呈现图像中的文本,那么它将彻底改变游戏规则!!!」同时,prompt的门槛,也大大降低。「语死早」的用户,再也不用担心写不出华丽丽的提示词。
给个提示,ChatGPT就给你写出洋洋洒洒的段落。总之,你可以尽情展开想象,让ChatGPT带你飞!再也不用绞尽脑汁去思考如何prompt了!仅仅和ChatGPT对话,就能妙笔生花甚至,你还可以在对话过程中,基于生成的图像随时做出修改。
可以看出,为了赶在谷歌发布多模态Gemini前夜,OpenAI先下手了。英伟达高级AI科学家JimFan兴奋表示,这就是大规模多模态LLM与谷歌Gemini史诗之战的提前预演!OpenAICEOSamAltman也在评论区得意地表示:「Wearesoback」。
目前,DALL·E3还在内测中,预计将在10月上旬向所有Plus用户和企业用户推出。Midjourney劲敌真来了!DALL·E3的独特之处在于,它是在ChatGPT上原生构建的。只需向ChatGPT提出要求,一个简单的句子,或者一个详细的段落,它就能开启头脑风暴,改进提示。
英伟达顶级科学家JimFan表示,这太震撼了!DALL·E3的意义在于,它不仅是Midjourney的强劲对手,更代表着多模态大模型之战的一触即发。DALL·E3的卓越语言匹配能力,是建立在坚实的文本GPT基础之上的。Midjourney其实并没有多少「推理大脑」,这就是为什么需要这么多的提示黑客。先有大脑,再有像素,这就是构建强大多模态人工智能的方法。不用学提示工程,你只管天马行空。提示词,ChatGPT帮你代笔,而精美画作细节,就由DALL·E3承包了。
下面这个例子告诉你,DALL·E3生成如下一幅画时,是如何详尽地将文字中的每一个场景,栩栩如生地刻在画中,画质仿佛电影一般。
一轮满月下洒满街道,熙熙攘攘的行人正享受着夜生活。街角摊位上,一位有着火红秀发,身着典雅天鹅绒斗篷的少女,正与脾气暴躁的老板讨价还价。这个老板身材高大魁梧,身穿笔挺的西装,留着引人注目的山羊胡,正用他那部复古蒸汽朋克风格的电话兴致勃勃地交谈着。另外,在同一个提示下,比起DALL·E2,DALL·E3绘出的图像会更加精准。比如,「Anexpressiveoilpaintingofabasketballplayerdunking,depictedasanexplosionofanebula」,DALL·E3在人物、篮球、更宏观背景生成上更加详细。
从网友做的对比图中可以看到,DALL·E3和DALL·E2之间的差距,可以说是史诗级的。网友表示,OpenAI这次绝不仅仅是为了超越Midjourney。谷歌才是他们最大的竞争对手,尤其最近Gemini一直箭在弦上。
有人说,这种变化体现了AI作画工具的一个重要演进趋势:听懂人话。如果AI能让我们更好地描述和修改图像,那就太好了!DALL·E3能走多远,让我们拭目以待。
DALL·E3+ChatGPT
DALL·E3+ChatGPT,有多惊艳?Altman在一段宣传视频暗藏了DALL·E3生成的可爱细节。DALL·E3能够把一个5岁孩子的幻想,变成现实。「我家5岁宝宝一直在说一个「超级向日葵刺猬」,它该长什么样?」ChatGPT自动根据4个不同提示词,生成了不同的风格的图像。这里选择了最后一张,就可定下继续创作的基图。接下来,给小刺猬起名Larry,并为它画一个房子。可以看到,DALL·E3不仅准确理解了要求,而且还能够在图片中标注文字,在一个邮箱上面有「Larry」。完全解决了,之前DALL·E模型完全不会写字的难题。你还可以边画,边完善故事情节,甚至还能为其配上插画。另外,DALL·E3还可以根据以上风格,生成可爱的贴纸,最后,让ChatGPT总结上上述内容,再生成一个睡前故事,简直绝绝子。OpenAI官方,也给出了一大波精美图集。
全新原型,代号「Gizmo」
与此同时,网友「TiborBlaho」还爆料称,OpenAI正在为ChatGPT开发一款代号为「Gizmo」的全新原型——它有着更新的UI界面,并为企业客户引入了强大的「Gizmo编辑器」,允许用户创建自己的「GPT」。具体来说,你可以为自己的GPT定义个人资料图片、模型(GPT-3.5或GPT-4)、能力(包括DALL·E、网页浏览、编码沙盒、插件等)、已启用的插件列表、行为(这个GPT是什么,它做什么,它应该知道什么)、欢迎消息(当用户与这个GPT开始新的聊天时,它应该说什么),并决定这个GPT是不是私有的。
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16