OpenAI推出DALL·E3,将AI绘画圈炸翻

新知榜官方账号

2023-09-22 03:21:31

导读

Prompt不存在了?DALL·E3忽然合并进ChatGPT,作图精准,细节逼真,OpenAI今天真的炸翻了AI绘画圈。

早上醒来,AI绘画圈已被炸翻。OpenAI丢下一枚重磅炸弹——合并ChatGPT的DALL·E3,官宣了!一个是史上最强大语言模型,一个是史上最强文生图模型,二者一合体,势必要颠覆整个AIGC圈。

经过最强变身后的DALL·E3,能够理解语义的细微差别,细节逼真到可怕。Prompt:「一幅鳄梨坐在治疗师椅子上的插图,说『Ijustfeelsoemptyinside』,中间有一个坑大小的洞。治疗师,一把勺子,涂鸦笔记」网友惊呼:「如果DALL·E3真的能准确呈现图像中的文本,那么它将彻底改变游戏规则!!!」同时,prompt的门槛,也大大降低。「语死早」的用户,再也不用担心写不出华丽丽的提示词。

给个提示,ChatGPT就给你写出洋洋洒洒的段落。总之,你可以尽情展开想象,让ChatGPT带你飞!再也不用绞尽脑汁去思考如何prompt了!仅仅和ChatGPT对话,就能妙笔生花甚至,你还可以在对话过程中,基于生成的图像随时做出修改。

可以看出,为了赶在谷歌发布多模态Gemini前夜,OpenAI先下手了。英伟达高级AI科学家JimFan兴奋表示,这就是大规模多模态LLM与谷歌Gemini史诗之战的提前预演!OpenAICEOSamAltman也在评论区得意地表示:「Wearesoback」。

目前,DALL·E3还在内测中,预计将在10月上旬向所有Plus用户和企业用户推出。Midjourney劲敌真来了!DALL·E3的独特之处在于,它是在ChatGPT上原生构建的。只需向ChatGPT提出要求,一个简单的句子,或者一个详细的段落,它就能开启头脑风暴,改进提示。

英伟达顶级科学家JimFan表示,这太震撼了!DALL·E3的意义在于,它不仅是Midjourney的强劲对手,更代表着多模态大模型之战的一触即发。DALL·E3的卓越语言匹配能力,是建立在坚实的文本GPT基础之上的。Midjourney其实并没有多少「推理大脑」,这就是为什么需要这么多的提示黑客。先有大脑,再有像素,这就是构建强大多模态人工智能的方法。不用学提示工程,你只管天马行空。提示词,ChatGPT帮你代笔,而精美画作细节,就由DALL·E3承包了。

下面这个例子告诉你,DALL·E3生成如下一幅画时,是如何详尽地将文字中的每一个场景,栩栩如生地刻在画中,画质仿佛电影一般。

一轮满月下洒满街道,熙熙攘攘的行人正享受着夜生活。街角摊位上,一位有着火红秀发,身着典雅天鹅绒斗篷的少女,正与脾气暴躁的老板讨价还价。这个老板身材高大魁梧,身穿笔挺的西装,留着引人注目的山羊胡,正用他那部复古蒸汽朋克风格的电话兴致勃勃地交谈着。另外,在同一个提示下,比起DALL·E2,DALL·E3绘出的图像会更加精准。比如,「Anexpressiveoilpaintingofabasketballplayerdunking,depictedasanexplosionofanebula」,DALL·E3在人物、篮球、更宏观背景生成上更加详细。

从网友做的对比图中可以看到,DALL·E3和DALL·E2之间的差距,可以说是史诗级的。网友表示,OpenAI这次绝不仅仅是为了超越Midjourney。谷歌才是他们最大的竞争对手,尤其最近Gemini一直箭在弦上。

有人说,这种变化体现了AI作画工具的一个重要演进趋势:听懂人话。如果AI能让我们更好地描述和修改图像,那就太好了!DALL·E3能走多远,让我们拭目以待。

DALL·E3+ChatGPT

DALL·E3+ChatGPT,有多惊艳?Altman在一段宣传视频暗藏了DALL·E3生成的可爱细节。DALL·E3能够把一个5岁孩子的幻想,变成现实。「我家5岁宝宝一直在说一个「超级向日葵刺猬」,它该长什么样?」ChatGPT自动根据4个不同提示词,生成了不同的风格的图像。这里选择了最后一张,就可定下继续创作的基图。接下来,给小刺猬起名Larry,并为它画一个房子。可以看到,DALL·E3不仅准确理解了要求,而且还能够在图片中标注文字,在一个邮箱上面有「Larry」。完全解决了,之前DALL·E模型完全不会写字的难题。你还可以边画,边完善故事情节,甚至还能为其配上插画。另外,DALL·E3还可以根据以上风格,生成可爱的贴纸,最后,让ChatGPT总结上上述内容,再生成一个睡前故事,简直绝绝子。OpenAI官方,也给出了一大波精美图集。

全新原型,代号「Gizmo」

与此同时,网友「TiborBlaho」还爆料称,OpenAI正在为ChatGPT开发一款代号为「Gizmo」的全新原型——它有着更新的UI界面,并为企业客户引入了强大的「Gizmo编辑器」,允许用户创建自己的「GPT」。具体来说,你可以为自己的GPT定义个人资料图片、模型(GPT-3.5或GPT-4)、能力(包括DALL·E、网页浏览、编码沙盒、插件等)、已启用的插件列表、行为(这个GPT是什么,它做什么,它应该知道什么)、欢迎消息(当用户与这个GPT开始新的聊天时,它应该说什么),并决定这个GPT是不是私有的。

参考资料: https://openai.com/dall-e-3

本页网址:https://www.xinzhibang.net/article_detail-13011.html

寻求报道,请 点击这里 微信扫码咨询

关键词

OpenAI DALL·E3 AI绘画圈 ChatGPT 多模态人工智能 Gemini

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯