Meta开发出文生图模型CM3Leon

新知榜官方账号

2023-07-22 01:28:35

简介

Meta公司宣布开发出一款名为CM3Leon的文生图模型，该模型能够独力解决文本到图像和图像到文本的双向生成任务。

SEO关键词

Meta
CM3Leon
文生图模型

摘要

CM3Leon是一款多模态模型，能够以其他图像和文本内容的任意序列为条件，生成相应的文本与图像序列。该模型具备自回归模型的功能多样性和有效性，同时保持着较低的训练成本和良好的推理效率。CM3Leon在文本到图像的生成方面表现出同类领先的性能。

详细内容

Meta公司宣布开发出一款名为CM3Leon的文生图模型，该模型能够独力解决文本到图像和图像到文本的双向生成任务。与其他文生图模型不同，CM3Leon采用了基于token的自回归模型方法，训练时的计算量仅相当于以往基于Transformer方法的五分之一，但在文本到图像的生成方面获得了同类领先的性能。

CM3Leon是首个使用纯文本语言模型配方改编和训练而成的多模态模型，并经历了大规模检索增强预训练和随后的多任务监督微调（SFT）阶段。作为一套因果掩码混合模态（CM3）模型，它能够以其他图像和文本内容的任意序列为条件，生成相应的文本与图像序列，这极大扩展了以往大模型只能从文本到图像、或者只能从图像到文本的功能局限。

Meta称，与目前广泛使用的图像生成基准（零样本MS-COCO）进行性能比较时，CM3leon获得了4.88的FID（FréchetInceptionDistance，一种用于计算真实图像与生成图像间特征向量距离的指标，FID值越小则相似度越高，最好为0），超越谷歌的文本到图像模型Parti，证明了自身技术的先进性。此外，CM3leon还表现出令人印象深刻的复杂组合对象生成能力。

CM3Leon的跨任务执行能力展现出强大的通用性，能够在单一模型之上完成文本引导的图像生成与编辑、文本任务、结构引导的图像编辑、物体到图像、抠图、超分辨率结果等各项任务。

随着AI行业的不断发展，像CM3Leon这样的生成模型正变得越来越复杂。这些模型通过数百万的示例图像接受训练，学习视觉效果与文本之间的关系，但同时也可能反映训练数据集中存在的偏差/偏见。Meta称，目前AI行业仍处于理解和应对这些挑战的早期阶段，提升透明度才是加速解决这些问题的关键。

本页网址：https://www.xinzhibang.net/article_detail-8469.html

寻求报道，请

关键词

分享至微信：

相关工具

StabilityAI推出的文本到图像生成AI

AI改图神器

AI万能图片在线编辑器

Deep Dream Generator

AI创建生成梦幻般的插画图片，刻画你的梦中场景

标小智Logo生成

人工智能AI生成Logo设计工具

Hotpot.ai

AI图片图像处理和生成工具

Scribble Diffusion

将草图转变为精美的插画

2022年，生成式人工智能再次打破认知边界

2022年，生成式人工智能再次打破认知边界在当下的AI赛道上，生成式人工智能又一次打破人类的认知边界，谷歌发布最强Gemini大模型，美国人工智能开发机构OpenAI推出聊天机器人ChatGPT，微软在旗下AI助手Copilot发布一周年之际，宣布将接入OpenAI的最新模型GPT-4Turbo。随

分类标签生成式人工智能GeminiAI大模型

12-09 00:16

ChatGPT和GPT-4.0解读：人工智能如何改变我们的生活

ChatGPT和GPT-4.0：引领生活方式的变革在这个快速发展的科技时代，ChatGPT和GPT-4.0作为先进的人工智能技术，正在引领着生活方式的变革。这些变化不仅仅局限于技术领域，而是深入到我们日常生活的各个方面，从工作、学习到娱乐，甚至改变了我们的思考方式。工作效率的革新ChatGPT和GP

分类标签 ChatGPTGPT-4.0人工智能

12-08 16:03

人工智能的发展带来的机遇和挑战

随着人工智能的不断发展，它对人类社会的影响也日益深远。首先，人工智能对劳动力市场的影响不容忽视。大量的重复性、简单性工作将被机器人和自动化系统取代，人类可能需要调整职业方向和技能水平，以适应新的工作环境。其次，人工智能对教育体系的冲击也颇具挑战性。越来越多的学校和教育机构正在引进人工智能技术，从而改

分类标签人工智能机遇挑战

12-08 16:02

人工智能在各领域的应用及投资机会分析

一、人工智能在各领域的应用人工智能可以广泛应用于医疗诊断、金融风控、交通管理、气候预测等领域，提供准确、快速和智能化的解决方案。在金融行业，利用智能算法进行风险评估和投资决策，可以大大提高决策的准确性和效率。在医疗领域，人工智能辅助疾病诊断和治疗，可以帮助医生更好地分析病情和制定治疗方案。在交通领域

分类标签人工智能机器学习深度学习

12-08 02:01

图灵测试能判断AI智能吗？

图灵测试能判断AI智能吗？UCSD的研究人员通过设计图灵测试，检验了包括GPT-4、GPT-3.5、ELIZA以及人类参与者在内多个AI系统与人类的区别能力。结果发现，60年前基于规则的老AI系统ELIZA的表现不但超过GPT系列模型，还达到了27%的成功率，仅次于人类参与者的63%成功率。这一结果

分类标签图灵测试AI智能ELIZA

12-07 16:03

微软开放BingGPT-4和MicrosoftBingAI绘画工具实测对比

微软开放BingGPT-4和MicrosoftBingAI绘画工具实测对比微软开放了BingGPT-4和MicrosoftBingAI绘画工具，这是一件值得关注的事情。本文对比实测了MicrosoftBingAI和Midjourney绘画工具，分析了它们的优缺点。MicrosoftBingAI的界面

分类标签微软BingGPT-4MicrosoftBingAIai绘画Midjourney对比实测

12-01 22:23

发现一个超酷的AI绘画工具，让你的想象变成独一无二的艺术作品

发现一个超酷的AI绘画工具，让你的想象变成独一无二的艺术作品这几天我发现了一款超酷的AI绘画工具，简直就像是一位艺术家的私人助手！它能够将我们的想象力转化为独一无二的艺术作品。我简直被它的功能和表现力震撼到了！现在我迫不及待地想和你分享这个发现。好了，废话不多说，让我来告诉你AI绘画工具在哪找到以及

分类标签 AI智绘MidJourneyDreamAIArtGenerator

12-01 22:22

酒精墨水中美丽的编发发型女性

酒精墨水中美丽的编发发型女性这幅作品描绘了一个女性形象，使用了酒精墨水绘制而成。她拥有一头美丽的编发发型，发丝在艺术家CarlieCu的巧妙处理下呈现出流动的质感。墨水的运用创造了绚丽多彩的效果，给人一种抽象而独特的感觉。通过这幅作品，我们可以感受到艺术家对细节的精心绘制，展现了女性的优雅和柔美之处

分类标签 AI绘画GPT生成式创作提示词

12-01 22:21

使用Midjourney绘画聊天机器人的注册与使用方法

使用Midjourney绘画聊天机器人的注册与使用方法Midjourney是一款搭在Discord上的AI绘画聊天机器人。用户在使用Midjourney之前，需要创建一个Discord账号才能使用。在这里小编提醒大家，访问Midjourney需科学上网。注册Discord账号首先，我们可以通过官网链

分类标签 Midjourney绘画聊天机器人Discord

12-01 22:20

灯塔、彩色核爆、剑武士、松鼠大厨、精灵女王、沙滩、亚热带古大陆——优质Ai绘画干货分享

灯塔一座风化的旧灯塔，油漆腐烂，滔天巨浪，电闪雷鸣。戏剧性灯光、电影般的、充满活力的色彩、次表面散射、色差、空灵的、令人惊叹的至高无上的插画，波普装饰艺术，印象派，酒精墨水混合。彩色核爆核弹在外太空中爆炸，星云，霓虹水彩画，创意的，空灵，超高清。剑武士剑武士，煞雾，白色主题，白袍，冷漠，蔑视，黑发，

分类标签灯塔彩色核爆剑武士松鼠大厨精灵女王沙滩亚热带古大陆

12-01 22:19

相关快讯

如何注册Midjourney账号？

首先需要使用国外网络，注册流程：打开Midjourney网站之后，点击 “sign in”。（如果你已经注册了账号，点击“join the beta”会自动进入到“discord，新用户就不用搭理这个啦）如果没有注册，那就点击“sign in”，点击下方的“注册”按钮，然后弹出一个填写信息框，大家按照要求去填写就好了。

2023-06-27 16:10:29

Midjourney5.2版本开始测试，用文字“画”出图片变

在 5.2 版本的 Midjounry 中，还加入了Variation Mode模式，这个功能可以对用户生成的图片进行调整。它拥有High Variation 和Low Variation两个模式。其中 High Variation 可以对图片进行较高程度的调整，在细节和构图方面与原图产生较大的改变。而Low Variation 模式则可以在构图不变的情况下，对原图的细节内容进行微调。另外，Midjourney 还对提示词进行了优化，用户可以更方便地优化自己的提示词，通过自动检测用户给出的提示词，并提

2023-06-27 15:58:22

Midjourney官方中文版在QQ开启内测申请

据Midjourney AI官微消息，Midjourney官方中文版已经开启内测，其将搭载在QQ频道上，每周一、周五下午6点统一开放，达到一定人数后会关闭入口。

2023-06-26 15:44:30

AI作画神器Midjourney再次更新拥有相机“变焦”功

上个月刚刚更新完的AI作画神器Midjourney又给用户带来惊喜了。当地时间6月23日，Midjourney宣布推出全新5.2版本。此次更新包括改进美学风格、生成连贯性、文本理解，并提供提示词分析功能、高变化模式、高分辨率模式，其中最令人心动的是全新Zoom out功能。 Zoom out功能可像相机一样变焦，通过1.5倍、2倍以及自定义缩放，允许用户扩展原始图像，并填充所有侧面细节，达到重构图像的效果。本次更新的另一个亮点是变化模式功能。此功能允许用户打磨输出图像的细微视觉差别，有高/低变化模式两种

2023-06-26 15:43:59

Midjourney 5.2 震撼发布，原画生成 3D 场景

此次 5.2 版本最亮眼的更新在于 zoom out 功能，它可以无限扩展原始图像，同时保持跟原始图像的细节相同。用 zoom out 做出的无垠宇宙动画，直接让人震惊到失语，可以说，Midjourney 5.2 看得比詹姆斯韦伯太空望远镜还要远！这个极其强大的功能，可以创造出非常神奇的图片，甚至还能被用来拍摄毫无破绽的高清变焦视频！

2023-06-26 15:43:29

Midjourney输入imagine没反应

1、输入的imagine格式不正确：输入的imagine格式不正确，midjourney无法解析或者识别，也会导致没有反应。这时候需要检查输入的imagine格式是否正确，或者将imagine内容更改为正确的格式或内容，以解决问题； 2、midjourney没有安装插件：midjourney没有安装插件，也会导致输入imagine没有反应。这时候需要安装或者配置相关的插件或者工具，以解决问题。

2023-06-25 11:08:27

Midjourney如何垫图，生成自己风格的动漫？

1、打开midjourney官网，找到输入指令的地方，左下角有个+号，点击+号，弹出上传文件； 2、选择自己的头像，最好是清晰度比较高，背景比较简单的头像，点击上传，上传成功后，记得敲回车键； 3、敲回车键之后，会展示在midjourney的成图区域，之后点击照片； 4、之后右健，选择复制图片地址； 5、在输入栏，输入复制的地址，注意删掉图片尾部的？后边的长和宽字符，包括？图片必须是已jpg或者png格式的、 6、最后可以在图片链接输入一些你需要指定的动漫风格，比如anime style（日本

2023-06-25 11:06:44

Midjourney怎么下载高清图片？

midjourney下载高清图片步骤如下： 1、加入Midjourney； 2、在官方服务器上，选择newbies-#左侧边栏中可见的任何频道； 3、使用/imagine命令。命令用于创建图像、更改默认设置、监视用户信息以及执行其他有用的任务； 4、处理成果。MidjourneyBot需要大约一分钟的时间来生成四个选项； 5、生成所选图像的更大版本并添加更多细节。V按钮创建所选网格图像的细微变化。创建变体会生成与所选图像的整体风格和构图相似的新图像网格； 6、保存你的图像，单击图像以全尺寸打开

2023-06-25 11:05:02

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway