StabilityAI发布基于StableDiffusion的视频生成模型StableVideoDiffusion

新知榜官方账号

2023-11-24 06:06:11

StabilityAI发布基于StableDiffusion的视频生成模型StableVideoDiffusion

StabilityAI发布了基于StableDiffusion的视频生成模型StableVideoDiffusion，可以根据静态图像生成几秒钟的视频，已经超越了用户偏好研究中领先的闭源模型。现在，你可以基于原有的静止图像来生成一段几秒钟的视频。

StableVideoDiffusion以两种图像到视频模型的形式发布，能够以每秒3到30帧之间的可定制帧速率生成14和25帧的视频。StabilityAI表示，正在计划建立和扩展这个基础的各种模型，类似于围绕stablediffusion建立的生态系统。

StableVideoDiffusion可以轻松适应各种下游任务，包括通过对多视图数据集进行微调从单个图像进行多视图合成。除此之外，该模型还能够提供强大的多视图3D先验，这可以作为多视图扩散模型的基础，模型以前馈方式生成对象的多个视图，只需要较小的算力需求，性能还优于基于图像的方法。

StableVideoDiffusion的技术层面达到了文本到视频或图像到视频的SOTA水平。通过插入时间层并在小型高质量视频数据集上进行微调，为2D图像合成训练的潜在扩散模型已转变为生成视频模型。

成功训练该模型包括以下三个阶段：阶段一：图像预训练；阶段2：视频预训练数据集；阶段3：高质量微调。为了分析视频预训练对最后阶段的影响，本文对三个模型进行了微调，这些模型仅在初始化方面有所不同。看起来这是个好的开始。

StableVideoDiffusion现阶段不适用于现实世界或直接的商业应用，后续将根据用户对安全和质量的见解和反馈完善该模型。

本页网址：https://www.xinzhibang.net/article_detail-20947.html

寻求报道，请

关键词

StabilityAI 视频生成模型 StableVideoDiffusion

分享至微信：

相关工具

NightCafe

AI艺术插画在线生成

秘塔捉捉猫

秘塔写作猫推出的AI文字到图像生成工具

Skybox AI

AI生成和合成360°全景图像插画

Midjourney

AI图像和插画生成工具

悟空图像PhotoSir

新一代专业图像处理软件，更智能、更高效、更好用

Hama

在线抹除图片中不想要的物体

11月科技投资：AI领域融资超5亿，VRAR领域融资近2亿，第三代半导体和钠离子电池也有动静

11月科技投资：AI领域融资超5亿，VRAR领域融资近2亿，第三代半导体和钠离子电池也有动静11月，科技领域发生了多笔重大融资，其中包括AI、VRAR、第三代半导体和钠离子电池等领域。本文将对这些领域的融资情况进行介绍，并提供相应的投资策略和风险提示。AI领域11月，德国AlephAlphaGmbH

分类标签 AI领域VRAR领域第三代半导体钠离子电池投资策略风险提示

12-09 16:02

百度文心大模型3.5超越ChatGPT3.5，未来国内只有少量大模型

近日，IDC发布AI大模型技术能力评估报告显示，百度文心大模型3.5拿下12项指标的7个满分，综合评分第一。在面向新浪科技等媒体沟通中，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出，新版本文心一言3.5已超越ChatGPT3.5，未来国内将只会有少量大模型。吴甜指出，大模型的终

分类标签百度文心大模型ChatGPT3.5大模型产业化

12-04 02:50

百度文心一言的起源、意义和技术原理

百度文心一言的起源百度文心一言最初是由百度公司推出的一种短语句生成工具，旨在为用户提供有趣、富有启示性的语句。每个一言都包含了深刻的思想和有趣的灵感，有时会通过幽默和巧妙的比喻来传达某些概念和情感。随着时间的推移，百度文心一言已经成为了一种文化现象，在中国的网络社区中广泛使用。百度文心一言的意义百度

分类标签百度文心一言起源意义技术原理

12-04 02:49

ChatGPT：AI已具备人类智能？

2022年12月，人工智能聊天机器人ChatGPT刷爆网络，网友们争先恐后去领略它的超高情商和巨大威力。参加高考、修改代码、构思小说......它在广大网友的“鞭策”下不断突破自我，甚至可以用一整段程序，为你拼接出一只小狗。那么，ChatGPT是如何炼成的？是否意味着AI已具有人类智能呢？ChatG

分类标签 ChatGPT人工智能自然语言生成

12-02 22:01

ChatGPT：从GPT-2到GPT-4，AI技术的边界不断扩展

ChatGPT：从GPT-2到GPT-4，AI技术的边界不断扩展ChatGPT作为一款革命性的人工智能产品，其成长历程是技术创新和社会影响力相结合的典范。自从OpenAI于2019年推出GPT-2以来，ChatGPT的发展经历了几个关键阶段，每一步都在推动着AI技术的边界。初创时期：GPT-2的问世

分类标签 ChatGPTGPT-2GPT-3

11-25 08:12

人工智能思维与人类思维的本质区别

人工智能思维与人类思维的本质区别一篇新论文认为，从ChatGPT等系统中看到的人工智能，由于缺乏体现和理解，与人类智能有着本质区别。加州大学的安东尼-切梅罗（AnthonyChemero）最近发表了一篇论文，解释了与人类思维相对的人工智能思维。人工智能的兴起引起了技术高管、政府官员和普通大众的不同反

分类标签人工智能人类智能LLMs

11-23 02:04

ChatGPT 4.0升级，更聪明、更高效、更亲切

ChatGPT 4.0升级，更聪明、更高效、更亲切大家有没有觉得，现在的手机助手越来越智能，可以回答我们各种问题，提供各种服务？这是因为人工智能技术不断发展，推出了更厉害的新版本。最近，一款名叫ChatGPT的人工智能助手就升级到了4.0版本，让我们一起来看看它有哪些新变化吧！ChatGPT 4.0

分类标签 ChatGPT人工智能助手4.0版本

11-23 02:03

ChatGPT之父山姆·阿尔特曼回归OpenAI担任首席执行官

ChatGPT之父山姆·阿尔特曼回归OpenAI担任首席执行官经过5天的反转再反转，“ChatGPT之父”山姆·阿尔特曼将回归OpenAI，担任首席执行官一职。就在几分钟前，OpenAI官方在社交平台上表示：“我们已在原则上达成协议，让SamAltman重返OpenAI担任首席执行官，并组建由Bre

分类标签 OpenAI山姆·阿尔特曼人工智能

11-23 02:02

OpenAI创始人辞职引发科技行业动荡

OpenAI创始人辞职引发科技行业动荡据路透社20日援引科技媒体“TheInformation”报道，美国人工智能公司OpenAI董事会成员伊尔亚·苏茨克维当天在给公司员工的一份声明中称，OpenAI创始人山姆·奥特曼将不会重新担任公司首席执行官（CEO），视频流媒体网站Twitch的联合创始人埃米

分类标签 OpenAI人工智能CEO

11-21 02:01

OpenAI董事会罢免首席执行官SamAltman引发争议

OpenAI董事会罢免首席执行官SamAltman引发争议OpenAI董事会罢免首席执行官SamAltman引发投资者和员工的不满。微软首席执行官萨蒂亚·纳德拉表达了对Altman的支持，而一些关键风险资本支持者正在考虑对董事会提起诉讼。此外，OpenAI顶级人工智能研究人员和高管正在递交辞呈。Op

分类标签 OpenAISamAltman人工智能

11-19 16:03