谷歌的MusicLM:从文本描述到生成音乐的人工智能模型

新知榜官方账号

2023-07-05 17:00:33

谷歌的MusicLM是一种从文本描述中生成音乐的人工智能模型,可以根据简单的文本提示生成合格音乐,并可根据画面主题生成音乐。MusicLM可以针对复杂描述生成有意义的音乐。

虽然生成音乐的AI系统早已被开发出来,但由于技术限制和训练数据有限,还没有人能够创作出曲子特别复杂或保真度特别高的歌曲。相对而言,MusicLM模型简直是生成音乐的小能手,会的乐曲五花八门,你能想到的它都会满足。有人对这一研究给予极高的评价:这比大火的ChatGPT还重要,谷歌几乎解决了音乐生成问题。

MusicLM背后的团队称,在他们的论文中解释了AI音乐生成面临的各种挑战。MusicLM结合了MuLan+AudioLM和MuLan+w2b-Bert+Soundstream等多个模型,可谓集大成者。MusicLM结合了MuLan+AudioLM等多个模型其中,AudioLM模型可视作MusicLM的前身,MusicLM就是利用了AudioLM的多阶段自回归建模作为生成条件,可以通过文本描述,以24kHz的频率生成音乐,并在几分钟内保持这个频率。相较而言,MusicLM的训练数据更多。

MusicLM为雅克-路易·大卫的名作《跨越阿尔卑斯山圣伯纳隘道的拿破仑》所作的配乐,就庄重典雅,将冬日的凌厉肃杀和英雄主义色彩体现地淋漓尽致。连《格尔尼卡》《星空》这类抽象派画作,MusicLM均可识别并创作。

但MusicLM肯定不是完美无缺的,或者说离完美仍有相当的距离。AI生成的音乐虽然是“原创”,但往往像不同音乐人作品的杂糅,也就是说有洗稿甚至是山寨的嫌疑。最根本的质疑,还是AI到底能不能真正代替人类的艺术创作?

本页网址:https://www.xinzhibang.net/article_detail-5915.html

寻求报道,请 点击这里 微信扫码咨询

关键词

MusicLM 人工智能 音乐 生成 模型 文本描述

分享至微信: 微信扫码阅读

相关工具

相关文章