当前位置:
首页 > 新闻专区 > IT音频 > AI音乐之战:Meta和谷歌人工智能音乐生成器大比拼,到底谁更胜一筹?

AI音乐之战:Meta和谷歌人工智能音乐生成器大比拼,到底谁更胜一筹?

AI音乐世界的发展步伐正在迅速加快。就在上个月,谷歌将他们的文本转音乐AI MusicLM 开放给公众测试。本周,Meta公司发布了MusicLM的开源竞争对手MusicGen,并且也已向公众开放。

AI音乐之战:Meta和谷歌人工智能音乐生成器大比拼,到底谁更胜一筹?

MusicGen和MusicLM都是生成式AI模型,它们使用机器学习技术来生成音乐短句以响应文本输入。MusicGe根据用户提供的描述生成15秒的音频:输入从“20世纪90年代电吉他摇滚歌曲”到“高达180bpm的microtonal合成器主奏中的Gabber风格音轨”的任何内容,它都会尽力生成接近该描述的音乐。

如果用户在其托管平台HuggingSpace上注册,并运行该软件的更高级版本,MusicGen将制作长达120秒的剪辑。它还能够重新创建用户指定的旋律。上传一个参考音频文件,MusicGen将从中提取一段旋律,并将其合并到生成的剪辑中。因此,如果您想听到《绿袖子》(Greensleeves)的震撼EDM舞曲混音,或者《我心永恒》(My Heart Will Go On)的激荡金属版,MusicGen都会尝试创作它。

与MusicLM不同,MusicGen不会阻止用户在他们的提示中使用艺术家和歌曲名称,因此您可以自由要求它制作席琳·迪翁(Celine Dion)风格的民谣,或一首与Deadmau5(加拿大著名DJ和电子音乐人)的《Ghosts 'n' Stuff》有相同氛围的EDM电子舞曲。不过,你得到的结果很可能与你提到的艺术家或曲目没有什么相似之处。

这可能是因为MusicGen是根据存储库中的音乐进行训练的,而不是流行艺术家的音乐:Meta表示,MusicGe是根据2万小时的音乐进行训练的,其中包括来自库存媒体库ShutterStock和Pond5的39万首器乐曲目。

在Meta公司发表的一篇介绍MusicGen的论文中,该公司简要阐述了人们对人工智能生成音乐道德问题的担忧,认为他们的开源方法通过让音乐家和制作人使用他们的工具来平衡竞争环境。该论文写道:

“生成模型可能代表着对艺术家的不公平竞争,这是一个悬而未决的问题。”

该论文继续写到:

“开放研究可以确保所有参与者都能平等地使用这些模型。”

“通过开发更先进的控件,例如我们引入的旋律调节,我们希望这些模型对音乐爱好者和专业人士都有用。”

 

AI音乐之战:Meta和谷歌人工智能音乐生成器大比拼,到底谁更胜一筹?

在同一篇论文中,Meta将该软件生成的示例剪辑与谷歌的MusicLM、Riffusion和MusAI生成的示例进行了比较,声称他们的模型“优于评估的基线”。

Meta的MusicGen是否真的超过了谷歌MusicLM的能力?让我们通过一些例子来找出答案。我们正在评估AI模型完成我们提供的摘要的能力,并判断它生成的音乐的整体质量。我们将在MusicGen和MusicLM中运行相同的提示,看看谁的成绩最好,然后将我们的分数相加,宣布获胜者。

1、“乐观的流行音乐加上欢快的合成音主奏”(Meta MusicGen)

点击下载试听曲>>>

我们认为最好从简单的东西开始:快乐、活泼的合成器流行音乐。MusicGen对此处理得很好,尽管结果没有什么特色,而且相当平淡,我们可以想象它在商场的电梯里播放。诚然,音乐有一种乐观、流行的氛围,合成器当然也是存在的;然而,我们所要求的欢快的合成器主奏却无处可寻,我们唯一能听到的合成器位于音乐背景中。

1、“乐观的流行音乐加上欢快的合成音”(Google MusicLM)

点击下载试听曲>>>

MusicLM对这一提示的响应无疑是赢家。它抓住了乐观、流行的音乐基调(我们得到了20世纪80年代的合成器流行音乐)。与MusicGen的成果相比,音乐中还有很多内容。我们甚至可以听到混音中隐隐约约的人声。虽然这个片段仍然缺乏一个清晰、明确和可识别的主音合成器旋律,但有一个漂亮的合成器基调存在,这把一切都联系在一起。

2、“实验性的IDM节拍与前卫的制作”(Meta MusicGen)

点击下载试听>>>

现在我们用气体烹饪。这几乎是一针见血:在这个提示下,我们正在寻找快速、激烈和非常规的鼓点模式,就像Aphex Twin(英国电子音乐家)一样,而MusicGen已经实现了。这里节奏的复杂性令人印象深刻,鼓声清晰有力。这个片段本身听起来很好,但它可以很容易地作为一个构建块,用来制作一个基于循环的音轨。MusicGen 赢得了这场比赛。

2、“实验性的IDM节拍与前卫的制作”(Google MusicLM)

点击下载试听>>>

这是一个奇怪的例子。有节拍,但它们并不特别让人想起IDM:与人声和合成器分层,这些可能可以作为流行电子鼓。诚然,这段剪辑有一种实验性的感觉(注意松散的纹理、不连贯的结构和背景中几乎察觉不到的人声),但我们感觉到这种氛围并不完全是“故意的”,更多的是MusicLM未能产生一个连贯的想法,而不是击中要点的结果。我们也没有要求使用MIDI喇叭。对不起,Google,你输了!

3、“诡异的Shoegaze风格与愤怒的鼓声独奏”(Meta MusicGen)

点击下载试听曲>>>

我们是刚刚走进Radiohead乐队(英国摇滚乐队)的音乐会吗?更重要的是,这听起来像是《Hail to the Thief》中的中间部分,这意味着MusicGen肯定已经达到了提示中的“诡异”部分。背景中的哀嚎可以说是通过几个踏板运行的吉他,而且它听起来相当有Shoegaze风格,尽管它还不够失真。可悲的是,MusicGen不明白什么是独奏,所以他们给了我们一个稳定的(而且听起来不是特别愤怒)的背景音乐。

3、“诡异的Shoegaze与愤怒的鼓声独奏”(Google MusicLM)

点击下载试听曲>>>

真有趣。这甚至不符合我们的要求,但我们真的很喜欢它。鼓模式有一种爵士乐加IDM加breaks风格的氛围,让我们感受到真正的20世纪90年代阿蒙·托宾(Amon Tobin,巴西音乐人)风格。鼓声被置于一种可爱的、漂浮的氛围中,我们发现它真的令人回味无穷,而且我们很欣赏背景中奇怪的skronky喇叭。但它并不特别诡异,当然也不是shoegaze音乐风格。你又输了,Google。

4、“俏皮的乡村女声歌曲”(Meta MusicGen)

点击下载试听曲>>>

请原谅我们擦干眼泪。这当然是怀旧的,而且不可否认,它有乡村民谣的庄重轻盈。我们可以听到混音中的原声吉他和低音吉他,以及缓慢的鼓点,但不幸的是,没有找到踏板钢琴,关键是没有女声。总的来说,做得不错,但缺乏一些个性。这听起来有点像一个乡村音乐家用Garageband中的MIDI乐器制作的快速演示。它听起来也像一个没有灵魂的机器人对乡村音乐的近似描述,当我们考虑到这一点时……事实的确如此。

4、“俏皮的乡村女声歌曲”(Google MusicLM)

点击下载试听曲>>>

与Meta的努力一样,这个片段中有一种可识别的“乡村音乐”的氛围,所以类型框已经打了勾。这都是那些令人陶醉的吉他,听起来比Meta的版本更真实。不过,谷歌的整体混音清晰度较低,听起来比较松散:我们在测试的每个提示中都注意到了这一点。总的来说,这两者差不多,但我们可以听到谷歌版本的背景中盘旋着一些奇怪的微弱的、乱七八糟的人声,所以我们会在此基础上给他们加分。

5、“干净的130bpm鼓循环用于音乐制作”(Meta MusicGen)

点击下载试听曲>>>

在这里,我们测试的是该模型产生一个可以用于音乐制作场景的循环的能力,而不是一个完全成熟的音乐片段。MusicGen绝对做到了这一点:节奏是130bpm,符合要求,踢鼓很有力度(看看那些次要的频率!),踩镲清脆。它并不像我们希望的那样干净,有一些人工制品存在,但我们可以原谅这一点。总而言之,这是一个很好的、简单的4/4模式,我们可以对其进行修剪、循环,并将其作为一条音轨的基础。我们认为它可以很好地用于配音技术领域的东西。有了MusicGen,谁还需要拼接?Meta在这里夺冠。

5、“干净的130bpm鼓循环用于音乐制作”(Google MusicLM)

点击下载试听曲>>>

首先,这不是130bpm,更像是157bpm。除此之外,还算不错:它是一个有趣的模板,可以在许多音乐背景下重新使用,你可以在任何鼓循环包中找到类似的东西。与MusicGen的版本相比,这个版本的鼓声更有原声的味道,我们在最后有一个美味的小填充,还有一些32分音符的踩镲动作。至少在前半部分,它是相对干净的,但我们可以听到一些奇怪的小旋律元素在接近尾声时悄然出现,而这并不是我们要求的。Meta赢得了这场比赛。

最终获奖者:Meta MusicGen

Meta公司的MusicGen取得了胜利,在最后的直道上超过了MusicLM,以3比2的成绩取得了胜利。这是一场势均力敌的比赛,测试结果表明,这两种人工智能模型都是强大的音乐制作工具,具有巨大的创作潜力。

无论是MusicGen还是MusicLM,都没有能力制作成熟的曲目,可以作为“真正”的音乐,但这可能是一件好事,对吗?与此同时,两者都可以作为有用(且免费)的音乐助手,音乐家和制作人可以用它来激发想法和灵感,或者只是简单地生成无限量的免版税样本,用于他们的曲目中。

 

(文章来源:musicradar,本站编译)

本文固定链接:https://www.chinamidi.cn/ai-music-meta-google.html

转载声明:本站文章若无特别说明,皆为本站原创或首译,转载请注明来自:电音哦(www.chinamidi.cn),谢谢!^^


AI音乐之战:Meta和谷歌人工智能音乐生成器大比拼,到底谁更胜一筹?:等您坐沙发呢!

发表评论

头像
表情
还能输入210个字
css.php