Meta下的新AI工具AudioCraft是什么？

Meta 发布了一款新的音乐生成器 AudioCraft，它使用人工智能来创建音乐或声音效果。

照片：Unsplash

AudioCraft 是一个开源程序，可以根据文本提示创建效果和音乐，类似于人工智能图像或视频生成器的功能。 AudioCraft 提供三种型号：

用于作曲的 MusicGen
AudioGen 用于创建音效
EnCodec 有助于音频压缩

MusicGen 此前在音乐创作者和人工智能爱好者中广为人知。但现在 Meta 公开了该模型的代码，允许用户用自己的音乐数据来丰富它。可以理解的是，道德和法律问题立即出现，因为大多数人工智能音乐作品立即被音乐出版商举报为侵犯知识产权。

视频：元

Meta明确表示，它只是根据公司拥有的音乐及其授权音乐创建了默认模型。具体来说，他们使用了 20,000 小时的音频和 400,000 条录音以及文本描述和元数据，所有这些都在 Meta Music Initiative Sound Collection、Shutterstock 和 Pond5 平台的保护下。他们还在发行前删除了所有的人声，以防止模仿创作者的声音。

第二种模型，AudioGen，致力于创建环境声音和声音效果。 AudioGen 是一种基于扩散的模型，就像大多数现代图像生成器（DALL-E 2、稳定扩散...）。在扩散过程中，模型学习如何逐步对完全是噪声的初始数据（例如音频或图像）进行去噪，并使其逐步接近目标提示。

除了效果之外，AudioGen 还可以生成语音，Meta 承认有些人可能会滥用它来欺骗声音。尽管存在这些担忧，但至少目前，他们还没有对 AudioCraft 的各种使用方式施加具体限制。

第三个模型 EnCodec 是对 Meta 之前模型的改进，可以用更少的音损来创建音乐。 Meta 声称在训练数据音频波形时可以更有效地对音频序列进行建模并捕获不同级别的信息，以帮助创建新的音频。

Meta 将 AudioCraft 设想为音乐家和创作者的一种工具，他们可以创作新的作品，而无需亲自演奏乐器。他们还针对预算更有限的开发人员，他们可以使用 AudioCraft 为虚拟世界创建不同的声音，例如 Instagram/TikTok 创作者可以为他们的帖子创建最合适的声音。

至少目前，AudioCraft 的许可证不允许商业用途。

如何安装和测试AudioCraft AI工具？

代码位于 Github 上，您有多种安装选项。您可以使用 Pinokio 程序（https://pinokio.computer），它或多或少会自动为您安装 AI 音乐工具。您需要从他们的库中选择 AudioGradio 模块，安装它（需要几分钟），您最终将获得一个本地 IP 来测试 AudioCraft。

其他方法需要预先安装 Python、Pip、Anaconda、minicondo 或类似程序。用户 mberman84 在 GitHub (https://bit.ly/GHglasba) 上发布了一份很好且易于理解的指南，适用于 miniconda 程序。最终结果是一样的。您将获得一个 IP，将其输入到浏览器中即可开始试验。