谷歌推出音乐AI模型MusicLM，文字可直接生成高保真的音乐

新知榜官方账号

2023-06-29 06:52:48

谷歌推出音乐AI模型MusicLM，文字可直接生成高保真的音乐

当地时间1月27日，谷歌发布全新AI模型——MusicLM。通过AI模型MusicLM，文字可以直接生成高保真的音乐。这是继文字生成AI模型Wordcraft、视频生成工具ImagenVideo之后，谷歌又一次推出生成式AI模型工具，这一次谷歌将目标瞄准了音乐领域。

透过MusicLM，不难看到，这两年生成式AI赛道正在迎来爆发。

MusicLM挑战更复杂场景

谷歌最新推出的AI模型MusicLM，可直接将文字、图像自动生成音乐，并且曲风多样，凡是想听的音乐，基本都能自动生成。MusicLM并非是第一个可自动生成音乐的AI模型，此前，可视化AI工具Riffusion也能自动创作音乐，还有DanceDiffusion，此外，当前最热门的聊天机器人ChatGPT的研发者OpenAI也推出过Jukebox。但值得注意的是，这些可自动生成音乐的AI系统，受限于技术和数据等因素，创作的音乐都比较简单，相对而言并不复杂。和前辈们不同的是，MusicLM可创作特别复杂和保真度特别高的音乐，也可通过图像生成音乐。

这算是实现了全新突破，通过AI技术不仅可以识别乐器，融合音乐流派，还可以通过更抽象的概念生成音乐。比如，想要街机游戏配乐，只要输入“街机游戏的主配乐，它节奏快且乐观”等文字，MusicLM便可自动生成音乐。MusicLM也可通过图像生成音乐，例如世界名作《呐喊》《格尔尼卡》《星空》等皆可作为素材来源。

不过，值得一提的是，目前谷歌只是发布了MusicLM的研究成果，因为版权等问题，谷歌还未向公众开放MusicLM。

AI生成音乐难在哪？

通过AI模型创作音乐，这件事并不容易，因为生成的音乐包括音频信号、环境声音、人的声音等多个维度，是由很多信号相互作用形成的，而人体每次向外发出的声音，无论声音响度大小、音色好差，都由句法、音律等组成，这是非常复杂的综合性系统。也恰恰是这些原因，在早期的探索过程中，自动生成的音频合成痕迹明显，声音听起来并不自然，发音也都不标准。

因此AI模型要想实现真正意义上的自动生成音频，依靠海量的数据训练和模拟，是必不可少的基础性步骤。针对这些挑战，作为AudioLM的“升级版”，MusicLM的训练数据更加庞大。据了解，谷歌在28万小时的音乐数据集中，才训练出MusicLM，为理解深度和复杂的音乐场景提供了基础。此外值得一提的是，针对任务缺乏评估数据等问题，谷歌专门引入了MusicCaps，用于文本到音乐的生成任务评估。

生成式AI迎来爆发

生成式AI一直是近两年最炙手可热的话题。2021年，OpenAI相继发布了划时代的DALL-E、DALL-E2模型，实现了文本生成图像的跨越；去年，Meta发布了AI短视频生成模型Make-A-Video，同样可由文本内容生成视频；谷歌也发布了短视频AI生成模型ImagenVideo与Phenaki。不止是国外，国内也有很多生成式AI应用。比如，字节跳动旗下剪映APP，可根据文字内容自动生成匹配的视频画面。去年初，网易推出了“网易天音”，也是一站式AI音乐创作平台，可将用户编辑的内容通过AI自动生成为歌曲。

可以看到，生成式AI应用的场景越来越广泛，写作、绘画、剪视频等等，都可以通过AI技术实现。基于生成式AI广泛的应用前景，谷歌、微软、Meta等巨头们纷纷推进研发，将生成式AI技术融合到产品中，这加速了生成式AI赛道的爆发。

根据Gartner统计数据，预计到2025年，生成式AI将占所有生成数据的10%，而目前的比例还不到1%。当前，生成式AI已经迎来爆发，未来还有巨大的发展潜力。

本页网址：https://www.xinzhibang.net/article_detail-2602.html

寻求报道，请

关键词

谷歌 AI模型 MusicLM 音乐生成生成式AI 技术

分享至微信：

相关工具

Voicemaker

AI文本到语音生成工具

BGM猫

灵动音科技推出的AI智能生成BGM音乐

Murf AI

AI文本转语音生成工具

幻舟AI

一站式AI影视创作平台

Beatoven.ai

免版税AI音乐创建平台

Boomy

AI音乐生成工具

SkyboxAI：让游戏场景创建更简单

SkyboxAI：让游戏场景创建更简单最近，有一个很酷的工具叫做SkyboxAI，它使得创建游戏场景变得不再那么复杂和昂贵。不必是编程或设计专家，只需一些简单的操作，你就能建立出华丽的虚拟世界。这个工具的出现可能会吸引更多的人投身游戏开发领域，无需担心技术难题。这对于游戏行业来说是一个很大的改变，因

分类标签 SkyboxAI游戏场景创建NeRF算法

12-09 08:26

Clipdrop宣布推出基于人工智能生成的Uncrop工具

Clipdrop宣布推出基于人工智能生成的Uncrop工具今天，Clipdrop宣布推出Uncrop，这是一款基于人工智能生成的"outpainting"工具，可以通过创建扩展的背景来改变任何图像的比例，以补充任何现有的照片或图像。用户可以在Clipdrop的Web应用中免费尝试，无需登录！Uncr

分类标签 ClipdropUncrop人工智能

11-25 16:16

StableDoodle：通过文本提示+草图直接生成高精准的产品

StableDoodle：通过文本提示+草图直接生成高精准的产品7月14日，生成式AI平台StabilityAI在官网宣布推出StableDoodle。据悉，StableDoodle是一款通过文本提示+草图直接生成高精准的产品，例如，画一个苹果的轮廓，然后在文本框输入“这是一个苹果”选择一个3D样式

分类标签 StableDoodleAI平台图片生成

11-25 16:15

腾讯音乐与宏声文化联合打造全AI歌手 AI力宏发布首支单曲《LettingGo》

腾讯音乐与宏声文化联合打造全AI歌手 AI力宏发布首支单曲《LettingGo》据新浪科技消息，腾讯音乐娱乐集团与宏声文化有限公司联合打造的全AI歌手AI力宏，正式发布了首支单曲《LettingGo》。这是首位官方授权的声音、视觉及衍生品均由AI生成的“全AI”歌手。AI力宏的声音使用的AI合成技术

分类标签腾讯音乐宏声文化AI力宏全AI歌手LettingGo

11-23 16:12

腾讯音乐举办“TME科技乐享季”第四期“QQ音乐核心算法技术交流会”

腾讯音乐举办“TME科技乐享季”第四期“QQ音乐核心算法技术交流会”随着互联网技术的迅猛发展，数字经济正成为我国经济增长的重要引擎，在数字音乐产业迈入高速发展的新阶段，技术驱动态势更加明显。10月31日，由腾讯音乐娱乐集团（TME）主办的“TME科技乐享季”第四期“QQ音乐核心算法技术交流会”顺利举

分类标签腾讯音乐TMEQQ音乐算法技术音乐科技数字音乐

11-23 16:11

TME投资瑞迪欧，拓展公播音乐领域

中国青年报客户端北京4月27日电（中青报·中青网记者蒋肖斌）在线音乐娱乐平台腾讯音乐娱乐集团（TME）今天宣布，通过股权形式投资中国线下公播公司瑞迪欧，同时还将拥有未来进一步增持获得控股权的权利。TME已与国内外诸多音乐内容方建立了长期稳固的合作伙伴关系，聚集了众多艺人资源，拥有超过4000万的曲库

分类标签 TME瑞迪欧公播音乐

11-23 16:10

腾讯音乐2023年第一季度财报公布，在线音乐服务收入首次赶上社交娱乐服务及其他收入

腾讯音乐公布了截至3月31日的2023年第一季度财报。财报显示，该季度总收入达到70亿元，同比增长5.4%。归属于公司股东的净利润为11.5亿元，同比增长88.5%。本季度收入结构发生较大变化，在线音乐服务收入首次赶上了社交娱乐服务及其他收入，达到35亿元。一季度在线音乐服务收入同比增长33.8%，

分类标签腾讯音乐财报在线音乐服务

11-23 08:36

QQ音乐12.2版本发布，潮酷立体可互动的「3D黑胶播放器」和更多功能带来个性多元、沉浸式的听歌体验

QQ音乐12.2版本发布，潮酷立体可互动的「3D黑胶播放器」和更多功能带来个性多元、沉浸式的听歌体验当代年轻人越来越喜欢以新颖、生动的方式进行表达，哪怕是听歌也要彰显自己的个性。4月3日，QQ音乐12.2版本正式发布，潮酷立体可互动的「3D黑胶播放器」、更具时尚潮流的「个性歌单」、让爱车“更动听”的

分类标签 QQ音乐12.2版本3D黑胶播放器个性歌单车载音效音乐人专属主页TMEStudio

11-23 08:35

如果你失业了请记住这6个网站

如果你失业了请记住这6个网站利用下班后的三小时学习提升自己我终于过上了小时候梦想的生活。而这六个免费的学习网站就是我收入暴增的秘籍。如果你也想收入翻倍一定要好好利用起来，尤其是最后一个学生党、宝妈、上班族都用得上，赶紧收藏起来吧。1.稿定设计。关注我时间长的宝宝都知道我的副业收入主要来源于小红书，而

分类标签失业学习网站收入翻倍

11-20 08:29

ChatGPT成为消费者应用程序历史增长最快的工具，引发互联网巨头跟进

ChatGPT：消费者应用程序历史增长最快的工具最近，一款新聊天工具ChatGPT火了，可以聊天、写作、编程、翻译，甚至可以质疑和拒绝你的要求。自2022年11月底推出以来，ChatGPT已经成为历史上增长最快的消费者应用程序之一。网友：我写的文章还没有ChatGPT好ChatGPT的狂飙突进引来谷

分类标签 ChatGPT消费者应用程序历史增长最快的工具

11-01 02:08