新知榜官方账号
2023-06-29 06:52:48
当地时间1月27日,谷歌发布全新AI模型——MusicLM。通过AI模型MusicLM,文字可以直接生成高保真的音乐。这是继文字生成AI模型Wordcraft、视频生成工具ImagenVideo之后,谷歌又一次推出生成式AI模型工具,这一次谷歌将目标瞄准了音乐领域。
透过MusicLM,不难看到,这两年生成式AI赛道正在迎来爆发。
谷歌最新推出的AI模型MusicLM,可直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。MusicLM并非是第一个可自动生成音乐的AI模型,此前,可视化AI工具Riffusion也能自动创作音乐,还有DanceDiffusion,此外,当前最热门的聊天机器人ChatGPT的研发者OpenAI也推出过Jukebox。但值得注意的是,这些可自动生成音乐的AI系统,受限于技术和数据等因素,创作的音乐都比较简单,相对而言并不复杂。和前辈们不同的是,MusicLM可创作特别复杂和保真度特别高的音乐,也可通过图像生成音乐。
这算是实现了全新突破,通过AI技术不仅可以识别乐器,融合音乐流派,还可以通过更抽象的概念生成音乐。比如,想要街机游戏配乐,只要输入“街机游戏的主配乐,它节奏快且乐观”等文字,MusicLM便可自动生成音乐。MusicLM也可通过图像生成音乐,例如世界名作《呐喊》《格尔尼卡》《星空》等皆可作为素材来源。
不过,值得一提的是,目前谷歌只是发布了MusicLM的研究成果,因为版权等问题,谷歌还未向公众开放MusicLM。
通过AI模型创作音乐,这件事并不容易,因为生成的音乐包括音频信号、环境声音、人的声音等多个维度,是由很多信号相互作用形成的,而人体每次向外发出的声音,无论声音响度大小、音色好差,都由句法、音律等组成,这是非常复杂的综合性系统。也恰恰是这些原因,在早期的探索过程中,自动生成的音频合成痕迹明显,声音听起来并不自然,发音也都不标准。
因此AI模型要想实现真正意义上的自动生成音频,依靠海量的数据训练和模拟,是必不可少的基础性步骤。针对这些挑战,作为AudioLM的“升级版”,MusicLM的训练数据更加庞大。据了解,谷歌在28万小时的音乐数据集中,才训练出MusicLM,为理解深度和复杂的音乐场景提供了基础。此外值得一提的是,针对任务缺乏评估数据等问题,谷歌专门引入了MusicCaps,用于文本到音乐的生成任务评估。
生成式AI一直是近两年最炙手可热的话题。2021年,OpenAI相继发布了划时代的DALL-E、DALL-E2模型,实现了文本生成图像的跨越;去年,Meta发布了AI短视频生成模型Make-A-Video,同样可由文本内容生成视频;谷歌也发布了短视频AI生成模型ImagenVideo与Phenaki。不止是国外,国内也有很多生成式AI应用。比如,字节跳动旗下剪映APP,可根据文字内容自动生成匹配的视频画面。去年初,网易推出了“网易天音”,也是一站式AI音乐创作平台,可将用户编辑的内容通过AI自动生成为歌曲。
可以看到,生成式AI应用的场景越来越广泛,写作、绘画、剪视频等等,都可以通过AI技术实现。基于生成式AI广泛的应用前景,谷歌、微软、Meta等巨头们纷纷推进研发,将生成式AI技术融合到产品中,这加速了生成式AI赛道的爆发。
根据Gartner统计数据,预计到2025年,生成式AI将占所有生成数据的10%,而目前的比例还不到1%。当前,生成式AI已经迎来爆发,未来还有巨大的发展潜力。
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16