国内首款视频垂直大模型新壹视频大模型带来的现场首秀

新知榜官方账号

2023-07-28 22:12:51

国内首款视频垂直大模型新壹视频大模型带来的现场首秀

只靠一句话,AI就能做一支科幻电影预告片。脚本、每帧画面、背景音乐,AI都能生成。这就是国内首款视频垂直大模型新壹视频大模型带来的现场首秀。

由该模型作为底座的AIGC视频平台一帧秒创,同步推出,现在可直接体验。不仅是用AI生成画面,这个平台还能实现图文转视频、AI帮写、插入数字人等。在过去半年试运营中,该平台每天产出超出10万分钟视频,积累了200多万用户。

同时还推出了数字人创作平台,24小时内就可以训练好一个数字人。在发布现场,还有投资人任泉还来帮忙站台,强调正在视频领域发生的新技术革新。

新壹视频大模型是一个以视频为核心的多模态AIGC模型,通过对海量视频样本的学习,具有几大关键能力:多模态感知实时学习自迭代多场景交叉推理。由此它能理解文字的含义、识别图像内容、感知音乐情绪,然后生成视频。在发布会现场的演示中,最开始给新壹大模型的仅仅是一句主题:人类驾驶地球、离开太阳系、并遇到危险。然后就看到大模型很快理解了意思,输出了10个镜头的脚本,都非常契合主题。下一步,再基于生成文字内容,大模型又给出了10个分镜头。从现场效果里可以看出,每一个镜头给出的画面,和文字的对应也很紧密。比如镜头八的脚本是“一位科学家站起来,他的眼神坚定”。画面上就给出了一位穿太空服的男性,皱紧眉头,眼神坚定。再要求AI配一段“大气磅礴、有重低音和交响乐团的元素,给我一种踏上新征程的感觉”。最后把生成的所有素材一结合,就有了一个完整的科幻预告片。

据介绍,新壹视频大模型采用了自监督学习方案,会观察和学习大量的视频数据,通过分析视频的结构、内容、风格等多个维度,自我理解和把握视频制作的规则和逻辑。而且能跨场景进行知识迁移与关联,选择合适素材,调整视频风格;还可面向行业级的垂直场景对新壹视频大模型做定向训练。

在现场,新壹方面也强调,大模型中关于视频理解、匹配输出的部分,均是由自研技术支撑。而以该模型为底座的座的AI内容生成平台一帧秒创,也正式发布。它能提供图片生成、视频生成、声音生成、数字人生成等任务。并提供了一个千万级的结构化视频库,可以精准匹配素材。比如在现场演示中,通过平台制作一个“夏日防暑小妙招”的视频,同样是AI自己生成文案、匹配素材。

除了视频制作方面,同步亮相的还有一个数字人平台。据介绍,通过多模态合成AI技术,该平台可以将真人录制的视频和音频素材,快速生成2D写实数字人。基于新壹视频大模型,24内小时即可完成一个数字人的训练。通过融合通用语言模型、音视频生成技术,能够快速、低成本的生成真人播报视频和直播。结合该技术,还有一个名为“秒祝”的明星数字人祝福视频制作产品发布。它可以还原明星的声音和形象,制作出对应数字人,并生成个性化定制祝福视频。

带来这一系列AIGC领域新动向的玩家,是视频行业20年老玩家新壹科技。他们的团队,摸爬滚打20多年,曾多次站在视频风口浪尖:如此前大火的秒拍、小咖秀,都是该团队推出的产品。更早之前,则是中国首个上市的视频公司酷六网。新壹科技创始人、董事长为韩坤,CEO为雷涛。这一次召开发布会,用新壹自己的话来解释,就是要在AIGC的时代下,重新出发。

本页网址:https://www.xinzhibang.net/article_detail-8840.html

寻求报道,请 点击这里 微信扫码咨询

关键词

视频垂直大模型 新壹视频大模型 AI内容生成平台

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯