AI文生视频:行业引领者的赛道

新知榜官方账号

2023-12-07 06:04:19

AI文生视频:行业引领者的赛道

在当下的AI赛道上,AI生文、生图的应用,早已层出不穷,相关的技术,也在不断日新月异。而与之相比,AI文生视频,却是一个迟迟未被“攻下”的阵地。抖动、闪现、时长太短,这一系列缺陷,让AI生成的视频只能停留在“图一乐”的层面,很难拿来使用,更不要说提供商业上的赋能。直到最近,某个爆火的应用,再次燃起了人们对这一赛道的关注。关于这个叫做Pika的文生视频AI,这些天想必大家已经了解了很多。因此,这里不再赘述Pika的各种功能、特点,而是单刀直入地探讨一个问题,那就是:Pika的出现,是否意味着AI文生视频距离人们期望中的理想效果,还有多远?

难题与瓶颈

实事求是地说,目前的AI文生视频赛道,难度和价值都很大。而其中最大的难点,莫过于让画面变得“抽风”的抖动问题。关于这一点,任何使用过Gen-2Runway等文生视频AI的人,都会深有体会。抖动、闪现,以及不时出现的画面突变,让人们很难获得一个稳定的生成效果。而这种“鬼畜”现象的背后,其实是帧与帧之间联系不紧密导致的。具体来说,目前AI生成视频技术,与早期的手绘动画很相似,都是先绘制很多帧静止的图像,之后将这些图像连接起来,并通过一帧帧图像的渐变,实现画面的运动。但无论是手绘动画还是AI生成的视频,首先都需要确定关键帧。因为关键帧定义了角色或物体在特定时刻的位置和状态。之后,为了让画面看起来更流畅,人们需要在这些关键帧之间添加一些过渡画面(也称为“过渡帧”或“内插帧”)。可问题就在于,在生成这些“过渡帧”时,AI生成的几十帧图像,看起来虽然风格差不多,但连起来细节差异却非常大,视频也就容易出现闪烁现象。这样的缺陷,也成了AI生成视频最大的瓶颈之一。而背后的根本原因,仍旧是所谓的“泛化”问题导致的。用大白话说,AI的对视频的学习,依赖于大量的训练数据。如果训练数据中没有涵盖某种特定的过渡效果或动作,AI就很难学会如何在生成视频时应用这些效果。这种情况,在处理某些复杂场景和动作时,就显得尤为突出。

行业引领者的赛道

AI文生视频赛道的难度和价值都很大,但要想持续保持领先,需要具备强大的算力、跨领域合作能力和技术自主性。行业正在向AI视频倾斜,AI文生视频的爆发期或许即将到来。

本页网址:https://www.xinzhibang.net/article_detail-22182.html

寻求报道,请 点击这里 微信扫码咨询

相关工具

相关文章

相关快讯