新知榜官方账号
2023-07-03 10:14:30
近日,新加坡国立大学和香港中文大学共同完成的最新研究MinD-Video引起了广泛关注。该研究利用fMRI技术从大脑信号中逐步学习,通过与增强版StableDiffusion模型的共同训练来微调学习到的特征,重建高清视频。
fMRI技术是一种非侵入式方法,可以测量血氧水平依赖(BOLD)信号,并在每隔几秒钟的时间里捕捉大脑活动的快照。但与重建静态图像不同,我们视觉所看到的场景、动作和物体的变化是连续、多样化的。而一个典型的视频每秒大约包含30帧画面,如果要用fMRI去重建一个2秒的视频,就需要呈现起码60帧。因此,视频重建的难点在于解码fMRI并以远高于fMRI时间分辨率的FPS恢复视频。
为了解决视频重建的难点,研究团队提出了MinD-Video的方法。该方法主要包含两大模块,它们分别做训练,然后再在一起做微调。这个模型从大脑信号中逐步学习,在第一个模块多个阶段的过程,可以获得对语义空间的更深入理解。具体而言,便是先利用大规模无监督学习与maskbrainmodeling(MBM)来学习一般的视觉fMRI特征。然后,团队使用标注数据集的多模态提取语义相关特征,在对比语言-图像预训练(CLIP)空间中使用对比学习训练fMRI编码器。在第二个模块中,团队通过与增强版StableDiffusion模型的共同训练来微调学习到的特征,这个模型是专门为fMRI技术下的视频生成量身定制的。
与此前的诸多研究做了对比,可以明显地看到MinD-Video方法所生成的图片、视频质量要远优于其它方法。而且在场景连续变化的过程中,也能够呈现高清、有意义的连续帧。这项研究的共同一作是来自新加坡国立大学的博士生ZijiaoChen和来自香港中文大学的JiaxinQing,通讯作者是新加坡国立大学副教授JuanHelenZHOU。
相关工具
相关文章
相关快讯
推荐
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03
我发现了一款国产AI绘画神器,免费易上手!
2024-07-25 16:40
7位AI考生做今年高考题,能过一本线吗?
2024-07-19 17:17
世界上第一所AI学校来了,80亿人只需要1位老师?
2024-07-18 17:12
Sora首部AI广告片上线,广告从业者危险了!
2024-06-27 13:44
OpenAI与中国说拜拜,国产AI如何接棒?
2024-06-26 15:18
人与AI会产生爱情吗,专家发话了!
2024-06-17 17:28