惊,读取大脑重建高清视频,StableDiffusion还能这么用

新知榜官方账号

2023-07-03 10:14:30

新研究MinD-Video:AI读取大脑重建高清视频

近日,新加坡国立大学和香港中文大学共同完成的最新研究MinD-Video引起了广泛关注。该研究利用fMRI技术从大脑信号中逐步学习,通过与增强版StableDiffusion模型的共同训练来微调学习到的特征,重建高清视频。

fMRI技术与视频重建的难点

fMRI技术是一种非侵入式方法,可以测量血氧水平依赖(BOLD)信号,并在每隔几秒钟的时间里捕捉大脑活动的快照。但与重建静态图像不同,我们视觉所看到的场景、动作和物体的变化是连续、多样化的。而一个典型的视频每秒大约包含30帧画面,如果要用fMRI去重建一个2秒的视频,就需要呈现起码60帧。因此,视频重建的难点在于解码fMRI并以远高于fMRI时间分辨率的FPS恢复视频。

MinD-Video的方法

为了解决视频重建的难点,研究团队提出了MinD-Video的方法。该方法主要包含两大模块,它们分别做训练,然后再在一起做微调。这个模型从大脑信号中逐步学习,在第一个模块多个阶段的过程,可以获得对语义空间的更深入理解。具体而言,便是先利用大规模无监督学习与maskbrainmodeling(MBM)来学习一般的视觉fMRI特征。然后,团队使用标注数据集的多模态提取语义相关特征,在对比语言-图像预训练(CLIP)空间中使用对比学习训练fMRI编码器。在第二个模块中,团队通过与增强版StableDiffusion模型的共同训练来微调学习到的特征,这个模型是专门为fMRI技术下的视频生成量身定制的。

MinD-Video方法的优势

与此前的诸多研究做了对比,可以明显地看到MinD-Video方法所生成的图片、视频质量要远优于其它方法。而且在场景连续变化的过程中,也能够呈现高清、有意义的连续帧。这项研究的共同一作是来自新加坡国立大学的博士生ZijiaoChen和来自香港中文大学的JiaxinQing,通讯作者是新加坡国立大学副教授JuanHelenZHOU。

本页网址:https://www.xinzhibang.net/article_detail-4850.html

寻求报道,请 点击这里 微信扫码咨询

关键词

AI MinD-Video fMRI

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯