新知榜官方账号
2023-10-14 16:26:18
近日,李飞飞高徒和团队研究人员提出了基于《我的世界》游戏新框架MineDojo,可以让AI自由探索程序生成的3D世界。上周,OpenAI让AI看完海量视频后,学会玩《我的世界》。在这之前,来自英伟达团队的研究人员还构建了一个游戏新框架MineDojo。
MineDojo包含了1000多种不同的开放式任务的模拟套件。在这里,AI智能体可以自由探索程序生成的3D世界。
MineDojo从网上收集了海量数据:73万YouTube视频,带有标记2.2亿个单词的英文脚本,这些视频总时长大概有30万个小时;6735个Wiki页面,其中包括交互式的文本、图像、表格和图表;34万条在「r/Minecraft」上的Reddit帖子,还有660万条评论。
视频素材分两类:逐步演示、配音详解的教程视频,研究团队用教程视频做出了大量程序基准。不按特定任务与步骤进行的普通游戏录播视频,给AI智能体提供了内容更多元、素材更丰富的各种学习与训练信号。
由于Reddit文本数据库中的内容结合了文字、图片、短视频片段,将精细调试的大语言模型在其中使用后,AI智能体就能获得大量特定的内化概念和复杂策略。
MineDojo现有基准任务库中包含3131个任务,其中有1572个可编程任务、1558个创造性任务、1个通关性任务。
研究团队将所有任务都附带了自然语言叙述的提示,很多任务还有用GPT-3生成的逐步指南。为了用强化学习训练AI智能体玩《我的世界》、完成必备的奖惩功能,研究团队自行开发了模型MineCLIP。MineCLIP是在海量Youtube数据库上预训练的对比视频语言模型,利用大型预训练的视频语言模型作为学习奖励函数。
MineCLIP模型也是MineDojo中AI将图像对应自然语言的核心组件,包含了文本编码器和图像编码器,参数1.5亿。研究团队在论文中称MineCLIP模型的神经架构很类似CLIP4Clip,但比其多了两层图-文适应处理层。研究团队在视频数据库中抽取了64万16秒短视频片段抽样,来训练这两层来对应图像和文字,效果可与人工判定的真实值媲美。
MineDojo的研究方向与OpenAI有所不同。OpenAI试图训练一个《我的世界》中的通才智能体,通过模仿大量演示来学习,然后再通过精心化设计的奖励让智能体去进行强化学习。相比之下,英伟达提出了不同的观点。他们通过利用YouTube上的视频里的知识学习各种想得到的任务,包括GPT-3生成的任务。为此,研究者并没有通过手动设计无数奖励,而是设计了一种算法MineCLIP,利用了大型与训练视频模型作为学习奖励函数。
最新研究团队共有十个人。其中论文一作是李飞飞门下得意弟子LinxiFan(范麟熙)。他毕业于上海实验中学,本科就读于纽约哥伦比亚大学,目前在斯坦福大学攻读博士,主修计算机视觉、强化学习以及机器人技术。
相关工具
相关文章
推荐
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03
我发现了一款国产AI绘画神器,免费易上手!
2024-07-25 16:40
7位AI考生做今年高考题,能过一本线吗?
2024-07-19 17:17
世界上第一所AI学校来了,80亿人只需要1位老师?
2024-07-18 17:12
Sora首部AI广告片上线,广告从业者危险了!
2024-06-27 13:44
OpenAI与中国说拜拜,国产AI如何接棒?
2024-06-26 15:18
人与AI会产生爱情吗,专家发话了!
2024-06-17 17:28