GoogleDeepMind制造能与ChatGPT相匹敌的大型语言模型Gemini

新知榜官方账号

2023-07-03 21:18:36

概述

GoogleDeepMind正在使用AlphaGo背后的技术来帮助制造一个能与ChatGPT相匹敌的聊天机器人——Gemini。这是一个处理文本的大型语言模型,目前仍在开发中,或将花费数千或数亿美元。Gemini将结合AlphaGo类系统的一些优势和大型语言模型的惊人语言能力,从而为AI系统赋予新的能力,如计划、解决问题和分析文本的能力。GoogleDeepMind的联合创始人兼首席执行官DemisHassabis表示,他们还有一些新的创新,也将是相当有趣的。

AlphaGo的成功经验

AlphaGo在ChatGPT出现之前,或许是AI领域内最耀眼的明星之一,其让大众最为熟知的成就,便是击败李世石,成为世界上第一个战胜人类围棋世界冠军的机器人。AlphaGo的成功,离不开强化学习技术,该技术通过反复尝试并接受关于其表现的反馈,可以学会处理需要选择采取何种行动的复杂问题,如围棋或视频游戏等。强化学习旨在“教”AI系统在特定情况下表现出预期的行为,对AI系统的某些行为进行“奖励”,以及对不受大众欢迎的行为进行“惩罚”。

强化学习的RLHF技术

如今,ChatGPT的核心技术之一——基于人类反馈的强化学习(RLHF)已经成为后续大型语言模型开发中不可或缺的关键技术。专业人士认为,GoogleDeepMind在强化学习方面的经验,或许可以帮助他们在生成式AI竞赛中夺得优势。

GoogleDeepMind的其他工作

除了Gemini,GoogleDeepMind还展示了一个不需要人类监督、能不断自我学习,可以在模拟和物理环境中处理语言、图像和动作的AI模型——RoboCat。据介绍,RoboCat是第一个可以解决和适应多项任务的机器人代理,且可以把这种能力带到不同的、实体机器人中。此外,AlphaGo还使用了一种叫做“蒙特卡洛树搜索”的方法来探索和记忆棋盘上的可能动作。这是一种在完美信息博弈场景中进行决策的通用技术,除了游戏之外,还能广泛应用在很多其他现实世界场景中。

挑战与未来

当前,语言模型的快速发展使许多AI专家担心,该技术是否会被用于恶意的用途或变得难以控制。为避免产生危险的东西,一些业内人士甚至呼吁暂停开发更强大的算法。GoogleDeepMind的任务,是加速谷歌的AI研究工作,同时也要管理未知的、潜在的严重风险。DemisHassabis认为,AI的潜在好处,如在健康或气候等领域的科学发现,使得人类必须继续发展这项技术。但他也主张负责任、计划周全地开发AI模型,以避免产生危险的风险。

本页网址:https://www.xinzhibang.net/article_detail-5050.html

寻求报道,请 点击这里 微信扫码咨询

关键词

GoogleDeepMind ChatGPT Gemini

分享至微信: 微信扫码阅读

相关工具

相关文章