多模态大模型将是生成式AI的必要发展趋势

新知榜官方账号

2023-07-02 00:30:51

多模态大模型将是生成式AI的必要发展趋势

在文心一言发布会的当天,李彦宏曾提到多模态大模型将是生成式AI的必要发展趋势。李彦宏对未来的预判,不仅表明了未来文心一言自身的发展方向,也侧面反映出百度未来在人工智能产业中将着重深耕的领域。

就在文心一言发布会举办的十几天后,人工智能项目西湖心辰宣布完成由百度风投领投的Pre-A轮融资。此前2021年12月西湖心辰完成了蓝驰创投、凯泰资本等投资的近千万美元天使轮融资。

根据蓝振忠透露,西湖心辰从成立第一天起探索多模态大模型和通用人工智能技术,并已基于自研大模型衍生出多个上层应用。目前已有AI心理咨询平台小天;AI写作平台Friday;AI绘画平台造梦日记。应用层已覆盖文字、图片等多个领域。

西湖心辰透露,将在今年完成两次迭代,目标是达到甚至在部分任务上超过GPT-4的表现。猎云网此前曾报道过西湖心辰,根据西湖心辰透露,去年11月就曾和某互联网大厂的战投沟通融资事宜。如今投资落锤,百度风投投资西湖心辰,之于百度而言也是落在生成式AI产业布局中的一子。

从百度的角度来看,投资西湖心辰仅是完善多模态大模型的开端,可以预见的是百度正在通过自身力量带动国内AI行业乘风破浪。

多模态大模型的发展历程

蓝振忠一直致力于多模态领域的研究。他在卡耐基·梅隆大学计算机学院攻读人工智能博士期间,就专注于多媒体分析(多模态研究)和计算机视觉,作为核心队员代表CMU在IARPA举办的多媒体事件检测比赛中击败包括Stanford在内的诸多高校团队获得冠军。

毕业后加入了谷歌AI业务,担任科学家。在谷歌任职科学家期间,蓝振忠参与了自然语言处理和计算机视觉的项目研发,并且成果用于谷歌新闻和谷歌助手等产品中。

2019年回国创业后,蓝振忠一直率领团队在AI领域摸索。基于大模型能力让上层应用更智能化的思路,西湖心辰构建了模型层—中间层—应用层的产品架构。在基础的模型层,西湖心辰打造了RIO系列语言大模型和双模态图文模型,最终打造多模态大模型。经过测试,目前RIO模型的能力相当于GPT-3.5的水平。

中间层方面,西湖心辰提供深入各个领域的模型,目前已和各行业多家客户展开深度合作。从应用层角度来看,去年8月底AI绘画平台造梦日记上线,上线后迅速走红,曾创造了日增5万用户的增长速度,截至目前,平台已经积累了超100万用户。蓝振忠表示,从相对更成熟的文字、图片领域入手,发布应用高效收集用户反馈数据,提升大模型的智能化水平。这样的产品架构可以使得底层大模型和应用层更加紧密,经过测试,目前西湖心辰的RIO模型的能力相当于GPT-3.5的水平。

据了解,目前西湖心辰正在研发首个可自助联网的多模态大模型——心辰大模型。根据西湖心辰的说法,目前,心辰大模型已拥有支持自助上网的AI系统,可实时更新网络数据和知识。比如,向产品Demo提问近期发生的热点事件:“马斯克什么时候收购了推特”“你知道最近中国很火的电视剧《狂飙》吗”等,它都能应对自如。

百度在多模态大模型领域的布局

百度在2019年开始着手大模型的研发。此前百度的文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应在电力、燃气、金融、航天等,基本上构建了国内较大的产业大模型。

前不久,百度又深入多模态大模型领域发布了文心一言。基于百度自研的ERNIE及PLATO系列模型,文心一言的关键技术包括人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

尽管深耕AI领域多年的百度,是国内目前最有可能打通所有大模型技术的企业。但是从整个国内市场环境来看,目前国内行业和海外仍是有些差距。

虽然技术尚在摸索期,但市场需求十分激烈,短短一个月,有超过650家合作伙伴宣布加入文心一言生态。

本页网址:https://www.xinzhibang.net/article_detail-4155.html

寻求报道,请 点击这里 微信扫码咨询

关键词

多模态大模型 生成式AI 人工智能

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯