数字人“希加加”展示自己绘制的画作

新知榜官方账号

2023-11-16 08:47:31

数字人“希加加”展示自己绘制的画作

日常生活里,你不经意间会遇到这样一群“人”。他们出现在博物馆展厅、银行柜台,抑或教育机构。这些“人”专业能力极强,讲解展品的时候,能对你提出的疑问应答如流;办理金融业务时,你也会发现,他们非常高效,并且鲜有出错的时候;当他们成为你孩子的老师,这些“人”不但“传道授业解惑”,更能在言语之间给予孩子鼓励。你不禁会好奇,这些“人”到底是谁?如果在几年前跟你说出他们的名字,你可能会感到陌生。但现在,提及数字人,人们或多或少都对其有些了解。因为这些特殊的“人”,已然介入我们的世界之中,并给一些行业带来了实质性的改变。

数字人,指的是基于CG(ComputerGraphics,计算机图形学)技术与人工智能(AI)技术打造出的数字化虚拟人物。最早的数字人形象可追溯到上世纪80年代,不过,受限于技术水平,早期的数字人形象主要由手绘完成,制作周期漫长,且应用成本极高。所以在很长一段时间内,数字人行业不温不火。近些年,随着元宇宙概念的出现,以及CG、深度学习算法、自然语言处理(NLP)等技术的发展,数字人行业迎来了一个热潮。无论是实体经济,还是传媒相关的内容生产领域,都开始频繁地使用数字人形象。虚拟偶像、虚拟主播、金融业务员……数字人变换着不同的身份,给人们的生活提供着便利。在百度与央视新闻共同举办的“2022百度世界大会”上,多个AI数字人在会场亮相。数字人“希加加”不但担任着大会的主持人,还在现场献上了自己绘制的画作。作为国内首个可交互的虚拟偶像,数字人“度晓晓”还与撒贝宁同台互动,展现着与真实人类相似的风趣。

制作一个数字人,要经过哪些工序?它们有个性吗?如果有,个性从何而来?元宇宙发展至今,最先进的数字人技术是什么?这些技术又会对我们的世界带来怎样的改变?带着这些问题,《新周刊》对百度数字人与机器人业务负责人李士岩进行了专访。以下为《新周刊》与李士岩的对谈。

数字人行业当前还是处于比较早期的阶段,为了推动它向前发展,最核心的手段还是市场化。数字人的团队既要考虑到技术的迭代路径,也要考虑到团队中成员的美学素养,以及对一些人体结构的了解程度。像我们团队中有很多人都在研究人体解剖学,研究人的三庭五眼。在技术方面,它既要用到语音、语义相关的技术,也要用到CG、视觉相关的AI技术。百度是国内为数不多可以实现全链路AI能力的公司,我们在这方面有着非常丰厚的积累。

我们用通俗的语言来解释,就是首先要造出来一个“人”,但这还远远不够,你要能让这个“人”做事情。有的要去当业务员,比如我们给银行做的产品,它们可以帮助客户办理业务;有的要去当主持人——我们给央视新闻提供了手语数字人;还有的,要做虚拟偶像,诸如我们熟知的“希加加”“度晓晓”。制造的流程一般是这样的:第一阶段,上传一张照片就能自动生成一个三维的超写实数字人。第二步需要做的事情,就是让已经做好的数字人,通过我们百度智能云的数字人平台,去生产内容。

最前沿的数字人技术主要从三个方面看。首先,在制作人像层面,目前最顶尖的技术是通过超写实人像来实现智能建模。在驱动和交互上,最前沿的技术有两个:AI相关的非注意力ASR模型和利用大模型相关的对话技术。在内容生产赛道里,动画数据、通过3D换脸技术进行的虚拟偶像、内容的快速生产,都是比较尖端的技术。

数字人的需求主要集中在两个方向,分别是多模交互方式和内容生产。在多模交互方式方向,数字人的工作主要是做业务员,也就是理财经理、教育培训领域的一对一交互教练等。在内容生产维度上,数字人做的主要是虚拟主持人、虚拟主播和虚拟偶像。目前来看,这两个大赛道每年成长率都较高,每年可触达的市场规模几乎都是翻倍的。预测到2023年,这个市场规模接近300亿元。

无论是作为进入元宇宙的通行证,还是未来在元宇宙中提供服务,数字人都占据非常核心的位置。在生活方面,数字人已经提供了诸多便利,它可以让银行的服务变得更有温度,让教育变得更有效率,那些虚拟偶像也通过聊天,给予了我们更多陪伴。从整个行业来看,还需建立一些专业标准,比如像自动驾驶汽车那样,划分出智能化的等级。此外,数字人的智能化构造和生产需要采集的数据,投入成本也非常高,如果有可能在行业内进行更广泛、更流畅的数据互通,工程师们的研发可能会变得更方便。

本页网址:https://www.xinzhibang.net/article_detail-20168.html

寻求报道,请 点击这里 微信扫码咨询

关键词

数字人 人工智能 元宇宙

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯