人工智能的场景应用成为新路径,优图实验室探索元素识别技术

新知榜官方账号

2023-11-25 16:33:32

人工智能的场景应用成为新路径,优图实验室探索元素识别技术

过去几年,有着数十年历史的人工智能驶入了发展快车道,尤其是2016年,谷歌AlphaGo与人类围棋冠军李世石进行的人机大战,更是引爆了全社会对人工智能的关注。

从技术角度,人工智能确实取得了跨越式的发展。随着计算机软硬件能力的提升,机器学习、计算机视觉等人工智能领域的基础应用已变得十分成熟,比如现在,人们可以随意列举出很多生活中应用了AI的场景。但是,狂奔之后,人工智能的脚步也开始放慢。

一位AI创业者曾向记者表示,“当人们正欣喜于人工智能技术已经发展到99%的进度时,突然发现剩下的1%又是一段全新的从1到100的过程”。这意味着,在纵向上,人工智能技术的迭代将变得越发缓慢,然而在横向上,基于已经成熟的技术能力,人工智能的行业应用则将迎来爆发。

上个月,科技部等六部门联合发布了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》,提出场景创新成为人工智能技术升级、产业增长的新路径,场景创新成果持续涌现,将推动新一代人工智能发展水平。

近日,腾讯云副总裁、腾讯优图实验室总经理吴运声在接受21世纪经济报道记者采访时也表示,近年来,随着数字技术与实体经济加速融合,人工智能的发展不再局限于算力、算法、数据等方面的技术突破,而是从行业应用、社会需求的角度逐渐深入,展开一场“双向奔赴”的范式变革。

优图实验室成立于2012年,是腾讯旗下的人工智能实验室,主要聚焦于计算机视觉。吴运声告诉记者,优图实验室在成立之初就强调,不只做基础研究,而是要坚持研究和产业落地两条腿并行的策略。“一方面,我们作为技术研究的团队,会坚持在技术方面做研究,为长期的发展做准备;另一方面,我们则会更紧密地跟行业去结合,把技术应用到行业中,产生实际的价值”,吴运声说。

其中在技术研究方面,相较之前比较基础的图像识别技术,优图实验室正在研究一个新课题,即“元素识别”。其举例说,过去要识别一个访谈场景,会先搜集上千张各种各样的访谈照片,然后拿给模型去训练,并将这些照片标注为“访谈”。与此同时,还要搜集一些副样本,这些样本会和访谈场景有点类似以及完全不像,然后要把这些照片标注为“非访谈”。“通过这样的分类训练,机器就能够识别出一个场景是不是访谈”,吴运声说,但是,随着各类场景的增多,这种分类训练的方式也变得十分低效。所以,优图实验室希望通过对场景中元素的识别,进而实现对场景的识别。

同样是访谈场景,在元素识别技术下,机器会先识别出人、沙发等元素,然后基于提前定义好的元素与元素之间的关系,如人坐在沙发上、人与人要面对面等,去识别该场景是不是访谈。吴运声说,“我们通过构建知识图谱、训练大模型等方式,从‘万物识别’进入了‘万物感知’。但仅有‘感知’仍然不够,只有将时间、地点、人物关系串联,从单一要素识别晋升为对全场景的分析、处理,AI才能更好地理解和学习人类世界的真实状态”。通过对元素间的关系进行联合建模,人工智能便能输出符合人类经验的认知关系。而这,也将是计算机视觉领域未来发展的一个重要趋势。

在研究的另一侧——产业落地方面,优图实验室的AI技术目前已经落地到工业、金融、传媒、政务、能源等行业。因为要产业落地,所以在优图实验室,做研究的技术人员也要更深入地了解行业。吴运声表示,依据场景而来的技术演进,是人工智能的生命来源。

比如去年,腾讯云与立铠精密达成合作,在了解到对方存在“硬件缺陷多样、成像复杂”等质检难题后,优图实验室便有针对性地开展了算法研究。针对工业场景缺陷样本少、缺陷噪音多、产品型号广等问题,优图实验室通过小样本学习、域迁移学习、带噪学习和模板学习等方法提升了算法的鲁棒性与泛化性。最终,立铠精密用AI替代了原有的目视检测,并且漏检率接近于0。

在与交通银行的合作中,优图实验室通过将多模态应用于计算机视觉研究,为交通银行提供了多个场景下的视觉AI解决方案,并利用图像技术解决了用户上传图片不清晰、资料印章模糊干扰、用户证件PS鉴伪等问题。

在数字经济时代,数字技术与实体经济共生共荣,而人工智能扮演的是基础设施的角色。在吴运声看来,数实融合的过程中,产业是机体,技术是大脑,商业是神经,只有将各环节要素结合在一起,才能更好发挥人工智能的价值,从而推动中国产业的升级发展。

更多内容请下载21财经APP

本页网址:https://www.xinzhibang.net/article_detail-21093.html

寻求报道,请 点击这里 微信扫码咨询

关键词

人工智能 场景创新 元素识别

分享至微信: 微信扫码阅读

相关工具

相关文章