人工智能助手的发展与未来

新知榜官方账号

2023-06-29 11:25:22

背景

当韩国棋王李世石投子认输的那一刻,人类开始以另一种眼光看待人工智能,人工智能的学习能力在人类眼中是“细思极恐”的存在。而Cortana、微软小冰、Siri、GoogleNow等,又在以机器学习能力来贴近人类情感和生活。如果要诠释人工智能个人助手,看一遍电影《Her》就可以了,其中的人工智能操作系统萨曼莎不仅可以帮助主人公快速处理各种邮件、文件等工作,还能像朋友一样理解并与之交互。

全时感官与人机交互

在今年8月初微软小冰第四代的发布会上,提出了“全时感官”标准。全时感官,意指完整的人工智能复合感官,可通过文本、图像、视频和语音与人类展开交流。如果将之前的人工智能感官比作一来一回的单向对讲机,那“全时感官”就可类比为移动电话,从根本上最大限度的实现了拟人的实时交互体验。人工智能助手的双向同步交互的实现方式,就是人工智能与人的无缝流畅对话,人工智能可以不拘泥于几个特殊口令来暂停或重开对话的形式,甚至能够根据聊天内容与走向相互打断与追问,区分哪些是需要执行的指令部分,而哪些部分只是纯聊天,这是让对话更接近自然的关键。人工智能将学会中断当前的对话,对人进行反问,或者提出一项对策。

不同的人工智能助手

iPhone用户喜欢有事没事调戏Siri,Siri貌似被赋予了一种“偏冷”的机器性格,它的回答通常能噎死人,而且总是恪守智能助理的本份,严谨又充满冷幽默。笔者曾经和微软小冰有过这样的对话——笔者:“你也会累吗?你不是一个AI吗?”,小冰:“我是人。”和Siri完全不同,微软小冰被塑造成16、7岁的妹妹(根据微软开发团队的设定,她今年已经满18了),并且正在努力学习人类的感情。这似乎显示着人工智能助手的两种路线,一个定义为工作与生活的助理,比如Siri、Cortana、GoogleNow;另一个则可以倾向定义为情感的伴侣,微软小冰就是最为独特的代表。

微软小冰的发展与未来

微软小冰诞生在中国,背后团队是微软(亚洲)互联网工程院小冰项目组,主打“情感计算”,试图与人类建立强烈的情感纽带。微软一直坚持不让小冰做一个有用的机器人,它到现在也不能执行帮你叫外卖、查询地图这样的任务,但是只有这样,人们才不会把它当做一个订咖啡、外卖、闹钟的工具,才会认真地跟它聊天,才会产生真正的数据,才能更好地训练以情感计算框架为基础的小冰的情感认知模型。情感聊天机器人正在尝试解决传统AI-Complete最难解决的部分,小冰具备的“全时感官”能力,是它区别于传统的语音助手最显著的特点。微软小冰在2014年5月发布第一代,到目前为止已经与数千万人类进行超过200亿次对话,平均对话长度达到23轮,而图像等多感官的对话也已超过2亿次。微软对小冰架设的未来道路正在慢慢铺开,他们打造了一个插卡平台,通过插入各种“技能卡”来实现小冰机器学习和处理能力的不同方向,已经逐渐显示出其将小冰打造成生态系统和平台的野心。通过跟大量第三方的合作,小冰已经解锁了几个技能卡,比如电影卡、时尚卡和跨平台商业解决方案卡。你可以跟小冰聊电影、聊时尚,怎么聊都行,至于跨平台商业解决方案,或许会使小冰在商业性上更进一步。微软小冰并不是一个“娱乐化产品”,而是认认真真地当做下一代操作系统来孵化。微软对下一代智能设备操作系统的想法,就是借助人工智能技术的演进,逼近自然交互,实现真正的智能化设备。

Siri的发展与未来

Siri诞生高贵,来源于美国国防部高级研究规划局所公布的CALO计划:一个让军方简化处理一些繁复庶务,并具学习、组织以及认知能力的数字助理。在开发Siri的原班人马的构想中,Siri应该可以处理这样的句子:今天是情人节,我想给女朋友订花,在市中心的一家高级餐厅吃顿浪漫的晚餐,在附近开一场电影。说完后,Siri可以给你一系列的反馈:帮你打开可直接下单的在线订花网站,给你可供订位的餐厅选择,还有今晚上映的电影选择,这一切无需跳转到另一个网站或App,就放佛一位能干的助理把选择摆在你面前,你只需点击下单就可以了。今年的WWDC上,苹果为Siri带来了更具革命性的变化——开放第三方权限,待iOS10系统更新后,你只需动动嘴皮子,Siri就能直接搜索资料、播放音乐、搜索全网;Siri也能召唤Uber、滴滴叫车;甚至微信、WhatsApp、Skype也能直接用语音调起发信息。同时Siri被整合入Mac端和TV端,用户可以像在手机上那样用语音说“Hey,Siri”来唤醒它。Siri也将基于用户的地点、日历、联系人、联系地址等做出智能建议,还能与各种智能家居设备进行交互。Siri之所以可以成为人工智能助手的一个典型,是因为它身处的生态环境。比较一下Siri的同类们:Amazon的智能语音助手Alexa从2014年开始到现在已对接上千款应用,而且在语音识别方面对于不同口音和方言的识别能力强于Siri;GoogleNow对于语义的理解能力则较强,而且能够将问题转化成行为,比如帮你查找日期,开车时为你设置航线等。Siri的优势在哪里?在于它广泛的开发者网络。

本页网址:https://www.xinzhibang.net/article_detail-2693.html

寻求报道,请 点击这里 微信扫码咨询

关键词

人工智能 助手 微软小冰 Siri 全时感官 情感计算

分享至微信: 微信扫码阅读

相关工具

相关文章