波士顿动力研发会说话的导游机器狗

新知榜官方账号

2023-11-05 02:26:19

波士顿动力研发会说话的导游机器狗

10月27日全球顶级机器人开发商波士顿动力(BostonDynamics)在官网发布,通过将ChatGPTSpot以及其他AI模型相结合,开发了一种会说话的导游机器狗。Spot机器人(机器狗)"导游",能用英国口音与员工聊天带他们参观公司的设施。该机器人能够回答问题,甚至可以像木偶一样张开"嘴巴",让它看起来像是真的在说话。该机器狗能够根据文字语音提示与人类进行交谈,同时提供了视觉问答功能,可以分析摄像头拍摄的画面自动生成图像说明。公司还给该机器人安装了一个扬声器,增加了文本转语音功能。

ChatGPT等大语言模型展现出了强大的控制和输出能力,可以用于控制物理机器人的行为和决策功能。例如输入一些特定景点数据图片等,可让机器人提供逻辑清晰条理分明的导游功能。此外这也增强了物理机器人的拟人化能力,如为你讲一个冷笑话、做一个逗你开心的滑稽动作。公司使用一台电脑作为机器狗的控制大脑,并通过SpotSDK与其实现数据交互。为了让机器狗具备拟人化动作,例如点头、伸脖子等,使用了Spot的点臂和夹具相机视觉功能。利用机器人的抓手摄像头和前置机身摄像头,实现以视觉问答模式。例如"这张图片有什么有趣的地方?"或图像字幕模式互动交流听觉功能。为了让机器狗可以实现"听"的功能,研发人员将麦克风数据分块输入到OpenAI的语音模型Whisper中转换为英文文本互动交流。为了让机器狗能与人类实现对话,需将语音指令转换成文本用于提示ChatGPT,通过云服务ElevenLabs工具来实现。

波士顿动力公司在机器人方面深耕了20余年,此前它已对外公布了多款机器人,其产品在工业研究和消费领域都有应用。主要代表机器人包括:BigDogAtlasSpotHandle等,其中就包括Spot机器人(机器狗)。Spot是该公司成立20多年来推出的首款商用机器人是一款电动液压机器狗,它能走能跑还能爬楼梯上坡下坡。此外它还拥有跳舞探索矿井以及帮助医务人员等诸多技能,但它还在不断学习新的技巧。会说话的导游机器狗的上市是人工智能应用领域的新现象,机器狗展现出自我决策能力,能回答问题并主动与人互动。为大语言模型实现实际应用开辟了新领域新思路,必将拓宽到其它应用领域,更多人工智能领域讯息,敬请关注公众号"AI时代2023"。

本页网址:https://www.xinzhibang.net/article_detail-18942.html

寻求报道,请 点击这里 微信扫码咨询

关键词

波士顿动力 机器人 导游机器狗

分享至微信: 微信扫码阅读

相关工具

相关文章