新知榜官方账号
2023-11-05 02:26:19
10月27日全球顶级机器人开发商波士顿动力(BostonDynamics)在官网发布,通过将ChatGPTSpot以及其他AI模型相结合,开发了一种会说话的导游机器狗。Spot机器人(机器狗)"导游",能用英国口音与员工聊天带他们参观公司的设施。该机器人能够回答问题,甚至可以像木偶一样张开"嘴巴",让它看起来像是真的在说话。该机器狗能够根据文字语音提示与人类进行交谈,同时提供了视觉问答功能,可以分析摄像头拍摄的画面自动生成图像说明。公司还给该机器人安装了一个扬声器,增加了文本转语音功能。
ChatGPT等大语言模型展现出了强大的控制和输出能力,可以用于控制物理机器人的行为和决策功能。例如输入一些特定景点数据图片等,可让机器人提供逻辑清晰条理分明的导游功能。此外这也增强了物理机器人的拟人化能力,如为你讲一个冷笑话、做一个逗你开心的滑稽动作。公司使用一台电脑作为机器狗的控制大脑,并通过SpotSDK与其实现数据交互。为了让机器狗具备拟人化动作,例如点头、伸脖子等,使用了Spot的点臂和夹具相机视觉功能。利用机器人的抓手摄像头和前置机身摄像头,实现以视觉问答模式。例如"这张图片有什么有趣的地方?"或图像字幕模式互动交流听觉功能。为了让机器狗可以实现"听"的功能,研发人员将麦克风数据分块输入到OpenAI的语音模型Whisper中转换为英文文本互动交流。为了让机器狗能与人类实现对话,需将语音指令转换成文本用于提示ChatGPT,通过云服务ElevenLabs工具来实现。
波士顿动力公司在机器人方面深耕了20余年,此前它已对外公布了多款机器人,其产品在工业研究和消费领域都有应用。主要代表机器人包括:BigDogAtlasSpotHandle等,其中就包括Spot机器人(机器狗)。Spot是该公司成立20多年来推出的首款商用机器人是一款电动液压机器狗,它能走能跑还能爬楼梯上坡下坡。此外它还拥有跳舞探索矿井以及帮助医务人员等诸多技能,但它还在不断学习新的技巧。会说话的导游机器狗的上市是人工智能应用领域的新现象,机器狗展现出自我决策能力,能回答问题并主动与人互动。为大语言模型实现实际应用开辟了新领域新思路,必将拓宽到其它应用领域,更多人工智能领域讯息,敬请关注公众号"AI时代2023"。
相关工具
相关文章
推荐
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03
我发现了一款国产AI绘画神器,免费易上手!
2024-07-25 16:40
7位AI考生做今年高考题,能过一本线吗?
2024-07-19 17:17
世界上第一所AI学校来了,80亿人只需要1位老师?
2024-07-18 17:12
Sora首部AI广告片上线,广告从业者危险了!
2024-06-27 13:44
OpenAI与中国说拜拜,国产AI如何接棒?
2024-06-26 15:18
人与AI会产生爱情吗,专家发话了!
2024-06-17 17:28