新知榜官方账号
2023-11-05 02:26:19
10月27日全球顶级机器人开发商波士顿动力(BostonDynamics)在官网发布,通过将ChatGPTSpot以及其他AI模型相结合,开发了一种会说话的导游机器狗。Spot机器人(机器狗)"导游",能用英国口音与员工聊天带他们参观公司的设施。该机器人能够回答问题,甚至可以像木偶一样张开"嘴巴",让它看起来像是真的在说话。该机器狗能够根据文字语音提示与人类进行交谈,同时提供了视觉问答功能,可以分析摄像头拍摄的画面自动生成图像说明。公司还给该机器人安装了一个扬声器,增加了文本转语音功能。
ChatGPT等大语言模型展现出了强大的控制和输出能力,可以用于控制物理机器人的行为和决策功能。例如输入一些特定景点数据图片等,可让机器人提供逻辑清晰条理分明的导游功能。此外这也增强了物理机器人的拟人化能力,如为你讲一个冷笑话、做一个逗你开心的滑稽动作。公司使用一台电脑作为机器狗的控制大脑,并通过SpotSDK与其实现数据交互。为了让机器狗具备拟人化动作,例如点头、伸脖子等,使用了Spot的点臂和夹具相机视觉功能。利用机器人的抓手摄像头和前置机身摄像头,实现以视觉问答模式。例如"这张图片有什么有趣的地方?"或图像字幕模式互动交流听觉功能。为了让机器狗可以实现"听"的功能,研发人员将麦克风数据分块输入到OpenAI的语音模型Whisper中转换为英文文本互动交流。为了让机器狗能与人类实现对话,需将语音指令转换成文本用于提示ChatGPT,通过云服务ElevenLabs工具来实现。
波士顿动力公司在机器人方面深耕了20余年,此前它已对外公布了多款机器人,其产品在工业研究和消费领域都有应用。主要代表机器人包括:BigDogAtlasSpotHandle等,其中就包括Spot机器人(机器狗)。Spot是该公司成立20多年来推出的首款商用机器人是一款电动液压机器狗,它能走能跑还能爬楼梯上坡下坡。此外它还拥有跳舞探索矿井以及帮助医务人员等诸多技能,但它还在不断学习新的技巧。会说话的导游机器狗的上市是人工智能应用领域的新现象,机器狗展现出自我决策能力,能回答问题并主动与人互动。为大语言模型实现实际应用开辟了新领域新思路,必将拓宽到其它应用领域,更多人工智能领域讯息,敬请关注公众号"AI时代2023"。
相关工具
相关文章
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16