新知榜官方账号
2023-10-07 02:04:24
近日,OpenAI宣布推出新版ChatGPT,增加了语音输入和图像输入功能。语音输入功能类似于手机上的语音助手,用户只需按下一个按钮,说出自己的问题,ChatGPT就会将其转换为文本,然后生成答案,再将答案转换为语音,播放给用户。这种交互方式更加自然和便捷,而且答案的质量也会更高。
图像输入功能则类似于GoogleLens,用户可以拍摄自己感兴趣的事物,并上传到ChatGPT中。ChatGPT会尝试识别用户想要询问的内容,并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题,或者配合语音或文本输入来进行交流。
ChatGPT的优势在于它可以进行多轮对话,而不是一次性搜索。如果用户对答案不满意或想要更多信息,可以继续向ChatGPT提问,从而得到更准确和全面的答案。不过,图像搜索也有一些潜在问题。例如,在处理人物图片时,OpenAI表示他们限制了ChatGPT对人物进行分析和直接评价的能力,既为了保证准确性,也为了保护隐私。
除了新功能,OpenAI还开发了一种新的文本转语音模型,可以根据几秒钟的样本语音,生成与之相似的人声。用户可以从五种选项中选择ChatGPT的声音,而且这种模型还有更多的潜在用途。例如,OpenAI正在与Spotify合作,将播客翻译成其他语言,同时保留播客主持人的声音。不过,这种模型也存在一些风险,比如可能被恶意利用来冒充公众人物或进行诈骗。因此,OpenAI表示,这种模型不会被广泛开放,而是会受到严格的控制和限制。
自从2022年初推出ChatGPT以来,OpenAI一直在努力为其机器人增加更多功能和能力,同时避免造成新的问题出现。通过这次更新,该公司试图在这条界线上寻找平衡点,通过有意识地限制其新模型能做什么来实现这一目标。但是这种方法并不是长久之计,随着越来越多的人使用语音控制和图像搜索,以及ChatGPT逐渐成为一个真正的多模态、有用的虚拟助手,要保持安全和合理的边界会变得越来越困难。
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16