阿里云发布通义听悟:中国首个开放公测的大模型语音助手产品

新知榜官方账号

2023-07-05 20:42:29

阿里云发布通义听悟:中国首个开放公测的大模型语音助手产品

距离阿里云大模型“通义千问”问世不到两个月时间,阿里云于2023年6月1日在广州的阿里云峰会上发布了通义家族新成员——通义听悟。这是一款由阿里云达摩院研发的AI语音助手,也是中国首个开放公测的大模型应用产品。

据阿里云介绍,该产品不仅“听力好”,可以准确生成会议记录、区分不同发言人,“悟性”也高,能给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理重点和待办事项。用户可以摘取关键信息到页面右侧的空白笔记中。

竞争转写的“AI”能力

阿里云智能集团首席技术官周靖人在峰会现场介绍通义听悟背后融合了十多项AI功能,瞄准的是具有高知识附加值的音视频内容场景,如开会、上课、面试、直播、看视频、听播客等。听悟最早亮相于2021年杭州云栖大会,次年发布了进阶版。通义听悟技术负责人鄢志杰向南方周末等媒体透露,通义听悟前身就是阿里内部所使用的语言记录工具,现在的听悟更像是“助手”,在提供帮助的同时还有可能产生建议或启发。

智能化的录音笔是科大讯飞等公司的拳头产品,但阿里云暂时不做硬件。

除了个人版外,后续还会发布企业应用。未免数据安全忧虑,周靖人介绍,通义千问自身的大模型训练不依赖于用户数据。阿里云方面介绍,通义听悟还即将上线一键提取PPT、针对多个音视频内容向AI提问、概括特定段落、Chrome插件双语悬浮字幕条等功能。

本页网址:https://www.xinzhibang.net/article_detail-5993.html

寻求报道,请 点击这里 微信扫码咨询

关键词

阿里云 通义听悟 大模型应用

分享至微信: 微信扫码阅读

相关文章