阿里云通义听悟:突破人工智能大模型技术难点的产物

新知榜官方账号

2023-09-16 22:58:28

背景

当下,基于生成式的人工智能技术(AIGC),仍然需要海量数据进行训练才能得到一个回复质量较高的模型算法,初期训练成本非常之高。这对于倾向自研基础大模型的企业是必须要过的门槛。

现在,阿里云通义听悟成为国内首个开放公测的大模型应用产品,聚焦音视频AI,具备“听力好”,能高准确度生成会议记录、区分不同发言人,“悟性高”,可形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。

市场需求与技术挑战

从市场需求的共性来看,企业对AI技术更关心,关心怎么跟业务融合,但同时也会有些担忧或紧张,新技术会不会对业务带来冲击。与此同时,各国对人工智能和数据获取监管的法律条文,以及对“类ChatGPT”的支持力度,也在反映这种观望态度。

对于人工智能大模型技术,存在着训练成本高、算法不稳定等技术挑战。但在阿里云CTO周靖人看来,有了通义大模型的加持,阿里将多年积累的语音技术,以及多模态的能力有机结合起来,最终形成今天的通义听悟。

通义听悟的应用场景与优势

通义听悟的定位为一款工作学习AI助手,瞄准具有高知识附加值的音视频内容场景,如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新AI技术快速提炼和沉淀知识。通义听悟能够高准确度生成会议记录、区分不同发言人,形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。

市场竞争与前景展望

市面上成熟的AI音视频产品并不在少数,除了讯飞、搜狗、网易有道等具备软硬件能力的服务商外,飞书妙记、腾讯会议等互联网公司孵化的企业办公生产力工具,也同样具备相似的能力。但是,通义听悟通过大模型技术的突破,能够高准确度生成会议记录、区分不同发言人,形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项,具有一定的市场竞争优势。

随着人工智能技术不断发展,大模型技术将成为未来的发展趋势。同时,大模型技术也存在着训练成本高、算法不稳定等技术挑战。但是,通过大模型技术的突破,通义听悟已经实现了高准确度的语音识别和摘要能力。未来,通义听悟将会被各种各样的业务系统集成,集成到智能化服务中,开发者可根据实际场景,最终打造基于业务场景的MaaS服务。通义听悟的未来前景令人期待。

本页网址:https://www.xinzhibang.net/article_detail-11673.html

寻求报道,请 点击这里 微信扫码咨询

关键词

阿里云 通义听悟 人工智能大模型

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯