阿里云推出通义听悟,AI助力音视频智能转写

新知榜官方账号

2023-11-20 18:01:22

阿里云推出通义听悟,AI助力音视频智能转写

阿里云正式对外披露通义大模型最新进展,瞄准AI音视频赛道推出“通义听悟”,并且正式开启公测。

“通义听悟”不仅可以实现语音实时转写、音频视频转文字、中英互译,作为基于阿里云通义千问大模型开发的AI应用,其主要针对音视频内容进行转写、检索、摘要和整理,比如用大模型(LLM)自动做笔记、整理访谈、提取PPT等。

“通义听悟”自6月1日至30日,开启30天的公测,公测期间任意支付宝用户只需要登陆tingwu.aliyun.com,扫码即可体验到AI助力音视频智能转写。通义听悟支持实时录制与音视频上传识别,只需要浏览器就能实现音视频录制与上传,每个用户有2GB存储空间,另外如果使用的是阿里云中存储的音视频则不占用存储空间,理论上可以存储无限内容哦。

在录制结束或是上传音视频完毕之后,系统会提示是否启用发言人区分及发言总结功能,可以识别多人讨论的结果,并对发言者的发言进行智能总结。转写之后还可以实现AI智能听取关键词、章节小结等功能。选中听力中的文本还可以进行摘录或是回顾播放,适合进一步加工录音信息。

我们还可以对录音文本进行标记,区分重点、问题或是高亮部分,并支持依据标记对文本进行信息筛选。

利用“通义听悟”可以利用AI与大语言模型实现高品质的课堂观察!转变思维,通义听悟化身听课专家使用“通义听悟”进行课堂观察,有两种方式:一是上传课堂录像视频,二是直接利用电容话筒在网页端开启录音转写。打开「上传音视频」功能,选择「上传本地音视频文件」并上传,即可生成课程记录。当然也可以将课堂视频导入“阿里云盘”,选择「导入阿里云盘文件」并上传。初次使用需要先绑定你的阿里云盘账号哦,单次导入最多支持5个文件批量处理。这里需要注意的是,如果开启网页录制的话,建议还是使用无线领夹式无线麦克风增强收音效果(例如胖胖老师选用的飞利浦一拖二麦克风,400元左右,一个给老师,一个给学生,可以实现高清音频采集录制)。

借助AI大语言模型,通义听悟可以极速转写文字实录(1小时音频5分钟出稿),智能总结全文概要、章节速览,方便我们了解课程要点,回顾讲解片段。我们可以通过AI转写快速了解课程的教学主要内容,方便对照教案中的课程目标分析教学的有效性。通过“章节预览”,判断课堂教学的阶段流程是否清晰,核心问题探究是否落实,问题链设计是否有效。章节预览,可以智能识别课程中的教学流程,清晰了解整堂课的教学设计与课堂教学实际是否匹配。并利用AI智能整理该章节的内容,方便撰写课堂观察报告。同时,打开通义听悟实验室,开启问题回顾,即可查看课程中的答疑内容。利用AI模型特别适合观察教师的教学问题设计是否具有COT(chainofthoughts)的特征,引导教师设计有效的问题链来推进教学策略的持续优化。

完成转写和分析之后,我们点击页面左侧「导出」按钮,可以将转写结果、笔记等内容导出至本地或阿里云盘。你可以选择需要的文件格式。

通义听悟的出现,标志着AIGC在教学场景中的应用正在快速实用化,虽然在测试中AI的语音识别转写准确度还有待提升,尤其是理科有着大量专用名词的教学场景,识别率极速下降的问题依然存在,但瑕不掩瑜,AI正在改变着我们的教与学!

小福利目前通义听悟公测用户每天签到即可免费获取两小时智能转写服务,如果有口令或是邀请其他小伙伴还能额外获得时长哦。

本页网址:https://www.xinzhibang.net/article_detail-20598.html

寻求报道,请 点击这里 微信扫码咨询

关键词

阿里云 通义听悟 AI音视频 智能转写

分享至微信: 微信扫码阅读

相关文章