通义听悟：一个大模型版的聚焦音视频内容的工作学习AI助手

新知榜官方账号

2023-07-01 08:52:23

通义听悟是一个基于大模型能力的聚焦音视频内容的工作学习AI助手，能够实时转录和翻译音视频，提取关键词和全文摘要，支持英文和中文，并且具有区分多人讨论发言人的能力。该工具还可以将音视频内容一键保存到云盘并自动显示字幕。同时，通义听悟还提供了Chrome插件功能，可以实现实时字幕和翻译，方便用户学习和工作。该工具背后的技术包括大语言模型、语音SOTA和CAM++说话人识别基础模型等。大语言模型能够准确抽取关键信息，通过ELHF方法实现格式对齐，而CAM++说话人识别基础模型则可以区分多人讨论发言人。此外，通义听悟还使用了Paraformer语音识别模型，该模型在推理效率和识别准确率方面都具有优势。对于用户来说，通义听悟的功能非常实用。用户可以在看英文视频、直播、上课开会等场景下使用Chrome插件实现实时字幕和翻译，同时可以将音视频内容一键保存到云盘并自动显示字幕，方便后续使用。此外，通义听悟还能够提取关键词和全文摘要，并区分多人讨论发言人，使用户更加方便地了解音视频内容。

本页网址：https://www.xinzhibang.net/article_detail-3756.html

寻求报道，请

关键词

分享至微信：

相关工具

IconifyAI

AI App图标生成器

Logomaster.ai

AI Logo生成工具

稿定AI

一站式AI创意工具集合，AI绘图、场景生成，商品合成

Dora AI

AI在线生成精美3D动画的网站

Magic Design

在线设计工具Canva推出的AI设计工具

Designs.ai

AI设计工具

人工智能企业出门问问拟在港交所主板上市

人工智能企业出门问问拟在港交所主板上市近日，出门问问更新招股书，继续推进在港交所主板上市的进程，中金公司和招银国际担任联席保荐人。公开资料显示，出门问问成立于2012年，是国内较早一批人工智能代表企业之一，也是Google的战略合作伙伴并得到了Google的投资，亦有SIG海纳亚洲、红杉中国、歌尔股

分类标签出门问问人工智能企业港交所主板上市

12-06 16:12

视频翻译工具MyHeyGen的安装和使用教程

近期，一款名为“视频翻译”的工具引起了广泛关注。这不是一个简单的网页应用，而是一个可以免费部署在个人电脑或服务器上的实用程序。它的强大之处在于能够翻译任意时长的视频内容。所谓的视频翻译，实际上是指同声传译。虽然这类工具并非近期才问世，市场上已有多款成熟产品，例如我之前提到的heygen和rask的网

分类标签视频翻译MyHeyGen安装教程

12-06 04:14

视频翻译工具介绍与使用方法

视频翻译工具介绍与使用方法近期，一款名为“视频翻译”的工具引起了广泛关注。这不是一个简单的网页应用，而是一个可以免费部署在个人电脑或服务器上的实用程序。它的强大之处在于能够翻译任意时长的视频内容。所谓的视频翻译，实际上是指同声传译。虽然这类工具并非近期才问世，市场上已有多款成熟产品，例如我之前提到的

分类标签视频翻译同声传译免费工具

12-03 22:19

视频翻译工具MyHeyGen的安装和使用方法

视频翻译工具MyHeyGen的安装和使用方法近期，一款名为“视频翻译”的工具引起了广泛关注。这不是一个简单的网页应用，而是一个可以免费部署在个人电脑或服务器上的实用程序。它的强大之处在于能够翻译任意时长的视频内容。所谓的视频翻译，实际上是指同声传译。虽然这类工具并非近期才问世，市场上已有多款成熟产品

分类标签视频翻译MyHeyGen免费工具

12-03 16:27

阿里云启用全新LOGO，彰显国际化扩张雄心

阿里云于8月9日宣布放弃原有“云”字LOGO，启用全新的动态LOGO，以推动其国际化。这是阿里云自2009年成立以来第二次更新LOGO，此前的LOGO已经使用了近六年。新LOGO看起来像是两个中括号中间加一个横杠，较之前的“云”字显然简洁多了。据悉，新LOGO有多层含义。来自程序员日常写代码所用的键

分类标签阿里云LOGO国际化

12-03 08:40

视频翻译工具MyHeyGen的安装使用教程

视频翻译工具MyHeyGen的安装使用教程近期，一款名为“视频翻译”的工具引起了广泛关注。这不是一个简单的网页应用，而是一个可以免费部署在个人电脑或服务器上的实用程序。它的强大之处在于能够翻译任意时长的视频内容。所谓的视频翻译，实际上是指同声传译。虽然这类工具并非近期才问世，市场上已有多款成熟产品，

分类标签视频翻译MyHeyGen安装使用

12-03 02:27

大模型PK：阿里云与百度的“全家桶”谁更胜一筹？

大模型PK：阿里云与百度的“全家桶”谁更胜一筹？随着云计算的快速发展，阿里云和百度云成为了国内云计算领域的两大巨头，它们都提供了丰富的云计算产品和服务。本文将对比阿里云和百度云的“全家桶”产品，分析它们的优缺点，帮助您选择更适合的云计算服务。阿里云的“全家桶”阿里云的“全家桶”包括计算、存储、网络、

分类标签阿里云百度全家桶

11-26 08:00

阿里云版Salesforce发布，我的看法

阿里云版Salesforce发布，我的看法2023年11月14日，阿里云宣布推出阿里云版Salesforce，这是一条重磅消息。从产品经理和市场的角度出发，我对此有以下看法：一、市场前景广阔阿里云版Salesforce将结合阿里云强大的云计算和数据分析能力，为企业提供全面的客户关系管理解决方案。随着

分类标签阿里云版SalesforceToB2023

11-16 08:02

八款AI智能软件推荐

聊天机器人ChatGPTChatGPT是一款聊天机器人，不仅可以像人类一样聊天交流，还可以写邮件、写论文、写视频脚本，翻译、敲代码等，能够帮助我们提高工作效率，解决各种日常问题。Al写作助手NotionNotion是一款强大的Al写作助手，能根据输入的关键词，推荐相关的文章素材，可以帮助我们提高文章

分类标签 AI智能软件自媒体写作助手

11-14 16:30

阿里云新LOGO设计解读

阿里云新LOGO设计解读阿里云集团旗下的阿里云换新LOGO了！新的LOGO比旧LOGO好看太多啦！本文详细解读了阿里云新LOGO的设计理念和含义。阿里云的新LOGO是从计算出发，代表着计算和数据的流动。作为现代社会基础设施的计算和数据，是随时随地在运行的，因此LOGO也是动态的。代码是无国界的通用语

分类标签阿里云LOGO设计品牌形象

11-08 16:29

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway