搜狗同传3.0发布，首创语境引擎，多模态同传技术实现新突破

新知榜官方账号

2023-07-01 16:44:49

搜狗同传3.0发布，首创语境引擎，多模态同传技术实现新突破

上周六，搜狗发布了业内首个多模态同传产品——搜狗同传3.0版。搜狗同传3.0采用了搜狗独创的「语境引擎」，加入了视觉和思维能力，让机器同传不仅会听，还首次具备了看、理解和推理的能力。此外，搜狗同传3.0还实现了更为自然的交互，包括语音、图像、手势等各种方式。

首创「语境引擎」，搜狗AI同传新突破

搜狗同传技术自2016年发布以来，已经经历了数千场会议同传的实际应用。开发者们在实践中发现，业内主流的语音同传系统无法稳定、高质量地满足多种演讲场合的需求，经常会出现演讲内容中专业词汇的识别和翻译效果不佳的情况。为了解决上述问题，搜狗在同传3.0版中加入了「语境引擎」，希望能够通过对语言的深入理解来解决问题。

「语境引擎能够实时利用摄像头识别现场屏幕上的PPT内容，」陈伟介绍道，「之前机器同传只能获取语音信息，通过OCR技术，现在搜狗同传可获取语音信息+PPT信息，随后语境引擎可以构建个性化知识，从而使得同传译文效果有大幅提升。」

除了专有名词，新技术的性能具体提升了多少？搜狗表示，他们特别选择了一个难度较高的专业性会议演讲，对同传2.0版、3.0版和人类专业同传进行了对比测试。人类达到了4.08分、搜狗同传2.0可以达到3.41分，而3.0版则获得了3.82分。这一成绩实现了同传领域的新突破，让AI距离专业的人类同传水平又近了一步。

能看又能听的多模态技术

搜狗同传3.0主要带来了三个方向上的提升：更加接近自然，从单纯的语音识别到语音+图像，新的方法模拟了人工同传的工作方式，增加视觉和大脑扩散知识点的功能，拥有更为复杂的感知系统。更加专业，新的模型通过实时定制知识增强能力，能够捕捉现场PPT内容补充演讲相关的专业领域的知识，并针对每一个演讲进行模型定制，提升同传效果。更加智能，现在自动学习PPT的内容，自动捕捉海量词汇，确保同传品质非常优秀。

与演讲者一起「边看边思考」相比以往，多模态的AI同传更加接近于人类，「会看」意味着同传首次具备了视觉能力。据介绍，搜狗同传3.0在使用中可以借助屏幕截取，或者普通摄像头实时获取图像信息，不需要使用特定的设备。「能理解会推理」，则归功于搜狗语境引擎的应用。在这其中则包含了搜狗知识图谱和百科的推理能力，系统可以将OCR技术获取的文字内容与演讲相关的核心知识产生关联，并通过「搜狗知立方」知识图谱实时推理拓展，获取背景知识。另外，同传系统可以基于搜狗百科的中英术语库获得中英双语对照，实时优化同传识别和翻译的效果。

多场景应用

搜狗同传3.0的技术体系还会在更多场景中落地，远程会议、记者采访、视频直播、旅游出行，甚至法院庭审记录都是未来努力的方向。

搜狗同传技术自2016年发布1.0版以来，经历了不断升级的过程。在同传系统翻译模块的背后，1.0版使用RNN模型，在2.0版本中，我们引入了Transformer模型，解决了梯度爆炸问题，并可以记住更长的历史内容。在3.0版的系统中，除了Transformer，还采用了基于上下文的流式解码，并引入了基于搜狗百科的知识图谱。」

但同时我们也应看到行业的共性问题，AI同传的准确性距离人类专家水平还有一定距离。搜狗同传3.0背后，更是公司「自然交互+知识计算」战略的深入。搜狗正在依托语音、图像、手势等各种方式让AI与人类展开更为「自然」的交流。

本页网址：https://www.xinzhibang.net/article_detail-3953.html

寻求报道，请

关键词

分享至微信：

相关工具

火山翻译

字节跳动推出的智能翻译工具

搜狗翻译

你的贴身智能翻译专家

讯飞智能翻译

科大讯飞推出的人工智能翻译平台

有道翻译

在线即时翻译文本、文档、网页

百度翻译

200种语言互译、沟通全世界！

彩云小译

兼具中日英同声传译、文档翻译和网页翻译的智能翻译工具

国内多家办公软件推出基于大模型AI应用

国内多家办公软件公司推出基于大模型AI技术的智能服务应用。4月18日，钉钉和金山办公分别宣布推出生成式AI应用，都来自于大模型技术的支持。钉钉接入阿里巴巴的“通义千问”，提供了10余项AI能力，覆盖群聊、文档、视频会议和低代码应用开发等。金山办公的应用叫“WPSAI”，提供文档起草、改写、总结、润色

分类标签大模型AI应用办公软件

12-10 04:05

金山办公举行2022年度业绩说明会，AI是重要产品战略之一

金山办公举行2022年度业绩说明会，AI是重要产品战略之一6月20日下午，金山办公(688111)举行2022年度业绩说明会。对于AI相关产品发展情况，公司董事长邹涛介绍，当前公司选择“两条腿走路”，首先会选择和AIGC、LLM相关的技术服务商合作，通过他们的技术赋能来进行产品研发；同时，我们也在持

分类标签金山办公AI业绩产品战略

12-10 04:04

WPSAI大模型AI办公应用开启公测，用户可免费试用

WPSAI大模型AI办公应用开启公测，用户可免费试用今天金山办公方面宣布，基于大模型的AI办公应用WPSAI即日起开启公测，面向全体用户陆续开放体验。目前用户可前往WPSAI官网领取体验福利，并下载最新版WPSPC客户端限时体验文字/智能文档、表格/智能表格、PPT演示组件的AI能力，安卓、iOS和

分类标签 WPSAI大模型AI办公应用

12-10 04:03

三款翻译类应用拍照翻译功能对比

三款翻译类应用拍照翻译功能对比翻译类应用是手机必备的工具之一，除了学习之外，在出国旅游时也能派上大用场。现在的翻译应用较之前变化不小，除了最为基础的输入单词翻译之外，拍照翻译的出现让使用成本大大降低，用户只要将单词拍摄下来，应用将自动识别并转换为设置好的语言。不过拍照取词受外部影响会比较大，语种、字

分类标签翻译类应用拍照翻译百度翻译有道词典金山词霸

12-10 04:02

2023福布斯中国创新力企业国际投资大会

背景在全球经济不确定性增加的背景下，众多企业纷纷以创新之力应对当前所面临的挑战。创新不仅能帮助企业找到新的增长点，而且有助于其更好地适应经济波动。大会介绍由福布斯中国集团和杭州市拱墅区人民政府共同举办的“2023福布斯中国创新力企业国际投资大会”将于11月8日至9日在杭州举行。大会将正式发布“202

分类标签创新力企业投资

12-10 04:01

金山干了10年，创业4年，王峰的互联网传奇

王峰是一位互联网传奇，他在金山干了10年，创业4年，经历了许多波折和挑战，但最终成功走上了赴港上市之路。王峰的创业之路是不平凡的。他曾经是一名中学数学老师，但在1995年的时候，他离开了教师行业，开始在北京创业。最初的日子非常艰难，他先是在中关村图书城街头卖保健品，后来，投资三万跟人合伙创办一家公司

分类标签王峰金山创业互联网传奇

12-10 02:55

WPS办公软件拟IPO，雷军旗下又一家上市公司

WPS办公软件拟IPO，雷军旗下又一家上市公司WPS办公软件拟在创业板上市，募集资金用于多个项目。金山办公是雷军旗下的公司之一，实际控制人为雷军。文章回顾了WPS的历史，从1988年诞生至今，经历了多次升级和挫折。现在，WPS在政府、金融、能源、航空等多个领域得到广泛应用。文章还提到了金山办公可能面

分类标签 WPSIPO金山办公雷军办公软件

12-10 02:49

关于外国书的翻译问题

外国书的翻译问题如果一场足球比赛，观众的注意力总集中在裁判身上，那一定是裁判水平有问题。同样，一本书在阅读过程中，读者总是想到译者，那译者八成水平有限。80年代我看外国译作，从来没注意到翻译者，都是很自然地把一本书看完，注意到译者往往是通过其他方式。现在的外国书译成中文，好的真不多。我作为一个读者，

分类标签外国书翻译文学修养

12-10 02:48

金山打字通2002安装体验

金山打字通2002安装体验金山打字通2002是介于2000版和2003版之间的版本，本文主要介绍了金山打字通2002的安装环境和步骤，并进行了简要的硬件要求说明。运行环境金山打字通2002最低硬件要求是：CPU：奔腾166以上内存：16MB显示卡：标准16位VGA硬盘：全部安装135MB驱动器：倍速

分类标签金山打字通2002安装体验

12-10 02:47

金山办公（688111）：业绩稳健增长，市场竞争力凸显，未来发展潜力巨大

一、业绩表现金山办公（688111）自上市以来，业绩一直保持稳健增长。根据公司披露的三季报，2023年前三季度，金山办公实现营业收入32.7亿元，同比增长16.99%；归属于上市公司股东的净利润为8.93亿元，同比增长9.86%。这一业绩表现显示出公司在市场中的强大竞争力和优秀的运营能力。二、市场竞

分类标签金山办公办公软件市场竞争力

10-30 02:26

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway