新知榜官方账号
2023-12-07 10:06:22
关注国际新闻的朋友可能已注意到,每次的联合国大会上,很多外交官都会头戴耳机认真聆听其他国家外交官的发言,这里应用的就是同声传译技术,它让收听者可以快速理解不同国家的语言。以前的同声传译基本上靠人来快速翻译,而随着智能技术的发展,智能机器翻译开始越来越多的应用到同传的领域中。
同声传译,并不是一次简单的机器翻译,要实现同声传译,一是要求“同声”,也就是可以同步识别发言者的语音,实现尽可能短的延迟;二则是“传译”,要求翻译尽可能的准确。随着人工智能和深度学习技术的发展,同声传译技术逐渐实现上述两个要求,比如搜狗的“搜狗同传”技术就可以很好实现“同声”和“传译”。
在语音识别部分,搜狗同传使用了CLDNN+CTC结合的声学模型和RNNLM语言模型,把经过语音断句后的片段,通过声学模型和语言模型转化成文本。这样借助“语音断句算法+声学模型+RNNLM语言模型”,搜狗同传就可以准确识别用户的演讲,从而实现高效的“同声”输入识别。
在完成对用户语音的识别后就需要进行同步的翻译。搜狗同传的文本短句模块借助内容平滑技术去掉无意义词语,使句子变得通顺,然后通过规则和模型两种方法进行语句划分并加标点。这里还运用到了双向GRU技术构建编码端的结构。通过Attention机制在源端和目标端文本间进行对齐并生成当前时刻的句子级向量表示,并送至解码端,解码端逐词解码输出翻译结果。这样翻译后的语句通畅,可以很好让倾听者看明白其他语言发言者要表达的意思。
同声传译技术的发展,使得不同语言的人们可以更加便捷地进行交流。比如对于国外有分部的公司,通过会议室投影仪的展示,不同国家的员工可以无障碍浏览和理解一种语言的制作的PPT。对于希望学习其他语言的网友,借助同声传译远程在线课堂,即使身在中国,也不会由于母语的限制而看不懂国外教师的演示,大大提高在线学习的效率。
随着类似搜狗同声传译技术的发展,接着这些技术我们就可以和国外网友,同事进行无障碍的交流,这极大提高我们之间的沟通效率。正是看到同声传译发展潜力,目前各大IT巨头也在发展各自的同声传译技术,比如谷歌在开发神经网络机器翻译技术,并且在YouTube视频使用即时同声传译字幕。腾讯公司则推出的人工智能同声传译解决方案“腾讯同传”,科大讯飞推出的智能语音翻译机,随着AI技术的发展,这些同声传译技术必将会给我们和世界的交流带来更多的便利。
相关文章
推荐
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03
我发现了一款国产AI绘画神器,免费易上手!
2024-07-25 16:40
7位AI考生做今年高考题,能过一本线吗?
2024-07-19 17:17
世界上第一所AI学校来了,80亿人只需要1位老师?
2024-07-18 17:12
Sora首部AI广告片上线,广告从业者危险了!
2024-06-27 13:44
OpenAI与中国说拜拜,国产AI如何接棒?
2024-06-26 15:18
人与AI会产生爱情吗,专家发话了!
2024-06-17 17:28