搜狗AI变声技术落地消费级产品

新知榜官方账号

2023-06-29 19:08:33

搜狗输入法首创的AI变声功能,是基于搜狗近期在语音表征学习、迁移学习技术取得的重大突破,首次将该变声能力落实到消费级产品中。谷歌科学家曾研究过语音变声,但只停留在论文这个层面。现在搜狗语音将前沿技术实用化,运用到日活跃达4.43亿人次的搜狗手机输入法中,其应用前景相当广阔。不用再追忆、不用再幻想,只需要在手机输入法中轻轻一点,AI就能将我们秒变星爷,与心中的那个她演绎浪漫。

AI变声集语音表征学习技术、风格迁移技术之大成,不再是冰冷的、千篇一律的角色声音。使用普通变色软件得到的是不稳定音色和效果的机器声音,而使用搜狗手机输入法的AI变声得到的是充满情感、且高度还原的音色,因此充盈着真实感。

搜狗语音使用表征学习获得说话人语音的音色特征和内容细节,通过风格迁移技术获得说话人语音的风格特征,再将说话人的音色特征替换为角色的音色特征,最后基于搜狗语音技术,使用内容(源端)、韵律(源端)、音色(目标端)三类特征结合为最终变声音频。搜狗做到的是语音变声领域最难的技术,通过在语音表征学习、迁移学习技术取得的重大突破,可以把任意人音色变声成特定人音色(Any-to-One),从实用程度到技术难度都是最高等级。

搜狗手机输入法每天峰值达6亿次语音识别请求,位列行业第一,为公司改进、完善、蜕变AI技术提供了坚实的基础,这个得天独厚的优势令其在语音领域处于领跑地位。

AI变声也有广泛的应用前景,譬如制作“表情语音包”、少儿在线教育、电商产品广告等,在不同场景中都能发挥出其独特的优势。

本页网址:https://www.xinzhibang.net/article_detail-2859.html

寻求报道,请 点击这里 微信扫码咨询

关键词

搜狗 AI变声 语音表征学习

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯