未来媒体融合需更快、更通、更准、更赚,语音AI技术是关键桥梁

新知榜官方账号

2023-06-29 17:06:58

近日,由商务部和北京市人民政府共同主办的2020年中国国际服务贸易交易会(简称“服贸会”)于9月5-9日在北京举办,主题为“全球服务,互惠共享”。在5G和AI的大时代下,中国在线音频行业用户规模指数级增长,在线视频内容供给量也同步呈现出爆炸式增长趋势,媒体融合和智媒体已经成为行业趋势。

传统媒体谋求转型,迫切希望融入新媒体,已经成为近年来老生常谈的话题。在服贸会期间,人工智能公司出门问问高级技术总监叶顺平接受《中国经营报》记者采访时表示,未来的媒体融合是内容与技术的完美融合。他发现,媒体在转型过程中出现了四个问题,不够快:缺乏技术工具支撑;不够通:内容渠道未打通;不够准:用户需求不精准完善;不够赚:商业价值形式单一。

“未来融媒体要想达到相对理想的状态,需要做到更快、更通、更准、更赚,打破文字、音频与视频等内容形式之间的限制。在这个转型升级的过程中,媒体形态之间,不仅能够实现融合,还可以通过技术实现相互转换。”叶顺平说,而语音AI技术,就是传统媒体实现融合与智能化的关键桥梁。

近两年来,科大讯飞、搜狗等以智能语音为主的人工智能公司也开始推出AI虚拟主播产品。为了帮助传统媒体更好地适应音频和视频形态,此次服贸会上,人工智能公司出门问问发布了AI音频内容生产一站式解决方案“魔音工坊”和AI虚拟主播“魔影主播”,该产品面向企业用户,能够将文字升级为音频,以及文字转换为视频的魔影主播,实现内容价值最大化。

叶顺平认为,虽然AI能力越来越强,但是也要承认它现阶段还是不足的。就技术层面而言,存在几处难点。“我们在做AI虚拟主播时,一方面希望能够更接近真人,另外一方面也希望能够贴合人类情感的丰富性,比如我们讲一篇小说的时候,有时候可能比较激昂,有时候比较低沉,我们希望有不同的情感声音去匹配它。”他表示,要想实现这个过程,难点不在于技术,更在于能不能规模化。比如正常情况下,样本可能录个三小时就够了,但是要求保持高兴状态录个三小时就不太容易,这对录音人的情感把控和录制时间也会要求更高一些。“我们希望未来针对不同的情绪,一方面可以有更快捷的录制和学习的时间周期,以及更低的成本,这样未来在配音或者其他方面可以达到普及性。”

据了解,目前出门问问的主要营收至少50%左右都是AItoc,其中也分成软件和硬件等等。“短期来看,还是会以toc这块为主,同时会有组织地推进tob的业务,目前趋势上看,我们tob的业务比重是在提高的。未来业绩方面,我们希望tob的业务贡献能够进一步提高,比如说智能车载场景,我们跟大众汽车集团的合作,希望能有更好的业绩增长。”

本页网址:https://www.xinzhibang.net/article_detail-2813.html

寻求报道,请 点击这里 微信扫码咨询

关键词

服贸会 媒体融合 语音AI技术

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯