新知榜官方账号
2023-11-05 08:36:16
最近,短视频平台上出现了高度模仿真人声音的场景视频片段,这样的视频往往以某一段非常有名的角色带入,开始还是角色的本来说话内容,可是,接下来内容变了,原来的角色竟然说起了与新的场景相吻合的话语。没有听过的,肯定先是一愣,诧异于TA怎么会这么说?不过,很快就明白了,这是人为的改变,具体说就是,借助了AI技术,让角色说出了不同于原场景的话语。
关键问题是,这个语音与角色的原来语音整体一样,语调、语速等几乎与原声相同,这才是人们关注、思考的重点。至于UP主让TA说什么,完全是为了配合新场景、新表达的需要。站在技术的角度,这个东西非常不一般。
曾几何时,有人为了制作视频,拍摄、剪辑都不是问题,问题在于配音不好解决。一般人说话,带有很强的口语化,如果不是经过特别的播音训练,录制的声音效果很一般,所以说,早期的配音,都是去找专业的播音员。后来,随着技术的进步,电脑合成声音慢慢普及,但是,也仅限于有限的几种,且生成的声音较为机械,与真人发声相差较大,就是现在的短视频中仍然可以感受到这个效果。时间长了,人们就习惯了,不太较真,但是,对于重要的配音,仍要选择专业人员。这要说,随着技术进步,电脑声音会越来越流利、流畅,人们信,但是,这个电脑声音还要由标准化变为个性化,这就有点匪夷所思。
可是,对于AI来说,没有什么不可能,研究人员终究还是克服了真人个性化发音的问题,这仿佛是打开了潘多拉魔盒,让有些场景,让人们的认知,开始变得不确定。自从有了电脑存储,声音、图像成了记录特定时间、场合内容的工具和形式,里面包含着我们所需要的资料,甚至可以作为证据。但是现在,由于AI对于声音的改变,让我们不得不重新审视现在及未来的内容和规则,究竟还能不能相信,能不能作为证据,又如何进行鉴别?都是问题。
说到声音,我们就不得不再进一步说说视频,尤其是AR技术对于视频内容和形式的改变,这个代入感很强,只要代入的实体和视频现场采集的场景高度吻合,就会造成真假难辨。短视频,作为娱乐的属性很强,几乎没有人去想其他的事情,人们更多的是去欣赏和沉浸。由于技术的普及,普通人亲自试一试都不是问题。随着元宇宙概念的提出,AI、AR技术成为了构成基础,我们真人不可能有足够的时间亲自下场元宇宙场景,那么我们本人的代表在元宇宙里,不止需要AR沉浸,还需要AI代表本人发声,它们越接近,效果越好。不难看出,AI、AR对于声音、视频的改变有着特定的现实需求,不是单纯的出于娱乐性质。
那又如何管控呢?我们可以把这些都归为产品的范畴,作为产品,作为视听产品,必须具备清楚的标记,让人们很容易的识别它的出处,从而不至于造成混淆,给其他环节带来困惑,这个是必要的。
相关工具
相关文章
相关快讯
推荐
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03
我发现了一款国产AI绘画神器,免费易上手!
2024-07-25 16:40
7位AI考生做今年高考题,能过一本线吗?
2024-07-19 17:17
世界上第一所AI学校来了,80亿人只需要1位老师?
2024-07-18 17:12
Sora首部AI广告片上线,广告从业者危险了!
2024-06-27 13:44
OpenAI与中国说拜拜,国产AI如何接棒?
2024-06-26 15:18
人与AI会产生爱情吗,专家发话了!
2024-06-17 17:28