人工智能“闻声识相”:如何通过声音识别人脸?

新知榜官方账号

2023-11-29 16:58:09

人工智能“闻声识相”:如何通过声音识别人脸?

人工智能近年来发展迅速,其中“闻声识相”技术备受关注。该技术通过深度学习和跨模态检索技术,将人脸图像和语音音频片段分别输入人脸编码器网络和语音编码器网络,根据身份的平均损失为提取的特征值分配不同的权重,并过滤掉个性化样本,然后使用两级模态匹配更新神经网络参数,从而找到声音和人脸的关联性。

目前,在给定一段声音和仅含有一张正确人脸的若干张人脸图片的条件下,这套AI算法匹配声音和人脸的正确率约为87.2%,而相同条件下,人类判断的准确率约为81.3%,如果限定鉴别对象的性别,则准确率将降到57.1%。该技术后续可辅助用于AI虚假视频检测,保护用户的财产和信息安全。

此外,该技术还可以被运用于刑事案件中犯罪嫌疑人的画像、诈骗案中虚假视频的检测、电话银行中客户面容的预测等场景中。未来,随着技术的不断进步,该技术的应用场景将会越来越广泛。

本页网址:https://www.xinzhibang.net/article_detail-21448.html

寻求报道,请 点击这里 微信扫码咨询

关键词

人工智能 算力 算法 数据 闻声识相 声音识别

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯