Meta发布VoiceboxAI模型，可生成回复音频消息

新知榜官方账号

2023-06-29 21:22:35

Meta发布VoiceboxAI模型，可生成回复音频消息

Meta发布了VoiceboxAI模型，相对于只能使用文本或图片回复的竞品模型，VoiceboxAI模型的优势主要如其名，能够生成用于回复的音频消息。Voicebox可以制作高质量的音频剪辑并编辑预先录制的音频，例如移除汽车音箱或狗叫声的同时保留音频的内容和风格。该模型也是多语言的，仅需2秒声音样本，可以产生六种语音。

未来像Voicebox这样的多用途生成AI模型可以为元宇宙中的虚拟助手和NPC角色提供自然的声音，也可以让视障人士听到朋友由文本传来转为语音的内容，AI会用他们的声音朗读这些文本消息。Meta表示，Voicebox具有多功能性，可以实现各种任务，包括：

上下文文本到语音合成：使用短至两秒的音频样本，Voicebox可以匹配音频风格并将其用于文本到语音生成。
语音编辑和降噪：Voicebox可以重新创建被噪音打断的部分语音或替换说错的词，而无需重新录制整个语音。例如，您可以识别被狗叫声打断的一段语音，将其裁剪，然后指示Voicebox重新生成该段内容。
跨语言风格转换：比方说某人以一段英语演讲的内容，Voicebox可以生成他以不同语言演讲的内容。将来可以使用此功能来帮助人们以自然、真实的方式进行交流，即使他们不会说同一种语言。
Diversespeechsampling：从不同的数据中学习后，Voicebox可以生成更能代表人们在现实世界中使用上述六种语言的谈话方式的语音。

Meta表示，Voicebox可以为基于AI的虚拟助手或元宇宙中的NPC提供自然而真实的语音效果。而对于无障碍方面而言，Voicebox也可以对声带受损的人群提供一定的协助作用。不过，Meta表示VoiceboxAI模型目前仍处于研发阶段。Meta表示，他们意识到这种人工智能技术在虚假伪造方面，可能会带来潜在危害。事实上，在新闻上也已经听过有些诈骗集团利用与本人几乎一样的声音来进行诈骗的案例出现过了，因此Meta目前正在努力找到一种有效的方式来区分真实语音和由Voicebox生成的音频，在找到解决方案前，暂时不会向公众公开提供。

本页网址：https://www.xinzhibang.net/article_detail-2911.html

寻求报道，请

关键词

分享至微信：

三个国外专业免费的调色网站

三个国外专业免费的调色网站无论制作视频、编辑图片，合适的色彩会让你的作品增加视觉冲击力，所以专业的调色技术价值非凡，一部电影或一部好的视频、图片海报，专业调色耗费少则上万，多则上百万，只是大家对专业调色这个行业知之甚少，今天网玩君就为大家分享三个国外专业免费的调色网站，记得收藏好，以后编辑视频、图片

分类标签调色网站免费

04-18 16:42

第六届中国国际工业设计博览会盛况空前

第六届中国国际工业设计博览会于11月30日至12月2日在武汉举行。本届博览会展览面积达2万平方米，参展企业超过300家，其中，参展国家级工业设计中心数量为历届最多。众多国内外行业龙头企业展示了多项“首台套”的硬核实力，为中国制造业向高端化、智能化、绿色化转型升级赋能。中铁宝桥集团展示了多个“国内首条

分类标签中国国际工业设计博览会工业设计创新成果中国制造业

04-18 16:42

知识分享查理芒格思考的独立性与决策的准确性

知识分享查理芒格思考的独立性与决策的准确性本文介绍了成功投资者必须具备独立思考和决策准确性，同时保持谦逊低调的心态，以及成功的关键因素之一——运气。同时，本文还分享了下周市场关注的行业和概念。一、知识分享查理芒格思考的独立性成功的投资者必须具备独立思考的能力，因为只有独立思考才能避免盲目跟风和投资决

分类标签独立思考决策准确性谦逊低调

04-18 16:42

阿里国际发布三款AI设计工具助力中国制造走向全球

阿里国际发布三款AI设计工具助力中国制造走向全球12月1日，在第六届中国国际工业设计博览会上，阿里国际数字商业集团（简称“阿里国际”）发布了3款设计生态工具：堆友、PicCopilot、鹿班AI。这3款产品具有AI绘画、AI模型创作、AI图像和视频处理等功能，用AI设计服务全球商家更轻松的做好本地市

分类标签 AI设计阿里国际数字商业集团

04-18 16:42

电影制作中的纹理技术

纹理在电影制作中的重要性纹理是指将详细的表面特征应用于3D模型或视觉效果元素，使其看起来更逼真。纹理对于创建视觉上引人入胜且可信的电影场景至关重要，尤其是涉及CGI、动画或特效的场景。纹理还支持叙事和讲故事，可以通过纹理设置年龄大小等属性，为故事奠定基础。纹理技术的发展历程自胶片问世以来，电影制作人

分类标签纹理电影制作CGI视觉效果微缩模型UV映射

04-18 16:42

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway