科大讯飞发布讯飞星火认知大模型V2.0，代码能力和多模态能力大幅提升

新知榜官方账号

2023-08-16 02:17:06

科大讯飞发布讯飞星火认知大模型V2.0，代码能力和多模态能力大幅提升

8月15日，科大讯飞如期发布“讯飞星火认知大模型V2.0版本”（简称：星火V2.0）。星火V2.0此次最大的升级在于代码能力和多模态能力的大幅提升。据科大讯飞董事长刘庆峰介绍，从业界参考测试集上的效果对比来看，星火V2.0基于Python和C++进行代码写作能力已高度逼近ChatGPT，差距仅为1%和2%。同时，他明确了星火大模型远期目标：到10月24日星火大模型代码能力全面超越ChatGPT，明年上半年将正式对标GPT4。

据了解，相比之前的星火V1.5版本，星火V2.0的文本生成能力提升72%，语言理解提升78%，知识问答提升70%，逻辑推理提升60%，数学能力提升72%。最为显著的能力升级自于两个方面，其一是代码生成、代码补齐、代码解释、代码纠错和单元测试生成等能力。刘庆峰在发布会上坦言，星火认知大模型目前数学能力目前已经超过ChatGPT，“但离我们的期望还有一段距离”。科大讯飞在发布会现场也演示了星火大模型最新的代码能力。演示人在现场向星火大模型下达一段指令，即用Python完整实现以下功能：判断输入字符串是否符合码规则，密码规则为长度不小于8位，必须包括大小写、数字及特殊符号。随后，星火大模型给出的代码在系统中顺利跑通。另外，星火大模型还可以使用Python处理视频。在演示过程中，星火V2.0使用Python处理了一段长达2分钟的视频，从中提取第二到第十秒，把画面缩小一半，同时加速5倍，然后保存成gif图片。在现场演示中，星火大模型甚至完成“贪食蛇”游戏的代码生成，并令游戏流畅运行。据刘庆峰介绍，从业界参考测试集上的效果对比来看，星火V2.0基于Python和C++进行代码生成能力已高度逼近ChatGPT，差距仅为1%和2%。同时，与星火V1.5相比，其Java和JS语言的生成能力也分别提升了15个百分点和23个百分点。在科大讯飞看来，代码是一项硬碰硬的能力，不存在任何主观评分标准，所以其也被视为大模型聪明程度的重要标志。

另一重大升级则在多模态能力方面。据了解，这一最新版本大幅提升了多模态理解及多模态生成方面的能力。刘庆峰直言，“多模态能力是人工智能必由之路。”而且在业内看来，近期随着妙鸭相机、Midjourney等爆款频出，未来大模型的多模态能力价值将会凸显。据了解，在多模态能力领域，星火V2.0在图片理解、图片描述、图片推理、文图生成、虚拟人合成等能力取得重要进展，显著提升大模型对场景的理解能力及面向生活和工业领域的智能化支撑能力。在现场演示环节，演示者甚至直接现场拍摄会场照片，抛给星火V2.0识别并令其作出描述。星火V2.0随后将发布会现场描述为一个“重大而正式”场景，同时将并不清晰图片中的文字获取，写出相应文案。

基于多模态能力升级，科大讯飞还同时发布“讯飞智作2.0”工具。这一工具能进行视频分析，写创意文案，进行AI配音，提供配图生成、AI主播功能。在现场演示中，讯飞智作2.0直接为一段视频配上字幕、并生成虚拟主播以及语音配音，大幅度提升图文创意、视频配音和视频制作工作效率。

此外，在此次发布会上，科大讯飞还宣布联合华为推出讯飞星火一体机。据介绍，讯飞星火一体机将使所有企业更方便、更自主、更安全可控地私有化部署大模型能力，在完全国产自主创新的平台上进行私有化部署，保护数据安全。近期已有不少合作者开启与科大讯飞的合作。就在8月14日，万兴科技宣布旗下绘图创意软件亿图图示、亿图脑图以及墨刀，将以插件的方式入驻讯飞星火认知大模型平台，并将结合大模型平台能力，为用户提供强大的AI绘图创意解决方案。

自星火大模型5月6日发布后，讯飞人工智能开放平台的开发者团队数量在两个月内增加85万。在6月9日，星火V1.5版本进一步优化，包括开放式问答取得突破，多轮对话和数学能力再升级，文本生成、语言理解、逻辑推理能力持续提升等。星火大模型下一个重要节点是今年10月24日。按照此前规划，星火大模型将对ChatGPT实现中文超越、英文相当。而刘庆峰在此次发布会上又抛出更进一步目标：到今年10月24日各项代码的能力都会超越ChatGPT，明年上半年将正式对标GPT4。

据中国基金报

本页网址：https://www.xinzhibang.net/article_detail-9894.html

寻求报道，请

关键词

科大讯飞讯飞星火认知大模型V2.0 代码能力多模态能力人工智能 ChatGPT

分享至微信：

相关工具

Adobe Podcast

Adobe推出的在线AI音频录制和编辑工具

Typecast

在线AI文字转语音生成工具

ACE Studio

AI歌声合成工具，输入歌词与旋律即可生成宛如真人的歌声

Krisp

AI噪音消除工具

Soundraw

AI音乐生成工具

Clipchamp AI旁白生成器

Clipchamp的文字转语音生成器

英语口语中常用的警告表达

英语口语中常用的警告表达在紧急情况下，能够快速有效地表达警告至关重要。下面是英语口语中常用的警告表达：Freeze!Duck!Hand up!Don't move!You listen to me!Get down!Halt!Move on!Let go!Run for your lives!Sto

分类标签英语口语警告紧急情况

12-01 16:27

看美剧学英语：Cutitout(住手)

看美剧学英语：Cutitout(住手)学习英语不是指你懂多少中文，而是看你能用英语说多少。要养成看美剧时使用英语的习惯和能力，多给自己把学过的英语用起来的机会和锻炼。当你说Cutitout时，意思是停止做或说令人讨厌或冒犯的事情。同时，To cut it out也可以表示停止做某事。学习英语应该是让

分类标签学英语Cutitout停止

12-01 16:26

CutMix&Mixup详解与代码实战

本文分享自华为云社区《CutMix&Mixup详解与代码实战-云社区-华为云》，作者：李长安。引言最近在回顾之前学到的知识，看到了数据增强部分，对于CutMix以及Mixup这两种数据增强方式发现理解不是很到位，所以这里写了一个项目再去好好看这两种数据增强方式。......（省略部分内容）.....

分类标签 CutMixMixup数据增强

12-01 16:25

Unit 4 Words and Expressions

Unit 4 Words and ExpressionsUnit 4 of the English textbook features various vocabulary words and expressions. These words and expressions are importan

分类标签 allowwrongmidnightguessdealgetonwithrelationcommunicationarguecloudelderinsteadwhatevernervousofferpropersecondlycommunicateexplainclearcopyreturnanymorememberpressurecompeteopinionskilltypicalfootballcutoutquickcontinue

12-01 16:24

关于理发的正确表达方式及cut的多重含义

正确表达请人理发的方式Jerry is going to the barber’s shop to have his hair cut. 因为理发是由别人（理发师）来理，故表达“请人理发”时，应用 have one’s hair cut。cut的多重含义1. cut in (on sb/sth) 打

分类标签理发表达方式cut含义

12-01 16:23

Adobe推出第二代FireFly绘图生成大模型，生图更易用更精美

Adobe推出第二代FireFly绘图生成大模型，生图更易用更精美北京时间10月11日凌晨，知名视觉设计工具大厂Adobe对外发布AdobeFirefly创意生成式AI模型系列中的三个主要新模型：AdobeFireflyImage2(萤火虫二代图片模型)、AdobeFireflyVectorMode

分类标签 AdobeFireFlyAI模型

11-24 02:14

治愈系风景：手机壁纸+屏保

治愈系风景：手机壁纸+屏保在忙碌的生活中，时常会感到疲惫和压力。这时，一张美丽的风景壁纸或屏保可以让我们心情愉悦，放松身心。本文介绍了一些治愈系风景的手机壁纸和屏保，希望能给大家带来一些舒适和愉悦。AI作品展示以下是一些AI绘画作品，它们都展现了美丽的风景，可以作为手机壁纸和屏保使用。治愈系风景：手

分类标签治愈系风景手机壁纸屏保

11-22 02:20

科大讯飞发布讯飞智能录音笔SR301青春版

科大讯飞发布讯飞智能录音笔SR301青春版9月10日，科大讯飞在北京正式发布讯飞智能录音笔SR301青春版新品。这款智能录音笔搭载了科大讯飞的AI语音转写引擎，具备语音秒转文字、中英文边录边译、重点标记、语音搜索、多平台同步等功能，售价999元。讯飞智能录音笔SR301青春版的转写引擎采用基于深度全

分类标签科大讯飞讯飞智能录音笔SR301青春版

11-11 22:14

科大讯飞AI大模型

科大讯飞AI大模型讯飞星火认知大模型是科大讯飞集团于2023年5月6日推出的新一代认知大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。2023年8月15日，讯飞星火认知大模型V2.0正式发布，7大核

分类标签科大讯飞AI大模型讯飞星火

11-11 22:13

如何用配音软件给视频配音？

如何用配音软件给视频配音？配音是一项有趣的工作，它可以让你在视频中扮演一个角色，为你的视频增添更多的生命力。但是，如果你没有接受过专业的配音训练，那么要给自己的视频配音就会变得有些困难。下面，我将为大家介绍三种用配音软件给视频配音的方法。方法一、使用“熊猫宝库”去配音熊猫宝库是一款声音特别真实的配音

分类标签配音软件视频配音熊猫宝库讯飞智作大漠传音

11-10 08:36