新知榜官方账号
2023-07-03 23:44:53
5月6日,科大讯飞星火认知大模型横空出世,在发布会上,科大讯飞董事长刘庆峰直言,“10月24日科大讯飞全球开发者大会期间,星火有望能够全面对标ChatGPT:在中文上要超越ChatGPT,在英文上要达到跟它相当的水平”。
胜马财经了解到,自ChatGPT火爆出圈后,科技领域号称对标ChatGPT的大模型比比皆是,声称“国内首发”的企业更是不少,但一阵热度过后,很多大模型随之落入沉寂。那么,科大讯飞寄予厚望的星火模型成色如何?星火大模型的发布,能否带领业绩下滑的公司打一场翻身仗呢?
6月14日,星火认知大模型的手机版本正式上线,IOS和安卓版本也均已公开,对此,胜马财经也通过其小程序进行了内测。在助手中心,星火模型的应用场景还算丰富,其包含了职场、生活、出行、写作等用户高频场景,每个场景下又细分出十几个到几十个不同的功能。在测试中,对于一些常见的逻辑问题,例如,“小明的妈妈有三个儿子,其中大儿子叫大宝,二儿子叫二宝,那第三个儿子叫什么”等问题可以准确应答。对于一些常识问题,如氨基酸的分类等也可以做出相对准确的回答。考虑到科大讯飞自身的业务多集中在教育领域,所以胜马财经将难度加大,选取了两道基础的高考语文和数学题目,而这时,星火大模型却没法应付自如了。注:上述数学题未给出准确答案几项测试综合下来,星火认知大模型的能力底子还不错,作为职场人的助手尚可,但要达到ChatGPT4.0的智能程度似乎还有较长距离。
在对于星火认知大模型的诸多评价中,胜马财经发现,中文通用大模型综合性评测基准SuperCLUE发布的总榜单显示,目前GPT-4综合能力排名第一,星火认知大模型则排名第四,总分分别为76.67分和53.58分;百度的文心一言则为32.61分,国内复旦大学自然语言处理实验室发布的国内第一个对话式大模型MOSS得分为36.52分。从榜单得分上看,星火大模型已经远远甩开其他国产大模型。
从测试上看,星火大模型初期版本具备一定的能力,但大模型不仅需要前期白花花的银子投进去,后续的不断升级,保持一定算力水准,需要不断持续的投入。根据英伟达的研究,GPT3最大规模的模型需要使用到175Billions的参数量,需要使用512颗V100显卡训练7个月时间,或者使用1024颗A100芯片训练长达一个月的时间。每月大模型训练成本在数百万美元以上量级。此前,华为云人工智能领域首席科学家田奇在演讲中也提到,大模型开发和训练的单次费用高达1200万美元。目前,市面上已推出或即将推出的大模型产品的公司有百度文心一言、阿里通义千问、华为盘古、商汤日日新、昆仑万维天工等。但相对于华为、腾讯和百度这些大厂而言,科大讯飞在数据和算力上并不占优势。以公司的营收和利润体量,在资金上也不占优势,未来的竞争压力可想而知。
根据财报,2022年,科大讯飞实现营收188.2亿元,同比仅增长2.77%;归母净利润5.61亿元,同比下滑63.94%,这是近五年来科大讯飞净利润的首次下滑。今年开始,科大讯飞的业绩下滑仍在持续,一季报数据显示,科大讯飞实现营业收入28.88亿元,同比下降17.64%;净利润亏损5790万元,同比下降152.25%,扣非后归母净亏损3.38亿元,去年同期为1.46亿元。因此,未来,科大讯飞围绕星火认知大模型建立的庞大业务体系未来能否运转起来,要打个问号,而眼下最紧急的,是科大讯飞还有多少财力能够支撑星火大模型的后续研发、升级。
科大讯飞发布了星火认知大模型,能否带领业绩下滑的公司翻身?本文对该模型进行了测试和评价。在资本市场上,科大讯飞的股价一度受到炒作,但公司的真实业绩水准能否支撑如今的高估值,还需要理性看待。
相关工具
相关文章
推荐
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03
我发现了一款国产AI绘画神器,免费易上手!
2024-07-25 16:40
7位AI考生做今年高考题,能过一本线吗?
2024-07-19 17:17
世界上第一所AI学校来了,80亿人只需要1位老师?
2024-07-18 17:12
Sora首部AI广告片上线,广告从业者危险了!
2024-06-27 13:44
OpenAI与中国说拜拜,国产AI如何接棒?
2024-06-26 15:18
人与AI会产生爱情吗,专家发话了!
2024-06-17 17:28