新知榜官方账号
2023-09-16 00:25:14
在科技巨头忙着用大模型争夺AI时代话语权的当下,Meta携手微软、高通发布免费开源大模型无异于在行业投下重磅炸弹。
01巨头携手发布免费开源大模型脸书母公司Meta日前表示,将发布其开源大模型LLaMA的商用版本,为初创企业和其他企业提供了一个强大的免费选择,以取代OpenAI和谷歌出售的昂贵的专有模型。
Meta在一篇博客文章中表示,该模型的新版本名为Llama2,将由微软(Microsoft)通过其Azure云服务发布,并将在Windows操作系统上运行,并称微软是该版本的“首选合作伙伴”。根据Meta首席执行官扎克伯格(MarkZuckerberg)的博客文章和另一篇Facebook帖子,该模型以前只提供给研究目的的学者,现在也将通过直接下载和亚马逊网络服务、HuggingFace和其他提供商提供。
相较于今年2月发布的Llama1,训练所用的token翻了一倍至2万亿,同时对于使用大模型最重要的上下文长度限制,Llama2也翻了一倍。Llama2包含了70亿、130亿和700亿参数的模型。扎克伯格说,Llama1已经可以与OpenAI的ChatGPT和谷歌的Bard聊天机器人的模型竞争,而Llama2的训练数据比前一代多了40%,有超过100万的人类注释来微调其输出的质量。
02AI大模型激烈混战
2023年的科创圈“顶流”非大模型莫属。海外的OpenAI、微软、谷歌、Meta,国内市场百家齐放:百度、阿里、华为、腾讯、字节跳动等巨头厂商先后进行战略布局,陆续发布自己的大语言模型产品。除此之外,也有许多科技企业、人工智能企业积极试水整合大模型能力,提升自身产品功能。以生成式语言模型为代表的大模型发展,基本宣告了AI走上了一个重工业时代。最近几个月,国产大模型的内卷激烈程度可以用“神仙打架”来形容。仅7月,就有华为、阿里、腾讯、商汤、京东等企业发布或更新大模型。7月7日,华为云在开发者大会2023上发布盘古大模型3.0。华为常务董事、华为云CEO张平安表示,盘古大模型3.0是完全面向行业的大模型,包括“5+N+X”三层架构。张平安在会上表示,盘古大模型不会作诗,只做事,将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提供更好的服务。在同月举办的2023年世界人工智能大会上,阿里云正式推出AI绘画新品“通义万相”。基于阿里研发的组合式生成模型Composer,通义万相提出了基于扩散模型的「组合式生成」框架,通过对配色、布局、风格等图像设计元素进行拆解和组合,提供了高度可控性和极大自由度的图像生成效果。同样在世界人工智能大会期间,腾讯云宣布升级MaaS平台,将行业大模型能力应用到金融风控、同传翻译、数智人客服等新场景中;其中,首次公布的金融风控大模型,相比传统风控有10倍效率提升。此外,商汤、京东等等平台同样推出各自的大模型产品,AI大模型混战变得格外激烈。
03打破AI行业垄断
相对于以企业为核心的大模型生态闭环,Llama这样复杂的模型广泛地供企业免费使用,可能会颠覆OpenAI等公司在新生的人工智能软件市场上建立起来的早期主导地位。与此同时,Meta也与高通宣布,Llama2将能够在高通芯片上运行。这样一来,市场上英伟达、AMD处理器对AI产业的垄断也将被打破。软件开发平台Replit的首席执行官AmjadMasad表示:商业版Llama可能会改变这种局面。我们公司80%以上的项目都在使用OpenAI的模型。“开源模式的任何渐进式改进都在蚕食闭源模式的市场份额,因为你可以以更低的成本运行它们,而且依赖性更小,”他补充说。
04后发的Meta
相对于微软和谷歌,Meta在AI大模型领域多少有些姗姗来迟的感觉。今年一季度的时候,Meta才首次发布了自家的大语言模型LLaMA(LargeLanguageModelMetaAI)系列,包含70亿、130亿、330亿和650亿4个版本。当时Meta表示LLaMA拥有超高性能,使用130亿参数的LLaMA在规模仅为ChatGPT的十分之一的情况下,性能表现可以优于GPT-3。使用650亿参数的LLaMA则可以与DeepMind700亿参数的Chinchilla模型和谷歌5400亿参数的PaLM模型比肩。但2月版本的LLaMA并不是ChatGPT的直接竞争对手,LLaMA定位于“开源的研究工具”,所使用的是各类公开可用的数据集。它当时更多的着眼于研究领域,仅在非商业许可下提供给政府、社区和学术界的研究人员。值得注意的是,LLaMA发布后还出现了一个“泄露风波”,从而在业界推动了一波GPT平替风潮。虽然当时Meta称LLaMA是开源的,但研究人员仍然需要向Meta提出申请和审核。但就LLaMA发布不久后,其模型源代码的文件却在技术论坛上疯传,直接助推了包括斯坦福大学Alpaca、加州大学伯克利分校ColossalChat等基于LLaMA构建的语言模型和产品的出现。从这个角度看,“开源”更像是Meta的竞争策略,通过生态将潜在的客户与伙伴牢牢绑定在一起,进而以规模构筑自己的闭环,只是刚在元宇宙上“闪了腰”的Meta,真能支撑得起如此大的生态吗?
相关工具
相关文章
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16