大模型:落地与挑战

新知榜官方账号

2023-08-29 01:29:00

大模型的火热与降温

自今年3月ChatGPT爆火之后,国内起了一股“备战”大模型之风,各大厂纷纷重金押注:百度推出“文心一言”、华为“盘古”席卷行业、阿里“通义千问”落地办公领域……大模型的火热程度,似乎为唱衰许久“大厂流量见顶”的阴霾照进了一丝光明。与此同时,全球大模型独角兽企业“疯狂吸金”,短短半年内,由前OpenAI领导人创立的人工智能企业Anthropic就连获三轮大额融资,总额超8.5亿美元。

但进入下半年,行业开始逐渐降温。盈利点不清晰,许多创业项目还停留在概念验证阶段,初创企业融资越来越难。马太效应正在加剧,创业公司突围艰难。对于初创企业来说,“落地”成了重中之中。谁能推出重磅应用,或能率先杀出重围。

大模型是一种什么技术?

大模型,即大语言模型,是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。简单来说,大模型能够模拟人类学习语言的过程,以类似人类的方式理解和生成文本,是通向人工智能的重要途径。

大厂的“必争之地”

打响第一枪的是百度“文心一言”——这是百度在2021年12月推出的百度·文心(ERNIE3.0Titan)迭代而来的细分模型,百度创始人李彦宏称将用其重构百度所有的应用。随后,阿里云推出通义千问大语言模型,迎战文心一言。阿里云的强大算力和巨量数据正是研发大模型优势所在,而通义千问也不负众望地实现了众多功能:多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能,融入了多模态的知识理解,能够续写小说,编写邮件等。

大模型的落地应用

大模型离不开云厂商。国内迭代最快的大模型公司,如百度、阿里都有自己的云业务。大模型创业的生态分为四层——芯片层、框架层、模型层、应用层。其中芯片层+框架层是基础设施,企业的进入门槛最高;模型层对算力、算法、数据、人才的要求非常高;应用层是基于前两类大模型,调用API开发应用。所有的玩家都要在这四大层级里站位,纵向覆盖的层级越多,竞争壁垒越深厚。

未来的多模态大模型

未来,大模型一定会走向多模态,形成具备图像、视频、语音、语义综合感知能力的智能体。例如,AI大模型能接入机器人,提升机器人的语言能力、视觉能力、运动控制能力,还有虚拟仿真能力。Meta公司在今年7月发布了开源可商用大模型LLaMA2,包含了70亿、130亿和700亿参数3个版本。

本页网址:https://www.xinzhibang.net/article_detail-10502.html

寻求报道,请 点击这里 微信扫码咨询

关键词

大模型 人工智能 落地 行业应用 算力

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯