开源大型语言模型列表

新知榜官方账号

2023-08-26 02:19:26

开源大型语言模型列表

大型语言模型(llm)是一种人工智能(AI)，在大量文本和代码数据集上进行训练。它们可以用于各种任务，包括生成文本、翻译语言和编写不同类型的创意内容。今年开始，人们对开源LLM越来越感兴趣。这些模型是在开源许可下发布的，这意味着任何人都可以使用、修改和分发它们。这使得研究人员、开发人员和企业都可以尝试LLM，并为它们开发新的应用程序。

使用开源llm有很多好处。首先它们通常比专业的LLM更价便宜。并且它们更加透明，这意味着研究人员可以研究它们是如何工作的以及它们是如何做出决定的。最主要的是它们更加灵活，可以针对不同的任务进行定制。

本文总结了当前可用的开源llm的全部（几乎全部）列表，以及有关其许可选项和源代码存储库的信息，希望对你有所帮助。

SAIL7B基于LLaMa的搜索增强

参数：7B
许可类型：GPL-3.0
发布日期：2023年5月
论文：SAIL—SearchAugmentedInstructionLearning

Guanaco采用高效微调方法QLoRA发布的LLM模型

参数：65B
许可类型：MIT
发布日期：2023年5月
论文：QLoRA—EfficientFinetuningofQuantizedLLMs

RNN模型RMKV与transformer的LLM性能相当

参数：100M–14B
许可类型：Apache2.0
发布日期：2023年5月
论文：ScalingRNNto1.5BandReachTransformerLMPerformance

MosaicML的基础系列模型

参数：7B
许可类型：Apache2.0
发布日期：2023年5月
论文：MPT-7B—ANewStandardforOpen-Source,CommerciallyUsableLLMs

OpenLLaMa在RedPajama数据集上训练的MetaAI的LLaMA7B的另一个开源复制。

参数：3,7B
许可类型：Apache2.0
发布日期：2023年5月
论文：MeetOpenLLaMA—AnOpen-SourceReproductionofMetaAI’sLLaMALargeLanguageModel

Pythia模型基于RedPajama数据集上训练的指令调整和聊天

参数：3B,7B
许可类型：Apache2.0
发布日期：2023年5月
论文：RedPajama-INCITEfamilyofmodelsincludingbase,instruction-tuned&chatmodels

H2O的微调框架和文档问答功能的聊天机器人

参数：12B,30B
许可类型：Apache2.0
发布日期：2023年5月
论文：BuildingtheWorld’sBestOpen-SourceLargeLanguageModel:H2O.ai’sJourney

FastChat-T5通过微调Flan-t5-xl对从ShareGPT收集的用户共享对话进行训练的聊天机器人

参数：3B
许可类型：Apache2.0
发布日期：2023年4月
论文：FastChat-T5—ourcompactandcommercial-friendlychatbot!

GPT4All用于训练和部署强大的定制llm的完整工具系统

参数：7–13B
许可类型：MIT
发布日期：2023年4月
论文：GPT4All:Anecosystemofopen-sourceon-edgelargelanguagemodels.

MiniGPT-4基于BLIP-2和VicunaLLM的VisualLLM模型

参数：13B
许可类型：BSD-3-Clause
发布日期：2023年4月
论文：MiniGPT-4—EnhancingVision-LanguageUnderstandingwithAdvancedLargeLanguageModels

StableLM的LLM模型系列

参数：7B
许可类型：CCBY-NC-SA-4.0
发布日期：2023年4月
论文：StabilityAILaunchestheFirstofitsStableLMSuiteofLanguageModels

BloomZ通过多任务微调实现跨语言泛化

参数：176B
许可类型：Apache2.0
发布日期：2023年4月
论文：Cross-lingualGeneralizationthroughMultitaskFinetuning

DollyPythia12BLLM在DatabricksML平台上训练的模型

参数：12B
许可类型：Apache2.0
发布日期：2023年4月
论文：FreeDolly—IntroducingtheWorld’sFirstTrulyOpenInstruction-TunedLLM

BaizeChatbot基于LLaMa的开源聊天模型

参数：30B
许可类型：GPL-3.0license
发布日期：2023年4月
论文：Baize—AnOpen-SourceChatModelwithParameter-EfficientTuningonSelf-ChatData

ColossalChat由ColossalAI开源发布的一个完整的RLHF流程训练的模型

参数：N/A
许可类型：Apache2.0
发布日期：2023年4月
论文：ColossalChat—AnOpen-SourceSolutionforCloningChatGPTWithaCompleteRLHFPipeline

LitLLaMa来自LightningAI的LLaMA的开源实现

参数：13B
许可类型：Apache2.0
发布日期：2023年4月
论文：WhyWe’reBuildingLit-LLaMA

Cerebras-GPT开放的，计算效率高的，大型语言模型

参数：111M-13B
许可类型：Apache2.0
发布日期：2023年3月
论文：Cerebras-GPT—OpenCompute-OptimalLanguageModelsTrainedontheCerebrasWafer-ScaleCluster

OpenFlamingoDeepmind的Flamingo模型的开源实现

参数：9B
许可类型：MITLicense
发布日期：2023年3月
论文：Openflamingo—AnOpen-sourceFrameworkForTrainingVision-languageModelsWithIn-contextLearning

ChatGLM使用开放式双语(中英文)双向密集预训练模型

参数：6B-130B
许可类型：Apache2.0
发布日期：2023年3月
论文：GLM-130B:AnOpenBilingualPre-trainedModel

DLite通过微调Alpaca数据集上最小的GPT-2模型

参数：124M
许可类型：Apache2.0
发布日期：2023年3月
论文：IntroducingDLite,aLightweightChatGPT-LikeModelBasedonDollyAlpaca7B

斯坦福大学发布的指令遵循LLaMA模型

参数：7B
许可类型：Apache2.0
发布日期：2023年3月
论文：Alpaca—AStrong,ReplicableInstruction-FollowingModel

FlanUL2在预训练的UL2检查点上训练Flan20B模型。

参数：20B
许可类型：MITLicense
发布日期：2023年3月
论文：ANewOpenSourceFlan20BwithUL2

T5在各种数据集上的指令微调，提高预训练语言模型的可用性

参数：60M–11B
许可类型：Apache2.0
发布日期：2023年2月
论文：ScalingInstruction-FinetunedLanguageModels

FreeWilly2

最后再补充2个刚刚发布的模型，一个是llama-2，这个我们文章也在前几天介绍了微调和使用的方法。另外一个就是昨天刚看到的新闻，stabilityai发布的FreeWilly2，它是在Llama270B上微调的结果，目前在open_llm_leaderboard上排第一。

结论

开源大型语言模型正在迅速发展，开源社区发布了许多模型。这些模型为开发人员、研究人员和爱好者提供了一个非常大机会，可以在没有专有系统的情况下试验尖端的语言技术。随着越来越多的组织和个人为这些模型的发展做出贡献，我们可以期待看到更强大、更容易使用和更创新的语言模型，它们将塑造自然语言处理的未来。

本页网址：https://www.xinzhibang.net/article_detail-10398.html

寻求报道，请

关键词

分享至微信：

相关工具

Google Bard

Google推出的AI聊天对话机器人Bard

讯飞星火认知大模型

科大讯飞推出的类ChatGPT的讯飞星火认知大模型

Open Assistant

免费开源的对话式AI，GitHub星标超3万

商量SenseChat

商汤科技推出的类ChatGPT的人工智能大语言模型

Character.AI

创建虚拟角色并与其对话

Whispr

免费AI对话回应

WhatsApp即将推出人工智能聊天机器人

WhatsApp即将推出人工智能聊天机器人作为全球最广泛使用的即时通讯应用之一，WhatsApp正准备迎来一次重大更新——集成的人工智能（AI）聊天机器人。这一功能目前正处于Beta测试阶段，预示着用户交互体验的新纪元。AI聊天机器人的引入今年9月，Meta，WhatsApp的母公司，宣布将在其旗下

分类标签 WhatsApp人工智能聊天机器人

11-22 22:34

关于大语言模型的综述

概述本文简述了中国人民大学教授WayneXinZhao等人撰写的关于大语言模型的综述，包括LLMs在预训练、适应调整、应用和能力评估等方面的研究进展。现有大模型的总体情况概览文章总结了最近发布的大模型，并展示了它们的开源情况。黄色的部分是开源的模型，可以看到，Meta、Google开源的模型较多。而

分类标签大语言模型预训练适应调整应用

11-17 04:52

GPU成为大模型算力军备竞赛新焦点，国产GPU能否率先打破藩篱？

背景在生成式AI开创的黄金时代，GPU将犹如翱翔于浩渺天空的翅膀，赋予AI大模型行业强大的推进力。英伟达一骑绝尘，AMD紧随其后，英特尔虎视眈眈，而国产GPU厂商在经过AI的洗礼之后，加之国产替代紧迫的“引力”，不能更不应缺席这场“盛宴”。尽管高端芯片的突围实非易事，但国产GPU能否好风凭借力，率先

分类标签 GPU大模型算力军备竞赛国产GPU英伟达

10-23 03:54

Colossal-AI发布全新Llama2训练微调推理方案，训练速度提升195%

Colossal-AI发布全新Llama2训练微调推理方案，训练速度提升195%近期，全球最大的大模型开发工具与社区Colossal-AI发布了一项令人瞩目的消息：全新的Llama2训练、微调、推理方案，可将700亿参数模型的训练速度提升了整整195%。大型语言模型的崛起，特别是ChatGPT等模型

分类标签 Colossal-AILlama2大模型开发工具训练微调推理方案

10-23 03:50

AI大模型的机遇和挑战

AI大模型的机遇和挑战过去数年，AI模型的参数发生了极大变化。尤洋指出，从2016年至2021年1月，AI模型的参数量是每18个月增长40倍；从2018年1月到2021年1月，AI大语言模型的参数量每18个月增长340倍。而相形之下，2016年1月至2021年1月间，GPU的内存增长每18个月仅有

分类标签 AI模型大模型训练Colossal-AI

10-07 10:03

华为智能AI音箱使用心得

华为智能AI音箱使用心得本文是对华为智能AI音箱的使用心得分享，包括开箱、操作介绍、煲机、音质试听以及体验等方面。开箱华为智能AI音箱的外包装以白色为底色，字体、图标均为淡黑色，包装虽不豪华，却给人清新脱俗的感觉，抢眼的是华为标志的那一抹红色。盒子的正面是简单几笔勾勒出来音箱的外形，上方是产品的名称

分类标签华为智能AI音箱音箱评测智能家居

10-02 02:36

谷歌2018年度研究回顾

谷歌2018年度研究回顾...（省略部分内容）

分类标签谷歌研究院AI机器学习深度学习健康数据集

10-02 02:34

复合元音/ai/的发音和嘴型变化

复合元音/ai/的发音和嘴型变化复合元音/ai/是英语中常见的一个双元音，发音时需要嘴的形状从开始到结束都要有变化。这个音的发音方式是/ai/，和单词“eye”发音一样。一些包含这个音的单词有：price，high，try。如果您在学习英语发音时想要练习这个音，可以跟着以下步骤操作：注

分类标签复合元音双元音发音嘴型变化英语发音英语学习

10-02 02:32

CHATGPT中文版——一款免费的AI聊天机器人

CHATGPT中文版——一款免费的AI聊天机器人CHATGPT中文版是一款让人感到兴奋的聊天机器人，它由OpenAI开发，拥有强大的自然语言处理技术。它的任务是理解你的问题并给予回应，就像你和一个朋友聊天一样。这让我们可以问它关于任何事情的问题，从学术知识到日常生活的疑问，都能找到答案。CHATGP

分类标签 CHATGPT中文版聊天机器人

09-29 10:12

Colossal-AI成功复现ChatGPT，开源完整基于PyTorch的ChatGPT复现流程

背景... ChatGPT技术分析... 使用Colossal-AI低成本复现ChatGPT... 背后优化核心系统... 开放协作...

分类标签 Colossal-AIChatGPTPyTorchAI大模型复现

09-29 10:10

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway