普通高中教师打造40亿美元独角兽的背后

新知榜官方账号

2023-07-03 10:26:41

普通高中教师打造40亿美元独角兽的背后

舒曼是一位普普通通的高中教师，却创立了LAION数据集，成为生成式AI的浪潮推动者。他在德国汉堡市的高中教物理和计算机科学，两年前他创立了LAION，如今被用于各种生成模型，包括谷歌Imagen、Parti，以及惊艳全球的StableDiffusion。本文讲述他的故事。

创造LAION

OpenAI发表了背后关键模型CLIP的论文，CLIP在4亿个图像-文本对上进行了预训练。由此可见数据集对于CLIP的重要性，但OpenAI并没有进行公开，它只开源了CLIP的代码和模型权重。舒曼就开始在Discord网罗了一群同为AI爱好者的朋友，尝试复制OpenAI同等水平的「文本-图像对」数据集。没想到这一搞就搞了大半年，直到2021年8月他们首次发布了LAION-400M数据集，里面包含了4.13亿图像-文本对。他们用一个非盈利组织CommonCrawl在2014年到2021年期间，抓取的随机HTML代码来定位网络上的图像，并将这些图像与描述性文本联系起来，最后还得根据一定规则来过滤掉不适合的样本。几周之内，他们就拥有了300万对图文对。

LAION的反响

LAION数据集发布之后就收到了各种反响，被用于诸多论文和实验。其中最具代表性的，就是GoogleBrain去年（2022）发布的Imagen——文本生成图像的扩散模型。与此同时，更多机构开始关注到这个非盈利组织并给予资金支持。2021年他们就收到了HuggingFace的一次性捐赠。但印象最深的一次，还要属一个对冲基金经理来到Discord聊天室。当时他二话不说直接送钱，大概意思是：我给你们支付算力费用，没有任何附加条件。如今StabilityAI正在寻求40亿美元（折合276亿元）估值，这主要归功于LAION提供的数据。据彭博社消息，舒曼却并没有从LAION中获利，原因很简单：不感兴趣，希望保持这份工作的独立性。

LAION的争议

LAION被迫卷入两场诉讼之中，一起是StabilityAI与Midjourney等集体诉讼，被指使用艺术家的版权图片来训练他们的模型；另一起是GettyImages起诉StabilityAI，称其1200万张照片被LAION取走，并用来训练StableDiffusion。而舒曼将LAION比作大信息技术海啸之上一艘“小型研究船”，采取海下的样本向世界展示。其实早在构建数据库时，他们就在运行一个自动化过滤工具，不过舒曼感兴趣的不是清理，而是从这些资产中学习。我们本可以从公布的数据中过滤掉暴力，但我们决定不这样做，因为这将加快暴力检测软件的开发。但在舒曼看来，数据集不应该被监控。

本页网址：https://www.xinzhibang.net/article_detail-4854.html

寻求报道，请

关键词

分享至微信：

相关工具

Booltool

在线AI图像工具箱

创客贴AI画匠

创客贴推出的AI艺术画生成工具

remove.bg

强大的AI背景移除工具

标小智Logo生成

人工智能AI生成Logo设计工具

美图AI文生图

美图推出的AI文本生成图片的工具

Craiyon

免费在线文本到图像生成

11月科技投资：AI领域融资超5亿，VRAR领域融资近2亿，第三代半导体和钠离子电池也有动静

11月科技投资：AI领域融资超5亿，VRAR领域融资近2亿，第三代半导体和钠离子电池也有动静11月，科技领域发生了多笔重大融资，其中包括AI、VRAR、第三代半导体和钠离子电池等领域。本文将对这些领域的融资情况进行介绍，并提供相应的投资策略和风险提示。AI领域11月，德国AlephAlphaGmbH

分类标签 AI领域VRAR领域第三代半导体钠离子电池投资策略风险提示

12-09 16:02

百度文心大模型3.5超越ChatGPT3.5，未来国内只有少量大模型

近日，IDC发布AI大模型技术能力评估报告显示，百度文心大模型3.5拿下12项指标的7个满分，综合评分第一。在面向新浪科技等媒体沟通中，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜指出，新版本文心一言3.5已超越ChatGPT3.5，未来国内将只会有少量大模型。吴甜指出，大模型的终

分类标签百度文心大模型ChatGPT3.5大模型产业化

12-04 02:50

百度文心一言的起源、意义和技术原理

百度文心一言的起源百度文心一言最初是由百度公司推出的一种短语句生成工具，旨在为用户提供有趣、富有启示性的语句。每个一言都包含了深刻的思想和有趣的灵感，有时会通过幽默和巧妙的比喻来传达某些概念和情感。随着时间的推移，百度文心一言已经成为了一种文化现象，在中国的网络社区中广泛使用。百度文心一言的意义百度

分类标签百度文心一言起源意义技术原理

12-04 02:49

ChatGPT：AI已具备人类智能？

2022年12月，人工智能聊天机器人ChatGPT刷爆网络，网友们争先恐后去领略它的超高情商和巨大威力。参加高考、修改代码、构思小说......它在广大网友的“鞭策”下不断突破自我，甚至可以用一整段程序，为你拼接出一只小狗。那么，ChatGPT是如何炼成的？是否意味着AI已具有人类智能呢？ChatG

分类标签 ChatGPT人工智能自然语言生成

12-02 22:01

ChatGPT：从GPT-2到GPT-4，AI技术的边界不断扩展

ChatGPT：从GPT-2到GPT-4，AI技术的边界不断扩展ChatGPT作为一款革命性的人工智能产品，其成长历程是技术创新和社会影响力相结合的典范。自从OpenAI于2019年推出GPT-2以来，ChatGPT的发展经历了几个关键阶段，每一步都在推动着AI技术的边界。初创时期：GPT-2的问世

分类标签 ChatGPTGPT-2GPT-3

11-25 08:12

StabilityAI发布基于StableDiffusion的视频生成模型StableVideoDiffusion

StabilityAI发布基于StableDiffusion的视频生成模型StableVideoDiffusionStabilityAI发布了基于StableDiffusion的视频生成模型StableVideoDiffusion，可以根据静态图像生成几秒钟的视频，已经超越了用户偏好研究中领先的闭源

分类标签 StabilityAI视频生成模型StableVideoDiffusion

11-24 06:06

人工智能思维与人类思维的本质区别

人工智能思维与人类思维的本质区别一篇新论文认为，从ChatGPT等系统中看到的人工智能，由于缺乏体现和理解，与人类智能有着本质区别。加州大学的安东尼-切梅罗（AnthonyChemero）最近发表了一篇论文，解释了与人类思维相对的人工智能思维。人工智能的兴起引起了技术高管、政府官员和普通大众的不同反

分类标签人工智能人类智能LLMs

11-23 02:04

ChatGPT 4.0升级，更聪明、更高效、更亲切

ChatGPT 4.0升级，更聪明、更高效、更亲切大家有没有觉得，现在的手机助手越来越智能，可以回答我们各种问题，提供各种服务？这是因为人工智能技术不断发展，推出了更厉害的新版本。最近，一款名叫ChatGPT的人工智能助手就升级到了4.0版本，让我们一起来看看它有哪些新变化吧！ChatGPT 4.0

分类标签 ChatGPT人工智能助手4.0版本

11-23 02:03

ChatGPT之父山姆·阿尔特曼回归OpenAI担任首席执行官

ChatGPT之父山姆·阿尔特曼回归OpenAI担任首席执行官经过5天的反转再反转，“ChatGPT之父”山姆·阿尔特曼将回归OpenAI，担任首席执行官一职。就在几分钟前，OpenAI官方在社交平台上表示：“我们已在原则上达成协议，让SamAltman重返OpenAI担任首席执行官，并组建由Bre

分类标签 OpenAI山姆·阿尔特曼人工智能

11-23 02:02

OpenAI创始人辞职引发科技行业动荡

OpenAI创始人辞职引发科技行业动荡据路透社20日援引科技媒体“TheInformation”报道，美国人工智能公司OpenAI董事会成员伊尔亚·苏茨克维当天在给公司员工的一份声明中称，OpenAI创始人山姆·奥特曼将不会重新担任公司首席执行官（CEO），视频流媒体网站Twitch的联合创始人埃米

分类标签 OpenAI人工智能CEO

11-21 02:01