AI正在污染整个互联网，如何应对？

新知榜官方账号

2023-10-16 20:08:51

AI正在污染整个互联网，如何应对？

随着生成式人工智能的爆发，一个可怕的现象出现：AI正在污染整个互联网。知乎成为生成无脑答案的重灾区，这些内容描述简短、概括性十足，细看逻辑混乱、错误百出。打开今日头条，用ChatGPT生成的虚假新闻，内容耸人听闻，足够博人眼球。

AI加持下，虚假、无意义、同质化的内容呈指数级增长，获得大量曝光。莱斯大学和斯坦福大学的科学家研究发现，这些低质、同质化、未经证实的“AI语言”如果不加以甄别，进一步被抓取作为训练AI的语料，AI大模型将会走向崩溃。

AIGC“垃圾”泛滥内容平台成重灾区生成式AI越来越低成本化，伴生而来的是AI生成信息的“垃圾网站”。外媒NewsGuard发布相关数据报告称,目前已经追踪到了大约277个且还在不断增加的“垃圾网站”，这些网站生产了大量标题诱饵以优化广告收入。类似的情况也发生在国内，表现形式是AI生成的低质内容。

“中文互联网高质量的问答社区和创作者聚集的原创内容平台”知乎，如今成了AI无脑答案的重灾区，不少答主的内容呈现明显的“GPT风”，机器翻译的文字感、混乱的逻辑扑面而来，有时还会出现事实错误，特别是在金融、医学等专业领域，没有经验的人群很容易被误导。知乎上的“片儿汤话”答案有知乎用户使用AI每隔一两分钟就可以输出一条几百字的回答。尽管已经被禁言，但其产生的错误信息依然遗留在互联网中。如果你足够细心，你会发现，自带AI问答功能的搜索引擎Bing在中文世界经常会引用知乎的内容。一些生成后就从未过人工核查的错误答案被BingAI抓取，造成低质的中文信息蔓延。

AI对互联网内容的侵蚀不仅限于文字。在小红书、淘宝、抖音上，越来越多的“AI真人美女”的图片和视频被批量生产，还有大批“AI摄影”类账号的出现。“AI美女”造就新一代网红脸AI魔法棒一挥，制作成本低、效率高的“AI美女”一时间成为电商眼中的香饽饽，AI模特、AI主播频频出现。

“她们”足够吸睛，但也千篇一律，“网红脸”的队伍里又增加一类AI面孔。如果只是用AIGC制造美图供人评鉴、学习倒也还好，但AI生图工具产生的内容开始侵犯直接与人们生活相关的领域。淘宝上，有商家直接用AI生成图来取代商品实物图，一张由Midjourney生成的卡通少女图，被商家打上“绿色衬衫”的标签，售价218元。与之风格相似甚至完全相同的AI生成图，在网上随手就可以找到。利用Midjourney的垫图功能，任何人都可以自己生成无数仿照图，与卖家秀相差甚远的买家秀将再添槽点。

淘宝商家用AIGC网图（右）描述商品在中文互联网，AI大有无孔不入之势，专门教人如何用“AI写文赚钱”的课程层出不穷，卖课人号称“一套教学视频跟万能模板，直接套用”。AI话题营造出的失业焦虑中，该类课程受到追捧，曾有人通过卖课月入百万。如今，学会了使用AI工具的人，将AI生成的内容上传到知乎、今日头条或者小红书上，吸引了流量，但也制造了不少低质量、同质化甚至信息虚假的内容垃圾。

那么，这种AIGC内容“垃圾”会产生危害吗？靠AI识别真假技术还不行泛滥的AIGC内容加速污染互联网环境，除了影响人类获取有效信息的效率外，产出它们的工具“大语言模型”也会走向崩溃的边缘。莱斯大学和斯坦福大学的科学家研究证明，将人工智能生成的内容输入人工智能模型，会导致输出质量下跌。研究人员将这一现象解释为“模型自噬障碍”（MAD），即如果AI只学习其他AI生成的内容，在经过几代训练后，AI将输出无意义的垃圾信息，最终走向“模型崩溃”这一结果。研究人员表示，对于大语言模型而言，“数据清洁”十分重要。“世界正在奔向一个未来：生成式AI的爆发，导致了互联网上的合成数据很快就会超过真实数据。”按照研究者的说法，区分合成数据与真实数据，无论对人类本身还是大模型发展都变得势在必行。

最近，中国首个AIGC监管文件《生成式人工智能服务管理暂行办法》落地，该《办法》明确指出AIGC服务提供者要“增强训练数据的真实性、准确性、客观性和多样性”。生成式人工智能服务者有义务保证数据质量在《办法》的指导下，国内的内容平台也推出针对AI生成内容的管理措施，知乎、抖音、小红书等平台均已发布有关AIGC内容的规定。《抖音关于人工智能生成内容的平台规范暨行业倡议》称，针对人工智能生成的视频、图片和衍生的虚拟人直播，发布者应对人工智能生成内容进行显著标识，帮助其他用户区分虚拟与现实，特别是易混淆场景。该《倡议》提到，平台提供统一的人工智能生成内容标识能力，帮助创作者打标，方便用户区分。同时，平台提供用户反馈渠道，方便用户反馈违规的生成内容。知乎也发布了《关于应用AIGC能力进行辅助创作的社区公告》，公告显示，如果创作者发布AIGC生成的内容时，没有主动使用“包含AI辅助创作”的标签进行声明，平台会添加相关标识并限流，同时鼓励知友对利用AIGC技术，扰乱社区秩序的内容和账号进行举报，举报类型里新增了“AI生成内容”的选项。

规则出现了，但在实操中出现了Bug。知乎用户反馈原创内容被误判为AI生成知乎创作者们对平台“打标签”（审核）的能力表示质疑。有用户反馈，自己原创的内容被当成了AI创作打了AI标记，甚至有人因此被禁言。这种“误判”现象背后又隐藏了一个细思极恐的问题。假如平台采用机器来识别AI，机器对同类的“宽容度”或许会很高，让计算机还无法精准识别出AI犯的错误。最近，OpenAI推出的AI文本识别工具AI-Text-Classifier就因准确率太低而被官方下架。DetectGPT、GPTZero等AI生成检测工具的失误率也都高得惊人。随着AIGC技术不断迭代升级，AI生成内容将越来越具备迷惑性，想通过AI识别工具遏制AI内容垃圾的滋生，从技术成果上看成功率还不高。

看来，在充满人工智能的未来，“人工”有多强大，“智能”才有多强大。在AIGC的巨大冲击下，如何不被内容垃圾裹挟、实现人工与智能的良性共进将成为AI下一阶段发展的重要挑战。

本页网址：https://www.xinzhibang.net/article_detail-16958.html

寻求报道，请

关键词

分享至微信：

相关工具

原创度和AI内容检测

Writecream AI Content Detector

Writecream推出的AI内容检测工具

AISEO AI Content Detector

AISEO推出的AI内容检测器

StudyCorgi ChatGPT Detector

StudyCorgi推出的帮助学生检测ChatGPT的工具

GPTZero

超过百万人都在用的免费AI内容检测工具

CheckforAI

免费在线检测AI内容

AI写作技术的兴起与挑战

AI写作技术的兴起与挑战随着人工智能技术的发展，AI写作技术逐渐成为热门话题。越来越多的人开始使用AI助手来辅助写作，提高效率和质量。但是，我们是否可以完全相信AI写作的结果呢？AI写作的优势AI写作具有快速、准确和高效的特点。它可以帮助人们节省大量时间和精力，在短时间内生成大量高质量的文字内容。同

分类标签 AI写作技术人工智能真实性

11-16 22:32

GLTR和GROVER：如何辨别AI生成的假新闻和假评论？

GLTR和GROVER：如何辨别AI生成的假新闻和假评论？解铃还须系铃人。这句话的意思是谁引起了麻烦，那么就由谁去解决。而如今，这句话用在麻省理工学院的AI查文工具GLTR（巨型语言模拟器）上似乎也同样合适。GLTR是一款由麻省理工学院和哈佛大学IBM沃森人工智能实验室的人工智能文本识别工具。这款工

分类标签 GLTRGROVERAI假新闻假评论文本识别工具

11-11 10:11

异常检测-AI在海量观测数据中发现未知或罕见的天文现象实现异常检测

异常检测-AI在海量观测数据中发现未知或罕见的天文现象实现异常检测天文学一直是科学研究的前沿领域，而AI技术正以前所未有的方式改变着我们对宇宙的认知。AI技术在天文观测中的应用，随着天文观测设备的不断升级和改进，我们现在能够收集到大量的天文数据，然而处理这些庞大的数据集并及时发现，罕见或未知的天文现

分类标签异常检测人工智能天文观测

11-03 12:17

全网通AI营销系统：让人工智能成为网络营销的利器

全网通AI营销系统：让人工智能成为网络营销的利器人工智能（AI）作为当今科技界最大的风口，在过去一年掀起了一股前所未有的热潮，它将会改变每一个行业。随着人工智能技术的越趋成熟，越来越多的企业将人工智能技术应用于营销当中，使得内容和营销的结合更加紧密精准有效。人工智能的出现对每一个企业来说，既是挑战也

分类标签人工智能网络营销全网通AI营销系统

10-24 02:52

未来SEO的发展趋势及其对于企业的影响

一、自然语言处理将成为SEO的重点随着人工智能技术的不断发展，自然语言处理将成为SEO的重点。未来，搜索引擎将更加“聪明”，可以识别口语化的查询，这意味着SEO专家需要更加注重针对自然语言查询的优化。对于企业来说，他们需要改变以往的SEO优化策略，更加注重网站内容的呈现，将网站优化得更好的匹配自然语

分类标签人工智能自然语言处理语义搜索视频搜索图片搜索

10-24 02:50

SEO与AI变现

SEO与AI变现通过人工智能生成的文字、图片和视频，可以实现自动化的发布和变现，是一种非常好的方向。人工智能现在最擅长的就是生产文字、图片和视频。而互联网上自媒体平台非常火爆，通过机器生成的内容可以实现海量的批量发布，从而获取流量。虽然这些内容质量并不是非常高，但是效率却非常高。如果一个人去做一个9

分类标签 SEOAI变现

10-24 02:48

伪原创的三种方法及优化技巧

伪原创的三种方法及优化技巧现在的互联网，可以说竞争无处不在，尤其是SEO优化是一个非常火热的行业，竞争更加激烈。是原创seo的重要组成部分。但是作为一个网站的站长，很难做到原创，所以需要通过伪原创来编辑更新内容。伪原创的方法有很多，常见的有以下三种:标题组合法。组合法就是把上面总结的三种方法或者两种

分类标签伪原创SEO优化文章更新

10-24 02:46

ChatGPT对学术写作的影响及教学应对

ChatGPT对学术写作的影响及教学应对本文探讨了ChatGPT对学术写作的影响及教学应对，并介绍了GPT-4的写作能力和其局限性。同时，文章也提出了教师应如何引导学生在人工智能时代下进行学术写作，以及如何培养学生的写作能力。ChatGPT对学术写作的影响ChatGPT的出现对学术写作产生了巨大的影

分类标签 ChatGPT学术写作人工智能

10-16 20:10

巴黎政治学院禁用ChatGPT：AI生成内容的伦理和法律问题引发广泛讨论

背景法国顶尖学府之一的巴黎政治学院宣布禁用ChatGPT，对使用该软件的处罚可能会严重到被学校开除，甚至被整个法国高等教育开除。多所美国中学及大学陆续宣布校内禁用ChatGPT，并通过减少课后作业的方式，避免学生利用家庭网络访问ChatGPT作弊。AI生成内容的伦理和法律问题，正在引发社会各界的广泛

分类标签 ChatGPTAI生成内容伦理问题法律问题

10-16 20:04

OpenAI发布的ChatGPT：第一个达到大规模普及的生成型AI工具

2022年11月30日，OpenAI发布了一款名为ChatGPT的AI聊天机器人，立即引起了全球的轰动。它是基于OpenAI的GPT-3.5和GPT-4基础大型语言模型（LLMs）构建的，并且使用了监督学习和强化学习等转移学习技术进行了微调。ChatGPT是第一个达到大规模普及的生成型AI工具，让全

分类标签 OpenAIChatGPTAI工具

10-07 18:12

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway