新知榜官方账号
2023-09-03 22:38:54
最近,家里老人给我转了一篇文章,向我求证:打开一看,就知道显然是假新闻,因为最近以来根本有没有这样的涨价。但是网上搜一下,这样标题的文章很多,都是来自于一些形形色色的自媒体,无非是把标题中的日期,不断地修改,从7月改到8月,反复发。估计今天又要改一篇“2023年9月3日水、电、天然气全面涨价,涨幅空前高涨”。
百度搜索结果:重灾区是百度百家号、今日头条等,相比之下,微信公众号上也有,但是少得多:文章又都很有特点:标题很惊人、吸引流量,点击量和评论数都很高;内容非常格式化:先说新闻,然后几百上千字谈影响,煞有其事,义正言辞。有意思的是,每一篇都不尽相同,但是又非常类似。最后的评论里面,老百姓不管真假,都大发议论,活不下去啦、民生艰难等等。
没有多少人去求证,大家用它来发泄情绪。平台、自媒体赚了流量,读者消费了情绪,大家各取所需。这就是最近所谓的:“事实摆在一边”。
但是我在看这种文章的时候,总是有种似曾相识的感觉,为什么呢?我用GPT调试了一下,发现:这种文章,很大概率是用ChatGPT这种工具生成的。讨论的风格,非常一致。不能说是“完全一样”,基本可以说:就是一个模子里做出来的。这就是所谓的“内容农场”:内容农场,英文名称为“contentfarm”,通常是指专门使用软件进行制作大量的垃圾内容获取用户点击。于是,网友搜索引擎就容易找得到。
内容农场的核心是“发布各种写作话题”,这个环节不是拍脑袋的。根据自行发明的一套算法,来评估两样东西:其一,什么是当前网络话题热点;其二,什么样的关键字更容易带来高广告收入。这两样东西,说白了,就是这个“按需媒体”的两个需。百度百科这种模式由来已久,只是现在更简单了,这些媒体只需要想出一个耸人听闻、吸引流量的标题,然后输入到ChatGPT这样的AI工具里面,利用大语言模型的“幻觉”效应(就是可以围绕用户输入的信息生成事实上不真实的内容),快速地生成大量的文章、内容、帖子。。在包括百家号、公众号、小红书、抖音在内的各种平台上发放。
怎么去避免这样的问题?事实上没有太好的办法,之前虽然有各种所谓的AI内容识别工具,但是不久就纷纷下线,因为实践证明识别准确率很低,尤其是对于文字内容。著名的例子是,检测工具GPTZero把美国宪法和圣经,也识别为AI生成的内容。对于图片、视频、音频的话,最近有一些数字水印的技术开始出现,可以起到一定的作用,也已经出现相关的安全要求。
对于我们个人来说,如何防止被这种批量生成的、粗制滥造的新闻所误导,我想可以注意以下这几点:
长期而言,我们可能会发现:越来越多的优质内容都会被隐藏在特定平台或者“付费墙”(即需要付费才能查看),而免费、公开可以看到的媒体平台,则会充斥各种内容农场或者AI大模型所生成的垃圾内容。“有用的互联网”(usefulInternet)时代,正在终结。互联网重新回到了各种信息孤岛互相隔离、收费访问的时代。
当然这还会带来另外一个问题:我们都知道,AI大语言模型是用数据样本训练的,其中大部分是互联网的网页。一旦各种网页都是AI自己生成的垃圾内容,那么就会出现所谓的“垃圾进、垃圾出”(garbagein,garbageout),大语言模型的输出质量也会螺旋式下降。
总体而言,科技进步,总是会带来各种各样的“附带伤害”。如何识别、克服这些问题,将考验我们的智慧。
相关工具
相关文章
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16