新知榜官方账号
2023-09-03 22:38:54
最近,家里老人给我转了一篇文章,向我求证:打开一看,就知道显然是假新闻,因为最近以来根本有没有这样的涨价。但是网上搜一下,这样标题的文章很多,都是来自于一些形形色色的自媒体,无非是把标题中的日期,不断地修改,从7月改到8月,反复发。估计今天又要改一篇“2023年9月3日水、电、天然气全面涨价,涨幅空前高涨”。
百度搜索结果:重灾区是百度百家号、今日头条等,相比之下,微信公众号上也有,但是少得多:文章又都很有特点:标题很惊人、吸引流量,点击量和评论数都很高;内容非常格式化:先说新闻,然后几百上千字谈影响,煞有其事,义正言辞。有意思的是,每一篇都不尽相同,但是又非常类似。最后的评论里面,老百姓不管真假,都大发议论,活不下去啦、民生艰难等等。
没有多少人去求证,大家用它来发泄情绪。平台、自媒体赚了流量,读者消费了情绪,大家各取所需。这就是最近所谓的:“事实摆在一边”。
但是我在看这种文章的时候,总是有种似曾相识的感觉,为什么呢?我用GPT调试了一下,发现:这种文章,很大概率是用ChatGPT这种工具生成的。讨论的风格,非常一致。不能说是“完全一样”,基本可以说:就是一个模子里做出来的。这就是所谓的“内容农场”:内容农场,英文名称为“contentfarm”,通常是指专门使用软件进行制作大量的垃圾内容获取用户点击。于是,网友搜索引擎就容易找得到。
内容农场的核心是“发布各种写作话题”,这个环节不是拍脑袋的。根据自行发明的一套算法,来评估两样东西:其一,什么是当前网络话题热点;其二,什么样的关键字更容易带来高广告收入。这两样东西,说白了,就是这个“按需媒体”的两个需。百度百科这种模式由来已久,只是现在更简单了,这些媒体只需要想出一个耸人听闻、吸引流量的标题,然后输入到ChatGPT这样的AI工具里面,利用大语言模型的“幻觉”效应(就是可以围绕用户输入的信息生成事实上不真实的内容),快速地生成大量的文章、内容、帖子。。在包括百家号、公众号、小红书、抖音在内的各种平台上发放。
怎么去避免这样的问题?事实上没有太好的办法,之前虽然有各种所谓的AI内容识别工具,但是不久就纷纷下线,因为实践证明识别准确率很低,尤其是对于文字内容。著名的例子是,检测工具GPTZero把美国宪法和圣经,也识别为AI生成的内容。对于图片、视频、音频的话,最近有一些数字水印的技术开始出现,可以起到一定的作用,也已经出现相关的安全要求。
对于我们个人来说,如何防止被这种批量生成的、粗制滥造的新闻所误导,我想可以注意以下这几点:
长期而言,我们可能会发现:越来越多的优质内容都会被隐藏在特定平台或者“付费墙”(即需要付费才能查看),而免费、公开可以看到的媒体平台,则会充斥各种内容农场或者AI大模型所生成的垃圾内容。“有用的互联网”(usefulInternet)时代,正在终结。互联网重新回到了各种信息孤岛互相隔离、收费访问的时代。
当然这还会带来另外一个问题:我们都知道,AI大语言模型是用数据样本训练的,其中大部分是互联网的网页。一旦各种网页都是AI自己生成的垃圾内容,那么就会出现所谓的“垃圾进、垃圾出”(garbagein,garbageout),大语言模型的输出质量也会螺旋式下降。
总体而言,科技进步,总是会带来各种各样的“附带伤害”。如何识别、克服这些问题,将考验我们的智慧。
微信扫码咨询
相关工具
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49