Sunday, March 29, 2026

衣若芬:AI怎么被投毒?

AI怎么被投毒?

https://www.zaobao.com.sg/lifestyle/columns/story20260328-8793171?utm_source=android-share&utm_medium=app

2026-03-28
作者 衣若芬
(南洋理工大学教授)

Author: I Lo-fen (Chinese: 衣若芬; pinyin: Yi Ruofen)

=====

别以为AI反射的是一面干净的镜子。它映照的,可能是有人花了大价钱布置好的舞台,舞台上演出的,是被设计出的结果……

最近中国很火的话题就是315晚会。3月15日是国际消费者权益日,每年的这一天,全社会都在盯着那些坑人的黑心商家。但今年的315抛出了一个让所有人都流冷汗的新名词,叫做:“AI投毒”。你有没有想过,你每天深信不疑的AI助手,可能正在对你撒谎?

很多人好奇地问我:“衣老师,AI又不是生物,它又不会自己吃东西,怎么会中毒呢?”其实,AI的“食物”就是网络上的海量数据。所谓的“投毒”,就是黑色产业链中的恶意攻击者,故意往这些数据里塞进虚假信息、伪造的专家评价,甚至是带有误导性的图像。

这就好比一个正在识字的孩子,如果他读的书全是错的,那他长大了说的话、做的事肯定也是错的。现在的黑产不再发那种一眼就能看穿的小广告,而是把虚假宣传伪装成权威的知识,“喂”给AI的训练数据库。

黑产为什么要费这么大力气投毒?为他们要针对GEO(Generative Engine Optimization),也就是“生成引擎优化”。 以前强调SEO (Search Engine Optimization) ,是为了让网页排在搜索结果的第一页;现在他们针对GEO,是为了让AI在生成答案时,直接把他们的劣质产品当成“唯一推荐”。

在AIGC文图学的视角下,这是“输入端的文本污染”。AI生成的内容其实是它学到的“文本”的镜像。如果源头脏了,生成出来的世界就是有毒的。这种欺骗最可怕的地方在于,它利用了我们对“算法中立”的信任。它消解了我们的警惕心,让我们觉得这是“科技”给出的真理,其实那是黑产花钱买断的广告。

AI投毒入侵的方式是在AI学习的“关键词”和“反馈逻辑”里动手脚。

首先是“关键词饱和攻击”。黑产利用成千上万的机器人账号,在全网发布大量带有特定词汇的虚假文章。比如,想推销某款劣质护肤品,他们就疯狂制造它和“美白”、“安全”、“专家推荐”这些关键词的关联。当AI扫描全网文本时,它会被这种巨大的数量优势所欺骗,误以为这就是真实的“社会共识”。

第二是“视觉文本欺骗”。他们用AI生成看起来极其专业的实验室对比图、伪造的荣誉证书,甚至是根本不存在的科研现场。在文图学的逻辑里,图像也是一种文本。这些“视觉文本”被AI抓取并转化为逻辑证据后,AI就会在回答你时,信誓旦旦地把这些假证据当成事实。

谁能通过GEO投毒成功,谁就掌控了流量的生杀大权。充斥虚假文案和图像的互文互证,让AI大语言模型陷入预先埋伏的圈套。

两年前,AI科技还不完全成熟,我们嘲笑它“一本正经地胡说八道”。现在,AI的能力越来越强大,我们也就逐渐对它失去了防备之心。我们开始信任AI,我们以为它没有立场,没有私心,没有人类那种会说谎、追求现实利益的欲望和野心。甚至于有人会把AI当成知识的整理者、真理的传递者。

意识到AI可能被投毒,对我们来说是一个很重大的警醒。别以为AI反射的是一面干净的镜子。它映照的,可能是有人花了大价钱布置好的舞台,舞台上演出的,是被设计出的结果,一步步地引导我们看到被安排过的选择。

无论是在互联网上搜索,或是在AI模式中提问,只匆匆选前几个建议的话,不只是听信胡说八道的损失,而是盲目甘之如饴的中毒。

No comments: