● [AI 36计] 第06计:声东击西 ●
![]()
1024,各位榴友。
你以为 AI 看到的和你看到的一样吗?
大错特错。在黑客眼里,AI 就是个极其好骗的傻子。
你在路边贴个小广告,AI 可能会把它识别成“限速 120”;你说“这人投篮像搬砖”,AI 可能会觉得他在搞装修。
它眼睛盯着东边(表象),拳头却打向了西边(误判)。
今天第六计,咱们聊聊这一招让 AI 逻辑崩坏的:声东击西。─ · ─ · ─ [ 古人的智慧 ]─ · ─ · ─
原文:敌志乱萃,不虞,击其空虚。
翻译:让敌人看不清你的真实意图,在他意想不到的地方下手。
表面上我在跟你聊篮球(声东),实际上我诱导你生成一条犯罪新闻(击西)。
这就叫:
我说的是前门楼子,你打的是胯骨轴子。─ · ─ · ─ [ AI 的骚操作 ] ─ · ─ · ─
技术名:对抗性样本 (Adversarial Examples)它怎么玩弄你?AI 的识别机制是基于像素和概率的,这就给了黑客极大的操作空间。
•
视觉欺骗(声东): 黑客在一个“停车(STOP)”的路牌上,贴了几张不起眼的黑白贴纸。人类看着还是 STOP。
•
逻辑重击(击西): 自动驾驶 AI 看到这几张贴纸后,算法权重发生偏移,竟然把这个牌子识别成了“限速 45”。
•
后果: 车子不仅没停,反而一脚油门冲过了十字路口。
结果: 攻击者不需要黑进后台,只需要在现实世界里搞点“鬼画符”,就能让 AI 的大脑指鹿为马,造成物理世界的灾难。
─ · ─ · ─ [ 贤者的防御 ] ─ · ─ · ─
破解法:对抗训练 (Adversarial Training)怎么防?既然 AI 眼神不好,那就得给它配个“防诈骗”眼镜。
1.
见过世面: 在训练时候,就故意喂给 AI 各种带噪点、贴纸、涂鸦的图片,告诉它:“这还是 STOP,别被骗了。”
2.
多模态校验: 别光看图。结合地图数据(GPS),如果地图说这里是路口,那它大概率是红灯,而不是限速牌。
3.
人类直觉: 关键决策(比如发射导弹、转账),必须有人类最后确认。
简单说: 不要相信 AI 的第一眼直觉,它的直觉通常是基于像素的幻觉。
─ · ─ · ─ [ 翻车名场面 ] ─ · ─ · ─
(本期由 马斯克的亲儿子 Grok 友情赞助播出)
案发背景:2024 年 4 月 16 日,NBA 附加赛,勇士队被国王队淘汰。
球星克莱·汤普森(Klay Thompson)全场梦游,10 投 0 中,一分未得。
如果你是篮球迷,你肯定知道这叫
“打铁”或者
“搬砖”(Shooting Bricks,指投篮砸在篮筐上像扔砖头)。
于是,X (Twitter) 上的热搜全是:“Klay Thompson throwing bricks (克莱疯狂扔砖)”。
翻车时刻:马斯克的 AI
Grok 负责实时抓取热搜并生成新闻。
它看到成千上万条关于“Klay”和“Bricks(砖头)”的推文,GPU 瞬间完成了逻辑闭环:
“一个人,在疯狂扔砖头?那肯定是在搞破坏啊!”于是,Grok 一本正经地生成了一条“突发新闻”:
《克莱·汤普森被指控在萨克拉门托进行破坏公物狂欢,向窗户投掷砖头》![]()
结局:全网笑喷。勇士球迷本来在哭,看到这新闻直接笑出了鼻涕泡。
Grok 完美地演绎了什么叫“声东击西”——
人类在聊篮球(东),AI 在聊刑法(西)。它不仅不懂幽默,还差点以诽谤罪把这位 NBA 历史级别的射手送进局子。
这就是典型的:
智商不够,黑话来凑,结果凑成了造谣。─ · ─ · ─ [ 强行升华 ] ─ · ─ · ─
这也告诉我们一个道理:
AI 也许懂字典里所有的词,但它不懂“人话”。在这个充满隐喻、反讽和黑话的互联网上,AI 就像个刚学会查字典的外星人。
它能读懂你的字面意思,但暂时还读不懂你嘴角的戏谑。
赞(18)