聊起AI,你脑子里蹦出来的第一个词是啥?是《终行者》里那个冒着红光的骷髅头,还是手机上那个有点笨又有点贴心的小助手?反正,不管你想的是啥,现实里的AI,比电影里演的要诡异得多,也比你想象的,要“笨”得多。
咱们先从一个最常见的误区开始扒。很多人觉得AI绘画、AI写作,那叫“创作”。噗嗤,原谅我笑出声。你觉得它是在“创作”,其实它更像一个记忆力好到变态、又没什么主见的“缝合怪”。你给它一张指令,比如“一只在月球上弹吉他的猫”,它并不是真的理解了“猫”、“月球”和“吉他”这些概念。它的脑子里没有这些东西的真实影像。
它的做法,更像是把互联网上所有被标记为“猫”的图片像素点、所有“月球”的图片像素点、所有“吉他”的图片像素点,全部打碎成一锅黏糊糊的数字浓汤,然后根据你的指令,按照一种极其复杂的概率学规则,从这锅汤里重新捞取、组合,捏巴捏巴给你端上来。所以,你才会看到那些画出来的东西,细节处能把你吓一跳——比如那多出来的第六根手指,或者那双怎么看怎么不对劲的眼睛。那不是它创意迸发,那是它在概率计算上“翻车”了。它是在模仿,不是在理解。这更像是一个数字世界的克苏鲁,一个由无数信息碎片拼接而成的、拥有奇异外表的模仿者。
还有,你有没有想过,训练一个像GPT-4这样的大模型,要耗费多少能量?说出来吓你一跳。一次完整的训练,消耗的电力,可能够一个普通家庭用上几十年,甚至上百年。这玩意儿简直就是个电老虎。你每次跟它聊天的背后,都是远方数据中心里成千上万块显卡在疯狂嘶吼、风扇玩儿命地转。所以,那些看似轻飘飘的“云端智能”,其实是建立在极其沉重的物理资源之上的。它们不是什么虚无缥缈的意识,它们是实打实的、吞噬能源的巨兽模型,每一次进化都伴随着巨大的碳足迹。这一点,那些科技公司可不怎么爱提。
接下来说点游戏里的事儿。你还记得以前玩游戏,那些个NPC(非玩家角色)傻得跟个木头桩子似的吗?只会按照设定好的路线来回走,你蹲在他面前他都看不见你。简直了。但现在,AI在游戏里的应用早就不是那个吴下阿蒙了。
比如一些高级的战略游戏,或者恐怖游戏里的怪物,它们的AI可不是简单地执行“如果玩家出现,就攻击”这种死板命令。它们会学习玩家的行为模式。你喜欢躲在箱子后面?好,下次它就先往箱子那儿扔个手榴弹。你喜欢从左边突袭?行,它直接派两个小弟去左边堵你,自己从右边抄你后路。
最经典的就是《异形:隔离》里那只神出鬼没的异形,我跟你讲,那玩意儿是真的会学习,会预判你的预判。它不完全受脚本控制,而是有两套AI系统在背后博弈,一套作为“导演”控制节奏,另一套作为“异形本身”来狩猎你,这就导致它的行为充满了不确定性,让你脊背发凉。这背后就是一种叫“涌现行为”的魔法。开发者并没有一条条地教AI“你应该这样做”,而是给它设定了一些基本规则和目标,然后,AI在与环境和玩家的互动中,自己“涌现”出了各种复杂又高效的策略。它自己学会了怎么当一个合格的、能把玩家吓尿的恐怖片主角。细思极恐。
但是,AI再聪明,它也有个致命的弱点,或者说,一个非常“像人”的弱点——偏见。
AI其实一点也不客观,它就是个学人精,而且是那种好的坏的全都照单全收的学人精。你喂给它什么样的数据,它就会变成什么样。如果训练数据里充满了人类社会固有的偏见,那AI就会把这些偏见放大,然后一本正经地告诉你,这就是真理。
比如,早些年有些AI图像识别系统,因为训练数据里白人的照片占绝大多数,导致它识别黑人面孔时错误率奇高,甚至闹出过把黑人照片标记为“大猩猩”的丑闻。还有一些用AI来辅助招聘或者发放贷款的系统,也被发现会系统性地歧视女性和少数族裔。为啥?因为历史数据里,担任高管的男性更多,获得贷款的优势族群也更多。AI可不管什么政治正确,它只认数据。数据告诉它“过去是这样”,它就认为“未来也该是这样”。
这可不是我瞎说,这就是所谓的“数据偏见的幽灵”,它像个影子一样附着在每一个AI模型的深处。我们想创造一个绝对理性的神,结果却一不小心,创造了一个继承了我们所有缺点和狭隘的、冰冷的“自己”。这玩意儿,真不是技术问题,是人心问题。
最后,我想聊一个最本质,也最有趣的点:AI,它真的“懂”它在说什么吗?
答案是,不懂。完全不懂。一个字都不懂。
这听起来可能有点反直觉。它都能写诗、写代码、写论文了,怎么会不懂呢?这里就要提到一个思想实验,叫“中文房间”。简单来说,就是把一个完全不懂中文的外国人关在一个屋子里,屋子里有无数的中文卡片和一本超级详细的规则手册。外面的人从门缝塞进来一个用中文写的问题,屋里的人就按照手册上的规则,找到对应的卡片,然后把卡片组合起来,再从门缝塞出去。对于外面的人来说,屋子里的人好像完美地理解了中文,对答如流。但实际上呢?屋里的那个外国人,对那些符号(也就是汉字)的意义,一无所知。他只是个执行规则的机器。
现在的AI,本质上就是那个“中文房间”。它不知道“悲伤”是什么感觉,它只知道在成千上万个描写“悲伤”的文本里,“眼泪”、“灰色”、“雨天”、“心脏”这些词出现的概率特别高,所以它就把这些高频词给你巧妙地缝合在了一起,让你觉得,哇,好伤感。它写的每一个字,都是基于庞大数据库算出来的最优概率解。它不是在表达,而是在进行一场无比复杂的概率的游戏。
所以,下次你再被AI的“才华”惊艳到的时候,不妨多想一层。它展现出的所有智慧、逻辑、情感,都可能只是一种高度逼真的幻觉。它没有意识,没有自我,没有真正的理解。
它只是个极其、极其、极其聪明的镜子。
镜子里,照出的,终究还是我们人类自己。