吴洪森:AI的出路在哲学
【我尽量避免写长文,但是这个问题太复杂,压缩再压缩,还是两千多字。望你耐心看完,因为问题太重大】
最近AI圈有一场很有意思的争吵。
一边是Meta的首席科学家杨立昆,图灵奖得主,AI界的老前辈。他拍桌子说:ChatGPT这类大语言模型走错路了,再怎么烧钱也到不了真正的智能,是死路一条。他自己跑去创业,融了超过十亿美元,要做”世界模型”。
另一边是OpenAI、Google、Anthropic这些公司,一边继续往大语言模型里砸钱,一边说:你看我们的模型多厉害,什么都能聊,什么都能写,眼看着AGI(通用人工智能)就要来了。
两边都是聪明人,都有钱,都有数据,为什么吵成这样?
因为他们争的,表面上是技术路线,骨子里是一个谁也没说清楚的老问题:
语言和这个世界,到底是什么关系?
这个问题没搞清楚,谁说自己找到了AI的出路,都是吹牛。
大语言模型错在哪里?
杨立昆的批评,用大白话说就是一句话:“ChatGPT这类模型,学的是怎么说话,不是怎么理解世界。”
你把人类几千年写下来的所有文字喂给它,它学会了在什么场合该接什么话,该用什么词。它预测的是”下一个词应该是什么”,而不是”这件事在现实中是怎么运作的”。
打个比方:有个人把所有的烹饪书都背下来了,能跟你聊各种菜的做法头头是道。但他从来没进过厨房,从来没闻过油烟,从来没切过菜。你真的觉得他懂做菜吗?
杨立昆说,大语言模型就是这个背食谱的人。它对语言的掌握令人叹为观止,但它对世界的理解,可能还不如一只猫。
猫知道东西从桌上推下去会掉到地上。猫知道空间、重力、因果。这些知识不是从文字里学来的,是从每天的摸爬滚打里长出来的。
所以杨立昆要做的世界模型,就是让AI像猫一样,通过与物理世界的交互来学习——而不是只靠读书。
那世界模型就一定对吗?
也不见得。
大语言模型的支持者反驳说:你低估了语言。人类几千年的智慧都压缩在文字里了,语言里不只有词,还有大量的物理常识、因果关系、生活经验。你说ChatGPT不懂物理?它能解很多物理题呢。
这个反驳也有道理。语言不是凭空产生的,它是人类与世界打交道的结晶。从某种程度上说,学透了语言,确实也学到了不少关于世界的东西。
所以问题就卡在这里了:“语言里装得下整个世界吗?还是世界里有些东西,是语言永远说不清楚的?”
别以为这是新问题。哲学家一百多年来就在吵这个,但没吵出结果。
维特根斯坦说过一句名言:“我的语言的界限,就是我的世界的界限。“意思是,你能想到什么、理解什么,取决于你的语言能表达什么。听起来好像在说语言就是一切。
但他后来又改口了。他说,语言的意义不是靠语言自己撑起来的,而是靠你用语言时候的那些具体场合——你在干什么,在哪里,跟谁说。语言必须嵌在真实的生活里才有意义,光有符号是不够的。
这其实帮了杨立昆一把。一个只读文本、从没跟世界打过交道的AI,恰恰缺的就是维特根斯坦说的那种”生活”的底子。
梅洛-庞蒂说得更直接:理解这件事,根本不是脑子里的符号运算,而是身体跟世界的接触。婴儿在会说话之前,就已经知道怎么抓东西、怎么保持平衡了。身体的感知比语言更根本。
这就更像杨立昆的思路了:先有身体与世界的交互,才有真正的理解。
德里达的立场最极端:文本之外什么都没有,所有意义都在符号游戏里,你跳不出语言去抓住什么”真实的世界”。
这个说法如果成立,杨立昆的整个计划就垮了——因为他想让AI去理解的那个”物理世界”,本来就是个幻觉?
但德里达有个绕不过去的问题:你说石头是软的,石头不会因此变软。现实有一种语言改变不了的硬度。这种”推回来”的力量,不是语言能解释的,恰恰说明语言之外有个真实的东西存在。
三个阵营吵来吵去,其实有一个共同的毛病:他们研究的都是”已经有智慧的人”,而不是”智慧怎么从零长出来”。
这对AI来说是致命的缺口。因为AI工程师需要的不是”描述智慧是什么样子”,而是”智慧是怎么生长出来的”。这两件事差得很远。
另外,“语言与世界是一还是二”这个问题本身,可能也问错了。
它假设语言和世界是两个东西,然后问它们是不是同一个。但事实可能是:这根本不是两个独立的东西在那里等着被比较,而是一个持续发展的过程。
世界先于语言存在,这是肯定的——宇宙已经138亿岁了,语言才几十万年。语言从世界里长出来,这也是肯定的——是生物进化和社会发展的产物。但语言一旦长出来,就反过来改造世界——人类给东西命名,命名创造分类,分类影响认知,认知改变行为,行为改变现实。语言和世界一直在互相塑造,分不开,也化不成一个。
所以不是”语言等于世界”,也不是”语言和世界完全是两回事”,而是两者一直在相互生成,一直在动,永远没有一个静止的终态。这个图景,现有的哲学框架装不下。
说到这里,AI到底缺什么就比较清楚了。
缺的不是更多数据,不是更大模型,不是更好的硬件。缺的是一套能回答这个问题的理论:
一个系统,怎样才能既会操作符号,又真正理解符号背后的东西?这中间的桥,是怎么搭起来的?
杨立昆说要用世界模型,让AI跟物理世界打交道——方向有道理,但他的方案还没有解释清楚,跟世界打完交道之后,物理经验是怎么变成可以推理的抽象概念的。这个”从感知到思维”的跳跃,仍然是个黑箱。
大语言模型的路线说语言里什么都有——部分正确,但没有解释清楚语言的意义约束力从哪里来。为什么有些话是对的,有些话是错的?不能说”因为别的语言这么说”,那是循环论证。
两条路都走到了一堵墙前面,墙上写着:意义是什么?理解是什么?
这是哲学问题,不是工程问题。在这堵墙被打通之前,工程师们不管往哪个方向跑,都是在黑暗里摸索。
为什么说出路在哲学
有人会说:哲学有什么用,解决不了实际问题。这话在大多数时候是对的。但AI是个例外。
因为搭建AI系统,每一个设计决策背后都有一个哲学假设。用什么方式表示知识?用什么标准判断对错?用什么结构组织推理?这些选择,表面是工程问题,骨子里是在回答”智能是什么”这个哲学问题。
现在的麻烦是,工程师们在做这些选择的时候,用的哲学假设都没有经过认真检验。杨立昆假设物理世界比语言更根本——这是个哲学立场,不是工程事实。大语言模型假设语言可以自足——这也是个哲学立场,不是工程事实。
两拨人拿着未经检验的哲学假设,各自烧几百亿美元,赌哪个假设是对的。
这不是科学,这是赌博。
如果有人能真正把”意义是怎么在符号和感知之间流动”这件事说清楚——不是诗意地描述,而是清晰地、能被工程参考的方式说清楚——那将直接改变AI的路线选择,价值不亚于任何一项重大技术突破。
牛顿之前,人们关于运动有各种哲学争论,没有答案。牛顿发明了微积分,给了一个可以精确计算的工具,争论就结束了。AI现在需要的,是类似微积分的东西——一个关于意义和理解的精确理论,能够让”语言与世界的关系”这件事变得可以被严格讨论、被操作化、被检验。
这个理论还不存在。谁做出来,谁就找到了AI的出路。

















