吴洪森：AI的出路在哲学阿波罗新闻网手机版

🏠评论 > 文集 >

吴洪森：AI的出路在哲学

【我尽量避免写长文，但是这个问题太复杂，压缩再压缩，还是两千多字。望你耐心看完，因为问题太重大】

最近AI圈有一场很有意思的争吵。

一边是Meta的首席科学家杨立昆，图灵奖得主，AI界的老前辈。他拍桌子说：ChatGPT这类大语言模型走错路了，再怎么烧钱也到不了真正的智能，是死路一条。他自己跑去创业，融了超过十亿美元，要做”世界模型”。

另一边是OpenAI、Google、Anthropic这些公司，一边继续往大语言模型里砸钱，一边说：你看我们的模型多厉害，什么都能聊，什么都能写，眼看着AGI（通用人工智能）就要来了。

两边都是聪明人，都有钱，都有数据，为什么吵成这样？

因为他们争的，表面上是技术路线，骨子里是一个谁也没说清楚的老问题：

语言和这个世界，到底是什么关系？

这个问题没搞清楚，谁说自己找到了AI的出路，都是吹牛。

大语言模型错在哪里？

杨立昆的批评，用大白话说就是一句话：“ChatGPT这类模型，学的是怎么说话，不是怎么理解世界。”

你把人类几千年写下来的所有文字喂给它，它学会了在什么场合该接什么话，该用什么词。它预测的是”下一个词应该是什么”，而不是”这件事在现实中是怎么运作的”。

打个比方：有个人把所有的烹饪书都背下来了，能跟你聊各种菜的做法头头是道。但他从来没进过厨房，从来没闻过油烟，从来没切过菜。你真的觉得他懂做菜吗？

杨立昆说，大语言模型就是这个背食谱的人。它对语言的掌握令人叹为观止，但它对世界的理解，可能还不如一只猫。

猫知道东西从桌上推下去会掉到地上。猫知道空间、重力、因果。这些知识不是从文字里学来的，是从每天的摸爬滚打里长出来的。

所以杨立昆要做的世界模型，就是让AI像猫一样，通过与物理世界的交互来学习——而不是只靠读书。

那世界模型就一定对吗？

也不见得。

大语言模型的支持者反驳说：你低估了语言。人类几千年的智慧都压缩在文字里了，语言里不只有词，还有大量的物理常识、因果关系、生活经验。你说ChatGPT不懂物理？它能解很多物理题呢。

这个反驳也有道理。语言不是凭空产生的，它是人类与世界打交道的结晶。从某种程度上说，学透了语言，确实也学到了不少关于世界的东西。

所以问题就卡在这里了：“语言里装得下整个世界吗？还是世界里有些东西，是语言永远说不清楚的？”

别以为这是新问题。哲学家一百多年来就在吵这个，但没吵出结果。

维特根斯坦说过一句名言：“我的语言的界限，就是我的世界的界限。“意思是，你能想到什么、理解什么，取决于你的语言能表达什么。听起来好像在说语言就是一切。

但他后来又改口了。他说，语言的意义不是靠语言自己撑起来的，而是靠你用语言时候的那些具体场合——你在干什么，在哪里，跟谁说。语言必须嵌在真实的生活里才有意义，光有符号是不够的。

这其实帮了杨立昆一把。一个只读文本、从没跟世界打过交道的AI，恰恰缺的就是维特根斯坦说的那种”生活”的底子。

梅洛-庞蒂说得更直接：理解这件事，根本不是脑子里的符号运算，而是身体跟世界的接触。婴儿在会说话之前，就已经知道怎么抓东西、怎么保持平衡了。身体的感知比语言更根本。

这就更像杨立昆的思路了：先有身体与世界的交互，才有真正的理解。

德里达的立场最极端：文本之外什么都没有，所有意义都在符号游戏里，你跳不出语言去抓住什么”真实的世界”。

这个说法如果成立，杨立昆的整个计划就垮了——因为他想让AI去理解的那个”物理世界”，本来就是个幻觉？

但德里达有个绕不过去的问题：你说石头是软的，石头不会因此变软。现实有一种语言改变不了的硬度。这种”推回来”的力量，不是语言能解释的，恰恰说明语言之外有个真实的东西存在。

三个阵营吵来吵去，其实有一个共同的毛病：他们研究的都是”已经有智慧的人”，而不是”智慧怎么从零长出来”。

这对AI来说是致命的缺口。因为AI工程师需要的不是”描述智慧是什么样子”，而是”智慧是怎么生长出来的”。这两件事差得很远。

另外，“语言与世界是一还是二”这个问题本身，可能也问错了。

它假设语言和世界是两个东西，然后问它们是不是同一个。但事实可能是：这根本不是两个独立的东西在那里等着被比较，而是一个持续发展的过程。

世界先于语言存在，这是肯定的——宇宙已经138亿岁了，语言才几十万年。语言从世界里长出来，这也是肯定的——是生物进化和社会发展的产物。但语言一旦长出来，就反过来改造世界——人类给东西命名，命名创造分类，分类影响认知，认知改变行为，行为改变现实。语言和世界一直在互相塑造，分不开，也化不成一个。

所以不是”语言等于世界”，也不是”语言和世界完全是两回事”，而是两者一直在相互生成，一直在动，永远没有一个静止的终态。这个图景，现有的哲学框架装不下。

说到这里，AI到底缺什么就比较清楚了。

缺的不是更多数据，不是更大模型，不是更好的硬件。缺的是一套能回答这个问题的理论：

一个系统，怎样才能既会操作符号，又真正理解符号背后的东西？这中间的桥，是怎么搭起来的？

杨立昆说要用世界模型，让AI跟物理世界打交道——方向有道理，但他的方案还没有解释清楚，跟世界打完交道之后，物理经验是怎么变成可以推理的抽象概念的。这个”从感知到思维”的跳跃，仍然是个黑箱。

大语言模型的路线说语言里什么都有——部分正确，但没有解释清楚语言的意义约束力从哪里来。为什么有些话是对的，有些话是错的？不能说”因为别的语言这么说”，那是循环论证。

两条路都走到了一堵墙前面，墙上写着：意义是什么？理解是什么？

这是哲学问题，不是工程问题。在这堵墙被打通之前，工程师们不管往哪个方向跑，都是在黑暗里摸索。

为什么说出路在哲学

有人会说：哲学有什么用，解决不了实际问题。这话在大多数时候是对的。但AI是个例外。

因为搭建AI系统，每一个设计决策背后都有一个哲学假设。用什么方式表示知识？用什么标准判断对错？用什么结构组织推理？这些选择，表面是工程问题，骨子里是在回答”智能是什么”这个哲学问题。

现在的麻烦是，工程师们在做这些选择的时候，用的哲学假设都没有经过认真检验。杨立昆假设物理世界比语言更根本——这是个哲学立场，不是工程事实。大语言模型假设语言可以自足——这也是个哲学立场，不是工程事实。

两拨人拿着未经检验的哲学假设，各自烧几百亿美元，赌哪个假设是对的。

这不是科学，这是赌博。

如果有人能真正把”意义是怎么在符号和感知之间流动”这件事说清楚——不是诗意地描述，而是清晰地、能被工程参考的方式说清楚——那将直接改变AI的路线选择，价值不亚于任何一项重大技术突破。

牛顿之前，人们关于运动有各种哲学争论，没有答案。牛顿发明了微积分，给了一个可以精确计算的工具，争论就结束了。AI现在需要的，是类似微积分的东西——一个关于意义和理解的精确理论，能够让”语言与世界的关系”这件事变得可以被严格讨论、被操作化、被检验。

这个理论还不存在。谁做出来，谁就找到了AI的出路。