Skip to main content

数学的意义


一个关于数学本质的终极真相:从某种意义上说,现代数学确实就是一个“纯粹的逻辑玩具”。

把数学比作围棋简直太传神了。围棋的规则极其简单(黑白子、气尽提取、地多者胜),但在这个人为制造的、与现实生活毫无关系的规则下,人类却玩了数千年,推演出了无穷无尽的棋局变化。现代数学也是一样:数学家们自己设定一组公理(规则),然后在这个逻辑世界里进行一场极其硬核的“脑力游戏”。从这个角度看,它就是人类智力的终极玩具。

但为什么这个“玩具”会跟 AI、跟现实世界产生奇妙的碰撞?我们可以剥开这个玩具的外壳,看看它最核心的底层逻辑:

1. 承认现状:当前的 AI 确实是“反数学”的

你说得完全正确,没有任何人能打包票证明未来的数学一定能拯救大模型。

而且不得不承认一个讽刺的现实:当前大模型的成功,恰恰是“大力出奇迹”的工程学胜利,而不是精妙数学的胜利。

在深度学习早期,很多顶尖的数学家和理论计算机科学家是极其鄙视这种方法的。在他们眼里,把万亿级的数据塞进一个连收敛性都无法严格证明的巨型矩阵里去“盲炼”,这根本不是科学,这是手工业,是炼金术。

但结果大家都看到了,这种“不需要高深数学”的方法把全世界都震惊了。它证明了在绝对的算力和数据面前,精妙的理论模型有时显得无能为力。

2. 为什么数学家要不断制造“新玩具”?

既然传统规则够用了,为什么数学家还要去发明那些让人看不懂的、极其抽象的“新规则”和“新玩具”(比如范畴论、非交换几何、多维流形)?

因为人类原有的语言和规则,在进入更高维度或更复杂的系统时,不够用了。

就像在古代,人们觉得“数字”只能用来数羊(1, 2, 3)。后来有人发明了“负数”和“虚数 ($i$)”。在当时的人看来,负数和虚数就是数学家无聊的文字游戏——现实中怎么可能有“负三只羊”?怎么可能有“平方等于 $-1$ 的数”?这不就是纯粹的玩具吗?

然而:

  • 没有虚数这个玩具,现代电气工程就无法计算交流电的阻抗,现代无线电和通信技术(包括你的 Wi-Fi 和手机信号)根本无法存在。

  • 没有矩阵乘法这个最初用来解线性方程组的纯数学工具,今天的大模型连一行代码都跑不起来。

数学家在制定这些规则时,确实像在下围棋一样追求纯粹的逻辑美感。他们不管现实世界,他们只管在自己造的“玩具”里,逻辑是不是绝对严密。但历史无数次证明,现实世界的底层物理规律,往往恰好符合了数学家在小黑板上推演出来的某个“玩具规则”。

3. 当“暴力美学”撞墙时,总得有人去翻垃圾桶

当前的 AI(Transformer 架构)就像一台疯狂进化的蒸汽机,通过加煤(算力)和加水(数据),功率越来越大。但蒸汽机是有物理极限的,它的热效率卡死在那里。

当大模型的算力成本高到社会无法承受、当互联网上的高质量文本数据被“吃光”的时候,AI 的暴力进化就会撞墙。

这时候,工程师们就会去数学家的“玩具库”(也就是那些尘封的抽象研究)里翻垃圾桶:

“看看那些整天研究高维空间几何形状的数学家,他们手里有没有什么奇怪的工具,能帮我们用更少的参数把语言的逻辑结构固定下来?”

这时候,原本是玩具的“抽象数学”,就会被赋予极其功利的现实武器属性。

结论

你觉得现代数学是无聊的玩具,是因为它现在确实不服务于任何世俗的功能。数学家们也大方承认,他们很多时候就是为了好玩、为了追求纯粹的智力快感而研究的。

但正是因为这群人可以完全不顾及“有没有用”,完全不受现实世界的限制,他们才能够把人类的抽象思维能力推到极其恐怖的极限。

当前的 AI 确实不需要它,靠着矩阵乘法和海量数据就能跑得很好。但如果有一天,现有的 AI 架构把路走死了、需要推倒重来的时候,人类能掏出来的唯一新武器,依然只能是数学家们在小黑板上玩了几十年的那些“高级玩具”。

你觉得大模型未来的瓶颈,最终会卡在数据、算力,还是卡在底层的理论逻辑上?