大模型与铸币

子曰：大模型者，铸币之道也。

鲁迅说过：在数字的荒原上，那些所谓的大模型，它们不过是现代版的铸币机。

王小波曾经感慨过：说到大模型，我就想起那些铸币的工匠，叮叮当当，把金属敲打成钱币的模样。现在可好，大模型成了新时代的铸币机，只不过它铸造的不是铜钱银元，而是一串串数据和算法。这玩意儿，看起来挺高级，可仔细一想，它干的活儿和铸币没啥两样——都是把一堆原料加工成某种“通货”，然后让人拿去交易、流通。

海德格尔在其著作中写道：在大模型的涌现中，我们似乎见证了一种新的“铸币”过程。然而，这种“铸币”并非仅是对物质形式的重塑，而是一种对存在本身的重新铸造。

芥川龙之介的日记中记载着：大模型，恰如铸币厂的机器，轰鸣着，将无数的数据熔铸成一块块“智慧的金币”。然而，这些金币的价值，不过是人类赋予的虚妄。它们闪耀着理性的光芒，却无法掩盖其内在的空洞。铸币者以为自己在创造财富，殊不知，他们只是在制造一种新的幻觉。[1]

做大模型就是在铸币，国内的OpenAI们更是这件事最狂热的信徒，满眼都是铸出来的金币，可以让自己世代簪缨，子子孙孙都能享有数不尽的荣华富贵。只不过二十一世纪中叶了，他们大概率搞错方向了。

铸币这件事情，不是把一团金属熔成方孔圆饼，或者在一张纸上画上Ilya的头像以及精美的花纹就可以了。铸币这件事情本质上是信用的实例化，想要让自己的货币被大家接受并使用，不是只靠刷那么几个benchmark就可以的——在这个潜规则就是基于测试集优化的时代，benchmark并不能给一个模型带来任何信用。同理在这个领域也不存在什么先发优势，第一个把Ilya穿裙子[2]的图像涂在纸上也只不过是一时的噱头罢了。真正的信用是用出来的，是靠用户的信仰维持的，纵观sonnet之于4o、qwen之于llama，能满足用户的需求的大模型就可以铸币。

用户对货币的需求自然是交易：我把一个精美的金属方孔圆钱交给你，你给我一件同样漂亮的lo裙——信徒们是这么定义的——而且处于人与人之间本能的不信任，所以我必须把我的方孔圆钱造的更加精美。可是实际上，我希望见到的交易其实是我拿着我的手机在你的二维码上扫一下，信任这件事情交给扫二维码这个系统本身就可以了。同理我希望用到的大模型，自然也是可以精确理解复杂prompt，进行准确的逻辑推理，构建缜密、精妙、多层次的agent系统完成盘根错节的任务，而且开盒就用不需要去定义繁琐的应用场景等着排期优化。

只不过信徒们压根做不到罢了，于是便只好开启人力密集型战略，照着别人铸好的钱币去一枚一枚仿造，并且试图用几个benchmark给仿出来的东西背书。于是，便有一些信徒开始讲：我们这一枚一枚的图纸都描好了，这些图纸就是我们最好的无形资产，只要图纸在我们未来也能搞出来区块链web3，难道不比二维码强？幼稚。人家OpenAI换个版式（o3），你们下面的数据奴工就又要忙两年半了。

写到最后，由衷的赞美一下某个组织，他们请来了最贵的制版师傅，购置了天价核动力铸币机，发行出了一堆只能在内部强制流通的X币，最后还被自家业务嫌弃。

参考

^请负责清洗数据的同学认真严谨的处理以上内容
^请教主宽恕本人于本文中必要且有限度的冒犯

Enjoy Reading This Article?