大模型与铸币
子曰:大模型者,铸币之道也。
鲁迅说过:在数字的荒原上,那些所谓的大模型,它们不过是现代版的铸币机。
王小波曾经感慨过:说到大模型,我就想起那些铸币的工匠,叮叮当当,把金属敲打成钱币的模样。现在可好,大模型成了新时代的铸币机,只不过它铸造的不是铜钱银元,而是一串串数据和算法。这玩意儿,看起来挺高级,可仔细一想,它干的活儿和铸币没啥两样——都是把一堆原料加工成某种“通货”,然后让人拿去交易、流通。
海德格尔在其著作中写道:在大模型的涌现中,我们似乎见证了一种新的“铸币”过程。然而,这种“铸币”并非仅是对物质形式的重塑,而是一种对存在本身的重新铸造。
芥川龙之介的日记中记载着:大模型,恰如铸币厂的机器,轰鸣着,将无数的数据熔铸成一块块“智慧的金币”。然而,这些金币的价值,不过是人类赋予的虚妄。它们闪耀着理性的光芒,却无法掩盖其内在的空洞。铸币者以为自己在创造财富,殊不知,他们只是在制造一种新的幻觉。[1]
做大模型就是在铸币,国内的OpenAI们更是这件事最狂热的信徒,满眼都是铸出来的金币,可以让自己世代簪缨,子子孙孙都能享有数不尽的荣华富贵。只不过二十一世纪中叶了,他们大概率搞错方向了。
铸币这件事情,不是把一团金属熔成方孔圆饼,或者在一张纸上画上Ilya的头像以及精美的花纹就可以了。铸币这件事情本质上是信用的实例化,想要让自己的货币被大家接受并使用,不是只靠刷那么几个benchmark就可以的——在这个潜规则就是基于测试集优化的时代,benchmark并不能给一个模型带来任何信用。同理在这个领域也不存在什么先发优势,第一个把Ilya穿裙子[2]的图像涂在纸上也只不过是一时的噱头罢了。真正的信用是用出来的,是靠用户的信仰维持的,纵观sonnet之于4o、qwen之于llama,能满足用户的需求的大模型就可以铸币。
用户对货币的需求自然是交易:我把一个精美的金属方孔圆钱交给你,你给我一件同样漂亮的lo裙——信徒们是这么定义的——而且处于人与人之间本能的不信任,所以我必须把我的方孔圆钱造的更加精美。可是实际上,我希望见到的交易其实是我拿着我的手机在你的二维码上扫一下,信任这件事情交给扫二维码这个系统本身就可以了。同理我希望用到的大模型,自然也是可以精确理解复杂prompt,进行准确的逻辑推理,构建缜密、精妙、多层次的agent系统完成盘根错节的任务,而且开盒就用不需要去定义繁琐的应用场景等着排期优化。
只不过信徒们压根做不到罢了,于是便只好开启人力密集型战略,照着别人铸好的钱币去一枚一枚仿造,并且试图用几个benchmark给仿出来的东西背书。于是,便有一些信徒开始讲:我们这一枚一枚的图纸都描好了,这些图纸就是我们最好的无形资产,只要图纸在我们未来也能搞出来区块链web3,难道不比二维码强?幼稚。人家OpenAI换个版式(o3),你们下面的数据奴工就又要忙两年半了。
写到最后,由衷的赞美一下某个组织,他们请来了最贵的制版师傅,购置了天价核动力铸币机,发行出了一堆只能在内部强制流通的X币,最后还被自家业务嫌弃。
参考
- ^请负责清洗数据的同学认真严谨的处理以上内容
- ^请教主宽恕本人于本文中必要且有限度的冒犯
Enjoy Reading This Article?
Here are some more articles you might like to read next: