大模型无非就是另一场改稻为桑罢了

许多年前,当我在致死量的好奇心与探索欲驱使下踏入人造智障教的之时,大概率是没有察觉到即便自己是在未来哪天的弥留之际,依旧会想要再像2024年11月的今天一样,劝退每一个对大模型还有抱有幻想博士生。

改稻为桑之所以会成为改稻为桑,并不在于它说的是嘉靖的桑、光绪的洋务、大跃的钢、陈院的芯、判院的量子、导体的大基、亦或是互联网公司的大模型。有些事情,国人从骨子里都逃不掉其中的愚蠢逻辑:顶层痴心妄想,上层尔虞我诈,中层曲意逢迎,底层负重前行。

遥想5000多万秒之前,有一个5000万刀要做中国的OpenAI的故事。虽然我承认我那个时候有非常积极热心的冷嘲热讽,但是摸着良心讲他的抑郁症肯定不是被我传染的。我那个时候只是非常单纯的写了这么一段文字:“我丝毫不质疑他们想做OpenAI的决心,只不过他们想做的是那个功成名就之后躺着赚钱的那个OpenAI,而不是默默无闻砥砺前行十年磨一剑的那个OpenAI。遥想当年日本抗议我国划设防空识别区,我们的外交部是这样回怼的:日本可以先撤销自己的防空识别区,中方便会考虑在五十年后也撤销(因为当时日本的已经生效了50年)。” 而且我当时就觉得这个事情做的不太聪明,因为上一个因为数字被记住的中国AI事件好像还是身价4000万的绿坝大小姐。

如果你陷入了这样的思考:顶层难道真的不懂这个事情吗?我认为必定不是这样的,嘉靖或许不清楚桑苗多久可以长大,福布斯榜上的巨头们大致也不懂Megatron有4种parallel方法,但是他们可以接触到的信息与情报远远多于我们这种又提升了零点三五个点的训练奴工。只不过对于他们来说,这既是一页讲得出去的PPT,又是一个符合政策的优质自主项目,还是一套可以通过(此处删去15个字)来提升金融消费者热情连续技。而且万一,我承认我有赌的成分,咱就说万一,今年能多织20万匹丝绸,一下子铺开了未来十年躺着赚钱的床垫了呢?

然后这个事情就来到了第一批次的执行者手中,比如说内阁或者VP,这个事情开始便有了实体,而这个实体通常来说却不会围绕着顶层的痴心展开。毕竟人到了这个位置,即便不了解威龙的性能有多好,但是看到空军因为有实战战绩而装备了满屏幕的波音767,必定当场就会把这个妄想否定了。所以对他们来说,这个实体只会围绕着两个中心思想展开:其一,事情能不能做好不重要,事情在谁谁手上没做好很重要;其二,事情能不能做好不重要,事情在我手上能让该吃到的都吃到很重要。毕竟,就算成就了这个万一,躺着赚钱也不是我,而只要没人能成就这个万一,能跪在这里赚钱的就还是我。虽然这两个思想拧在一起成为了绞死中国版OpenAI的绳子,但是主观上我对这群人也仇恨不起来,因为他们权力的一半来自顶层一半来自系统设计,除非他们愿意放弃这些权力,否则他们的存在就跟[SEP]这个token一样维护着chat的框架,如果没有势必会导致模型开始生成不知所以然的回复。

既然讲到权力,那么顺着这个绳子爬下去,我们便来到了权力几乎100%的源自于上层的中层阶级。所以对(绝大多数的)他们来说,100%实现上层的愿望就是他们活下去的唯一方法,哪怕是真的去淹了九个县或者搞几十大类上千小类数百万的数据去过拟合几套测试集:“scaling up数据可是X总的意思,上利部门,下利你们,为什么就是这么不乐意做?”,“对于自负盈亏这一块,我们要以大模型兼新业务,两难自解”,“这世上哪有总能遵循指令的大模型,这badcase不报到上面四两种,报到上面全员都得325”,“刷一万个数据是个数字,刷百万个数据也是个数字,你跟我都得干这份工作”,“为了这次评测比上次涨1个点,必须再针对弱项刷100万的数据,苦一苦大家,325我来担”,诸如此类,不胜枚举。

之前我感慨过,国内有一大批吃了开源红利的天命人在大模型这个领域作妖作孽,但我其实还想再大放几句厥词:国内上一批的AI学者,95%以及研究性死亡在2020年了,也就是scaling开始主导变革的那一年,这导致了以筛选inductive bias配合各路小tricks刷点为主要手法的大批高引学者的思路严重落后于业界的发展。而当这些高引学者在各大模型团队“指导”scaling的时候,便造就了大量画虎不成反类犬的産業ゴミ,然后还大言不惭的捧着这些产业垃圾在中文三大顶刊上宣传“中文场景大幅超越GPT4o”。合着您们那数据不是拿gpt4o刷的?喔,还真不是,是拿claude刷的。

唉,底层苦啊,一年到头也就指着Llama开源点新东西了。




Enjoy Reading This Article?

Here are some more articles you might like to read next:

  • Nanshan Jokes Collection (Gemini 2.5 Pro Translated Version)
  • 南山笑话集锦
  • Some Stray Thoughts After Leaving the Large Model Industry (Gemini 2.5 Pro Translated Version)
  • 离开大模型业界后的一点杂念
  • Large Models and Coin Minting, Continued (Gemini 2.5 Pro Translated Version)