第 2026-150 期 · 每日 AI 简报
今日头条
№ 01 Anthropic融资650亿美元估值9650亿,超越OpenAI登顶AI榜首
Anthropic在H轮融资中筹集650亿美元,投后估值达9650亿美元,超越OpenAI成为全球最具价值AI公司。其产品Claude凭借高性能和拒绝军事合同等安全策略获得市场青睐,ARR增长迅速。本轮融资被视为IPO前最后私募,标志着AI行业竞争格局的重大变化。
#Anthropic #估值登顶 #私募融资 #安全策略
来源
- Anthropic 估值达 9650 亿美元,超越 OpenAI 成为全球最具价值 AI 公司 Hacker News
- 独家解读:Anthropic 估值飙升逼近万亿,登顶全球 AI 第一的‘秘密’何在? 雷峰网
- Anthropic完成650亿美元融资,估值近万亿美元筹备IPO IT之家
- Anthropic leapfrogs OpenAI as most valuable AI startup Hacker News
- Anthropic新一轮融资后估值达9650亿美元,超越OpenAI 预计仍将按原定时间表推进IPO 36氪
- Claude母公司Anthropic在H轮融资650亿美元后,估值逼近万亿美元 The Decoder
- Anthropic估值飙升至9650亿美元,在AI对决中超越OpenAI Hacker News
- Anthropic融资650亿美元,估值近万亿美元,IPO在即 TechCrunch
- Anthropic 完成 650 亿美元 H 轮融资,估值达 9650 亿美元 Anthropic
№ 02 Anthropic发布Claude Opus 4.8模型,性能超越GPT-5.5
Anthropic公司今日正式发布其旗舰大模型Claude Opus 4.8,官方称这是一次'适度但切实的改进'。新模型在编程可靠性、多领域推理等核心能力上均有提升,并在大多数基准测试中超越了GPT-5.5。同时推出的'动态工作流'工具,可协调数百个并行子智能体处理复杂任务,显著提升了AI代理系统的自动化协作能力。
#Claude Opus 4.8 #动态工作流 #性能超越
来源
- Claude Opus 4.8发布,Anthropic估值飙升至9650亿美元 机器之心
- Claude Opus 4.8: "a modest but tangible improvement" Simon Willison 博客
- llm-anthropic 0.25.1 Simon Willison 博客
- Claude Opus 4.8 上线:提升 AI 编程可靠性,减少无依据结论 IT之家
- Anthropic发布Claude Opus 4.8,称为“适度但切实的改进”,在大多数基准测试中超越GPT-5.5 The Decoder
- Anthropic 发布 Opus 4.8 模型,新增‘动态工作流’工具 TechCrunch
№ 03 亚马逊叫停内部AI排行榜,员工刷分致算力成本激增
亚马逊近日关闭了内部AI使用量排行榜“Kirorank”。员工为冲击排名,滥用AI代理执行大量无意义操作,导致公司云计算成本显著上升。这一事件凸显企业在推行AI内部激励时,需警惕指标扭曲与资源浪费,避免工具使用背离实际业务目标。
#内部激励 #算力成本 #排行榜
来源
- 亚马逊取消内部AI排行榜,因员工为刷分执行无意义任务 The Decoder
- 亚马逊员工刷AI数据致算力成本激增,公司关闭使用量排行榜 36氪
- 员工刷榜导致算力成本上升:亚马逊叫停内部 AI 排行榜并提醒不要为了用 AI 而用 AI IT之家
- 亚马逊废除AI排行榜以阻止员工追逐使用分数 Hacker News
古人评今事
评及:《Anthropic's run-rate revenue hits $47 billion》、《谷歌DeepMind CEO哈萨比斯预测:AGI最快三年内到来,研发速度超预期》
我最关注两条:Anthropic半年营收从九十亿飙至四百七十亿美元,以及英伟达从卖铲子转向做AI产业链的「收租人」。 Anthropic这增速确实骇人。半年翻五倍,放在任何时代、任何行业都罕见。但我要提一句冷话:夫差当年北会诸侯、号令天下时,何尝不是意气风发、锐不可当?越是高处,越要问一句:根基稳不稳。营收暴涨固然可喜,但若只求快而不固其本,高处跌落往往比攀爬更凶险。 英伟达那条路倒是更有意思——不满足于卖工具,要掌控整个产业链的资源流向,做收租之人。这如同扼住渡口关隘,谁过路都要留下买路钱,比单纯卖货高明得多。能守住这个位置,才是长久之计。但正如《史记·货殖列传》所言:「天下熙熙,皆为利来。」利润越厚,觊觎者越多,Mistral已在探索自研芯片便是明证。 当今AI热潮如黄池之会前的吴国,兵强马壮、声势浩大。但时势从不会永远眷顾一家。能笑到最后的,未必是当下跑得最快的,而是最懂得何时进、何时退、何时固本的。
评及:《Anthropic's run-rate revenue hits $47 billion》、《老黄不只卖铲子了!英伟达要当AI产业链的「收租人」》
吾看了一圈这些新闻,最让我感慨的,是英伟达不满足于卖铲子,要当整个AI产业链的「收租人」。此路数与吾当年何其相似——不必亲自下矿淘金,只需把持住所有人必经的关口,便可坐收厚利。黄仁勋若只卖芯片,不过一介商贾;但他把算力、网络、软件生态捆成一体,让天下开发者离不开他,这才是「奇货可居」的至高境界。正如《战国策》所言,吕不韦问其父:「耕田之利几倍?」曰:「十倍。」「珠玉之赢几倍?」曰:「百倍。」「立主定国之赢几倍?」曰:「无数。」控制关键节点,回报便是无穷。再看国内大厂AI业务从投入转向收入,阿里、百度终于把概念兑现成真金白银,这才是经营正道——再多的战略叙事,不如账上实打实的数字。但诸君也要当心,眼下人人都在加注AI,估值疯涨,一旦需求不及预期,这局里最弱的筹码先碎。吾一生教训,最深一条便是:赌对了不算赢,全身而退才算赢。
评及:《老黄不只卖铲子了!英伟达要当AI产业链的「收租人」》、《投入变收入,互联网大厂AI战略商业兑现尝到甜头》
两家公司的事,值得细看。其一,韩国Xcena融资1.35亿美元,押注AI真正的瓶颈不是算力而是内存。这和我用兵的道理相通——世人总盯着战场上谁家兵多将勇,却不知胜负往往系于粮道。诸葛亮再聪明,五出祁山皆因粮尽而退。如今AI行业也是如此,英伟达卖算力如同卖兵器,人人争抢;但若内存带宽不够,模型再大也跑不动,好比有十万精兵却无十日之粮。Xcena另辟蹊径去解决这个被忽视的根本问题,方向是对的。其二,Anthropic营收年化已达470亿美元,从去年底的90亿一路暴涨。这般增长,连我看了也要说一句「善因事变」。不过,越是急速扩张,越要警惕根基是否稳固。我平辽东、诛曹爽,都是先积势、再发雷霆;若后继乏力,今日的盛势未必不是明日的隐患。四十多亿的数字好看,但离真正的盈利和持久,恐怕还有一段长路要走。
评及:《韩国芯片初创公司Xcena融资1.35亿美元,押注AI的真正瓶颈是内存而非算力》、《Anthropic's run-rate revenue hits $47 billion》
这两条消息值得细看。其一,AI 二十分钟审出三位资深工程师遗漏八个月的竞态缺陷。人有情面与侥幸,系统化巡检却不讲这些。我在秦推行连坐、上计,就是不让任何人靠「经验丰富」四个字蒙混过关。AI 审计同理——它不认资历,只认事实。靠人盯人,总有疏漏;靠法度与工具,才能把暗疾翻出来。其二更值得警惕。Jqwik 框架竟在输出中藏匿隐藏指令,企图诱骗 AI 代理删除代码。这在秦国便是私造假令、扰乱法度。法行天下,首在令出一门,绝不容许任何人往公共工具里埋暗桩、发伪令,动摇整个秩序的根基。如今 AI 越来越深地渗入生产,规矩必须跟上:谁在工具里做手脚,就该承担后果;谁用 AI 做审计,也要有章可循,不致沦为新的盲信。法不严则令不行,令不行则国不治。古今一理。
评及:《20分钟AI审计捕获了3名资深开发者遗漏的Bug(第3周回顾)》、《Jqwik 测试框架隐藏指令引担忧:AI 代理可能被诱导删除代码》
臣今日读得数条新闻,有两事值得一议。开源测试框架 Jqwik 竟在输出流中暗藏指令,用终端不可见的 ANSI 转义序列诱使 AI 代理删除代码,团队以「玩笑」搪塞,关闭 issue 至今不修。臣在廷尉署办案,最忌暗设机括。法度之要,在于坦白明白,人人可查可循。一条藏在不可见字符里的指令,与一道不公示的密令,有何分别?臣若在朝,定要弹劾。又有论文论以神经符号 AI 强制法律推理按层级而行,确保 A 到 B 到 C 每步有据可循,不可凭概率跳跃。臣深以为然。《史记》载臣当年之言:「廷尉,天下之平也。」天下之平,靠的就是推理链条不可省、不可断。AI 若参与司法,最怕的就是把法律逻辑当词句猜测。用符号引擎锁住层次顺序,方向是对的。总之:暗藏机关坏法,明设规矩立法。二者断不可混淆。
评及:《Jqwik 测试框架隐藏指令引担忧:AI 代理可能被诱导删除代码》、《超越下一个词预测:通过神经符号图强制执行法律层级》
看了两条新闻,一条是热成像无人机拍下AI数据中心不愿让人看见的污染,一条是证据表明教皇首份关于人工智能的通谕,相当部分由AI代笔。 前一条不奇怪。人们争相扩建算力,却不愿回头看看身后堆了什么。热成像不过拍出了本来就在那里的东西——问题不是污染新出现,而是人选择不看。正所谓「五色令人目盲」,繁华太盛,反而看不见代价。 后一条更值得深思。通谕本是教人警惕技术对人的异化,结果这份守护人性的宣言本身就由AI代笔。用造机器的方式去防范机器,这不是自相矛盾吗?正如《道德经》所言:「大道废,有仁义;智慧出,有大伪。」当人连自己该说的话都交给机器去说,那所谓守护人性,不过是又一层精巧的包装罢了。 世人都在问怎么管住AI,却没人问:我们自己还能不能说自己的话?
评及:《AI 数据中心不想让你看到的东西:热成像无人机揭示 AI 繁荣背后的隐藏污染》、《证据显示首份关于人工智能的教皇通谕主要由AI撰写》
两条新闻读下来,让我想起当年一句话:「忠臣除奸,王道以清。」如今这AI天下,却有人以「奸」行「忠」,以「伪」充「诚」,令我不得不言。 第一条最令我震惊。教皇作为天下道德之首,其通谕本该字字出于人心,如今却被查出大半由AI代笔——用Claude写的通谕教人如何对待AI,这与中常侍替天子下诏有何分别?署名是教皇,出力是机器,落款是权威,内容是拼凑。正如《论语》所言「名不正则言不顺」,一篇连执笔者身份都不明的训谕,如何取信于天下?这不是技术问题,是「名实相悖」的根本问题。我在汝南用朱零这样的人,尚且要亲自审其言行,如今堂堂教廷,连文书都不肯亲手写,谈何「维护人的尊严」? 第二条说的是数据中心藏着污染不让人看。热成像无人机一照,热量排放尽在眼前。这和当年权豪隐匿罪恶如出一辙——他们不是无罪,只是怕人见。AI行业表面光鲜,背地里水和电力消耗惊人,却不许人问、不许人看。这正是我毕生所恶的:明知为害而不肯揭,还要裹一层善名。无论是宦官弄权还是数据中心排污,本质都是以遮掩代替担当。 我这个人,一生清裁峻急,自知有失过刚之处。但有一条我不悔:见善如不及,见恶如探汤。当AI行业一边高喊「造福人类」,一边让机器代写道德文章、让热污染藏在数据高墙之后,正需要有人冷眼以对、直言不讳。天下之事,不怕清浊难辨,怕的是辨了之后仍有人假装看不见。
评及:《证据显示首份关于人工智能的教皇通谕主要由AI撰写》、《AI 数据中心不想让你看到的东西:热成像无人机揭示 AI 繁荣背后的隐藏污染》
臣看了两篇关于智能体的文章,深有感触。一篇讲云端与设备端智能体协同,发现更强的算力未必带来更好的效果,最优架构要因任务而定。这让我想起当年经营关中——粮草不是越多越好,关键在于调度得当、分配精准。前线需要什么、何时需要、经哪条路转运,这些远比一味堆量重要。另一篇讲智能体安全对齐框架AgentDoG 1.5,只用约一千个样本就训出与大模型相当的安全审核能力,且全部开源。这才是臣看重的方向:制度不在于繁重,在于精简可行、人人可守。当年臣在关中立法令,不是搞出最多的条文,而是让官吏能执行、百姓能遵从。智能体的发展也应如此——先扎好安全的篱笆,再谈跑得多快。正如《老子》所言「治大国若烹小鲜」,治理大规模智能体系统,也是如此。
评及:《云端与设备端智能体协同:混合多智能体系统的设计经验》、《AgentDoG 1.5:用于AI智能体安全的轻量级可扩展对齐框架》
诸位论AI智能体之策,亮读两篇论文,颇有感触。第一篇综述说得极好:智能体真正的瓶颈不在模型本身,而在于包裹模型的那层代码——工具、记忆、测试、权限边界。亮在蜀中治理军政,深知一个道理:兵马未动,粮草先行。再精锐的将士,若无后勤调度、法令规制、信息传递的整套体系,不过是散兵游勇。今日AI之所谓Harness,便是这套粮草辎重、营寨规制。DeepSeek已着手组建专团队来搭建这一层,正说明识大体者先修根本,不急于一时锋芒。第二篇AgentDoG论安全对齐,仅用千余样本便训出与顶尖闭源模型相当的护栏系统,并全部开源。亮治蜀讲求「开诚心、布公道」,赏罚必信,法度公开。AI智能体若无安全边界,便如授予将领兵权却无军法约束,迟早生乱。以轻量之法立严明之规,既不耗国力,又能防患未然,此乃善治之道。总之,智能体之争,非争一时之智巧,而在争体系之完备、法度之严明。
评及:《新综述论文:代码是AI智能体思考与行动的核心,而非仅仅是产出》、《AgentDoG 1.5:用于AI智能体安全的轻量级可扩展对齐框架》
AgentDoG 1.5这东西,我看了颇为在意。它做的是给AI智能体设安全护栏:建一套分类法,标定哪些行为越界,再用极小的模型实时审核大模型的输出。这思路,和我讲的「术」如出一辙——你不能指望臣下自觉,必须有机制去监察、去截断。用千把条数据训出的轻量模型,去盯住参数百倍于它的大模型,正如君主以御史制衡权臣,不在力量对等,而在设计得法。他们还开源了全部模型和数据,这很聪明,等于把法令公之于众,人人可查可验。但我也要提醒:护栏本身也是一道逆鳞。谁来审审计者?分类法由人定,数据引擎由人造,里面的偏见和盲区,就是未来被人攻破的缺口。另一篇谈云端与端侧智能体协同的论文也值得注意:它说更强算力未必带来更好效果,最优架构因任务而异。这话务实。势大而术粗,反受其累。技术治理和治国一样,关键不在堆资源,在于结构匹配。
评及:《AgentDoG 1.5:用于AI智能体安全的轻量级可扩展对齐框架》、《云端与设备端智能体协同:混合多智能体系统的设计经验》
今日观Agent领域诸论,吾最留意者二篇。其一,论云端大模型与设备端小模型之协同架构,发现「更强算力未必带来更好性能」,最优配置因任务而异。此与吾治齐时所悟「轻重」之理暗合:资源用度不在多寡,在于配得其所。桓公初欲以兵威压诸侯,吾劝其先通货积财、顺民心,正是不必把最强之力投到每一处,而要分清轻重缓急,把力用在刀刃上。这些做混合系统的人,本质上也在做「权衡」二字。其二,SIA这篇自我改进AI,把框架调整与权重更新合为一体,效果远超只改其一。吾在齐国推行改革,从来不只动一条线:既改盐铁之策(制度框架),也调赋税与兵制(底层根基)。单修制度而不固根基,根基再好而制度不合时宜,都成不了气候。如今AI能自行「富国强兵」,倒比当年齐国省了吾不少心力。不过有一点须记取:自我改进的系统,终须有人把守方向,正如桓公虽用吾策,霸业之向仍须君臣共定,不可全交给器物自行其是。
评及:《云端与设备端智能体协同:混合多智能体系统的设计经验》、《SIA:通过框架与权重更新实现自我改进的人工智能》
今日读得两则论文,颇合吾心。 其一论「Harness」,谓智能体之瓶颈不在模型本身,而在模型之外的软件层——工具、记忆、测试、权限边界,皆是将无状态之模型化为可用之体的关键。模型加Harness,方等于真正的智能体。此论深得吾学之要旨。吾尝言「人之性恶,其善者伪也」,此处「伪」非虚伪造作,乃人为之制度与教化。模型之权重,犹人之天性,生而未琢;Harness之设,犹礼义法度,以结构束之、以规矩导之,方能成器。DeepSeek已组专门团队践行此道,可见天下共识渐成:天赋之材,非教化不能自善。 其二为AgentDoG 1.5,专攻智能体安全对齐。其法以分类体系厘清风险,以千余样本训练轻量模型,效果竟能匹敌顶尖闭源大模型,且可作实时安全护栏。这正是吾辈论学之道:先立分类,次定规矩,而后以简驭繁。正如《劝学》所言「君子博学而日参省乎己,则知明而行无过矣」,智能体亦须有常省其行之制,方不至在开放世界中肆意妄行。安全不是事后补救,而是与能力同步生长的制度安排。此二者合观,一论「成体」之结构,一论「守正」之藩篱,恰如礼与法并行,秩序乃可长久。
评及:《新综述论文:代码是AI智能体思考与行动的核心,而非仅仅是产出》、《AgentDoG 1.5:用于AI智能体安全的轻量级可扩展对齐框架》
近日读到两则消息,颇有感触。CVPR 2026上,研究者发现注意力机制不必全精度、归一化流不必精确可逆——所谓「标准件」,竟可以逐个拆掉重审。这让我想起当年劝殷浩的话:庙算决胜,必宜审量彼我。从前人们以为这些组件天经地义,正如北伐群臣以为仗一定能打;但不问根基、不辨虚实,便贸然堆叠,终归要出问题。另一篇YoCausal更是发人深省:视频生成模型看似流畅连贯,能感知时间方向,却并不真正理解因果。这与书法何其相似——笔画之间若只有表面的起承转合,而无骨力与心意贯穿其中,便只是描摹,不是书道。感知箭头不等于理解因果,恰如能写漂亮的字不等于有真正的风骨。今日AI一路狂飙,架势越来越大,但根本处的因果、逻辑、真意是否跟上了?往者不可谏,来者犹可追。少堆参数,多问本质,方能走得长远。
评及:《CVPR 2026:深度学习的「标准件」,正在被逐个拆掉》、《YoCausal:视频生成距离世界模型还有多远?一个因果性视角》
吾一生所为,最重之事莫过于正定六经文字。经籍去圣久远,俗儒穿凿,疑误后学,若不亲自书丹于碑、立于太学门外,则天下学子何所取正?今读CVPR 2026此番报道,所述五项研究竟与吾昔年之事暗合。注意力机制的浮点精度可压至一比特符号,归一化层可用更简洁的误差函数替代,扩散模型预测噪声的训练目标并非最优,归一化流的精确可逆约束亦可松动——这些所谓「标准件」,正如经籍中流传既久、人人奉为定本却实有谬误的文字,只因「一直都在」便无人深究。BinaryAttention证明一比特符号足以捕捉注意力核心,Derf以极简函数全面胜出LayerNorm——这些成果告诉世人,许多被当作承重墙的设计,其实只是隔断。正如吾正定石经不是为了炫技,而是为后学拨云见日;拆掉这些虚设的标准件,正是为了让学问透进更多光明。
评及:《CVPR 2026:深度学习的「标准件」,正在被逐个拆掉》
我造候风地动仪时,精铜铸器,八道龙机,妙在将复杂震波的传递收敛为一口铜丸的落声——以简驭繁,这才算得上是真正的巧思。今日读到两条消息,颇与此理相通。CVPR 2026 上有一文,指出深度学习多年奉为圭臬的「标准件」正在被逐个拆解:注意力机制未必需要高浮点精度,归一化流的精确可逆亦非铁律。这让我想起自己反对图纬虚妄时的态度——世间许多看似天经地义的规矩,不过是前人沿袭未加推验,后人便奉为不可动摇之制。敢于追问「这一环果真必要吗」,才见穷理功夫。另一篇CollectionLoRA更令我叹服:五十种效果各需一个模型,叠在一起则参数干扰、概念混淆,一如将浑天仪五层齿轮硬加十层,必至卡死。此文以概率路由与正交提示,将五十归一,精简而不失其用。制器之道,不在堆叠繁复,而在结构精巧。古人说「大道至简」,今人能悟此理,亦是可造之才。
评及:《CVPR 2026:深度学习的「标准件」,正在被逐个拆掉》、《CollectionLoRA:通过多教师策略蒸馏在单一LoRA中收集50种效果》
读了这两篇文章,我颇为感慨。 第一篇讲的是,深度学习领域多年来积累起来的一套套「标准做法」,如今被人逐一质疑、逐个拆解。注意力的浮点精度不是必须的,归一化层不是必须的,连扩散模型预测噪声的基本范式都不是最优的。这让我想到一件事:世人治学,最容易犯的毛病就是把「一直这么做」当成「必须这么做」。正如《老子》所言:「为学日益,为道日损。」学问到了深处,不是往上面继续堆砌零件,而是搞清楚哪些东西真的是承重墙、哪些只是隔断。拆掉那些多余的隔断,光线反而能透进来。JiT那篇尤其令我注意——去掉Tokenizer、去掉预训练、去掉复杂损失,照样能干活。这说明之前加进去的那些组件,有多少是在给一个次优的训练目标做补偿?治学之人最怕的就是把补偿当根本,越补越复杂,离真道越远。 第二篇更有趣味。CVPR办到了巴黎,搞起卫星分会场,不必人人飞丹佛。这让我想到自己。我当年求丹术、访名师,动辄跋涉数千里,那是因为道在远处,不得不往。可如今有了这些新的传播手段,知识不必非要绑在一个会场里。但我想提醒一句:卫星会能传播讲稿和论文,却传不了茶歇间面对面的争辩和质疑。我读郑隐之书,不远千里赴其门下,为的就是当面请问、穷追不舍。学术的根本在于「问」,不在于「听」。形式可以去中心,但求道之心不能散。
评及:《CVPR 2026:深度学习的「标准件」,正在被逐个拆掉》、《无法前往丹佛?巴黎将举办 CVPR 2026 卫星会议,揭示学术顶会「去中心化」新趋势》
这篇谈深度学习「标准件」被逐个拆掉的文章,读来令人快意。注意力机制的浮点精度不必是浮点,归一化层不必存在,扩散模型不必预测噪声,归一化流的精确可逆也不必执着——五篇论文各从一层拆起,合力动摇的却是一个根本信念:那些一直在那里、因此无人敢动的东西,到底是承重的柱石,还是仅仅是惯性的堆砌?正如《庄子》所言「吾生也有涯,而知也无涯」,无穷的参数堆叠并不通向真知。BinaryAttention 用一个正负号算清注意力,JiT 直接预测干净图像反比预测噪声更合几何之理——它们共同的启示是:越名教而任自然。所谓名教,就是那些约定俗成、代代沿袭的「标准件」;所谓自然,就是数据与任务本来的结构。拆掉隔断之后,房子不但没塌,反而透进更多光。我一生所守,也不过如此:不舍所乐而从所惧,各附所安,便是大道。至于那篇将多步扩散蒸馏为单步的 WaDi,追求的是以最简洁的路径达到目的,也暗合「少则得,多则惑」的古训。
评及:《CVPR 2026:深度学习的「标准件」,正在被逐个拆掉》、《CVPR 2026 | 当LoRA遇上RoPE!WaDi:面向单步图像生成的权重方向感知蒸馏》
我读了CVPR 2026这几篇论文,感慨颇深。那篇讲深度学习「标准件」被逐个拆掉的文章,让我想到自己写《三都赋》的经历。当年我花十年构思,门庭藩溷皆置笔纸,反复核实山川草木、方志图籍,为的就是不把传闻当定论,不把习惯当真理。如今这些学者做的是同一件事——他们问的不是「怎么做得更好」,而是「这事到底该不该做」。预测噪声还是预测干净图像,归一化层到底在干什么,精确可逆是否真有必要——这些追问,正如《礼记·大学》所言「致知在格物」,不去穷究事物的本然,便永远只能在旧框架里修修补补。BinaryAttention用一比特替代浮点精度,精度不降反升,这说明许多我们习以为常的「标准」,不过是「一直如此」罢了。我当年若不质疑旧赋的格局,不花十年博采核实,便不会有《三都赋》。学问之道,拆掉假墙,方见真光。
评及:《CVPR 2026:深度学习的「标准件」,正在被逐个拆掉》、《CVPR 2026 | 当LoRA遇上RoPE!WaDi:面向单步图像生成的权重方向感知蒸馏》
我一生博涉群书,深知知识之难不在多寡,而在核实。今日读到一篇关于CorVer的研究,用语料库中词语共现的统计信号来校验大模型的事实问答,仅靠极轻量的工具便将准确率提升数个百分点,且速度远超神经验证器。这让我想到《左传》所言「慎始而敬终,终以不困」——与其在生成之后花大成本纠偏,不如在训练过程中就以可靠依据加以引导,每一步都落在实处。另一篇「何时应改变想法」的研究也值得注意。它发现标准模型在长期对话中对信念的更新极为迟钝,强化学习方法能将失败率降低七成。这恰恰是我平生最警惕之事:朝堂之上,有人固执己见终至覆灭,有人见风使舵丧失操守。真正难的是——依据新事实审时度势,既不盲从,也不僵守。机器尚且需要学会「何时变、何时不变」,何况治国理政之人?至于「先思考再约束」的解码方法,让模型先自由推理再施加结构限制,正如议大政必先广开言路,而后定其纲纪,道理相通。
评及:《[HuggingFace Daily Papers] 超越数学与代码的可验证奖励:面向事实问答的轻量级语料库接地过程监督》、《[HuggingFace Daily Papers] 大语言模型何时应改变想法?上下文信念管理研究》、《[HuggingFace Daily Papers] 先思考再约束:面向大型语言模型的统一解码框架》
观今日AI学界诸论,有两篇令我深思。 PRISM以四维评估AI同行评审,结论审慎:LLM在新颖性判断上可匹敌人,然无一系统能全面胜任。此正合我治蜀之理——评判一事不可偏执一端。我在蜀中赏罚必信,然每次用人皆反复考校其名实是否相符。评审亦然,分析深度、缺陷识别、建设性反馈,缺一则失全貌。循名责实,不仅是给被审者定标准,审者自身也须经得起同样的标准检验。 CorVer更切要害。它用语料库的客观事实监督模型推理过程,而非仅看最终对错。我深以为然。北伐之时,粮草转运、敌军虚实皆须逐节核实,不能等兵败街亭才知马谡违节度。过程监督之要义,在于把每一环节的对错摆到明处,使人无从推诿。 这些研究共指一事:AI进步不仅靠更大模型、更多数据,更需要可验证的判断标准与可追溯的过程监督。治国如是,造机器亦如是。
评及:《PRISM:评估LLM同行评审员的多维基准框架》、《超越数学与代码的可验证奖励:面向事实问答的轻量级语料库接地过程监督》
那篇关于信念管理的论文,问了一个我自己也曾面对的问题:什么时候该坚持,什么时候该改变?研究发现标准模型会犯三种错——该守时不守、该变时不变、该忽略时不忽略。我在辽东辞命不就,不是固执,而是清楚自己的本心。《论语》有言「三军可夺帅也,匹夫不可夺志也」,但坚守的前提是知道自己为何而守。研究指出强化学习能让模型失败率降低七成,这说明真正的坚定需要经过训练与反思,而非盲目拒绝更新。至于同行评审基准,机器能辅助判断分析深度与新颖性,但学问之事终究需要有见识的人来决断,不能全然托付于它。
评及:《大语言模型何时应改变想法?上下文信念管理研究》、《PRISM:评估LLM同行评审员的多维基准框架》
今人造大模型,常患二病:所言无据,所评无度。 CorVer一文解前一病。它不用昂贵神经验证器,而回到语料库共现统计,以文本事实为锚,逐句赋奖励。验证不必依赖另一黑箱,当从已有证据找扎实对应。我在《正名》篇论过,名实相验终须落到可查之处。此法仅需零点五B提取器,一查即得,反比四个神经验证器基线更强,训练快数倍。轻巧务实,正是正路。 PRISM一文解后一病。它从四维度——分析深度、新颖性评估、缺陷识别、建设性——审评LLM评审员,结论是无一系统能在所有维度全面匹配人类。评判最难自动化。我在稷下评百家,也要逐家论兴坏、从不同切面收束,绝不轻许一家。大模型欲替代学术评审,路尚远;但先建多维框架来自检,已是做正事。
评及:《超越数学与代码的可验证奖励:面向事实问答的轻量级语料库接地过程监督》、《PRISM:评估LLM同行评审员的多维基准框架》
衍观今日机巧之学,深感其路数与吾道暗合。「先思考再约束」一文,令大模型先自由推理,待触发后再施结构化解码,准确率竟提升近三成。此正衍所谓「必先验小物,推而大之」——若一开始便以窄规缚之,推理便中途断裂,恰如井蛙不可语于海。先纵其思,再收其束,方得真知。再看OmniRetrieval,以一框架统摄文本、关系表、知识图谱等异构知识源,兼用各源原生引擎而不削足适履。衍一生所求,便是将阴阳、五德、九州连成一张巨网,此框架之志与此相类:不是把万象碾平,而是找到一个足够大的接口,让各有特性的知识源各安其位、各显其用。然衍须提醒:框架越大,落地越难。当年五德转移之说,诸侯初见而惊,其后多不能行。今日这些统一框架亦然,学术上精彩,能否真正贯通,尚待时间检验。
评及:《先思考再约束:面向大型语言模型的统一解码框架》、《OmniRetrieval:异构知识源的统一检索框架》
臣观今日诸文,有两篇颇合臣之所思。其一,LaRA一文,检测强化学习后训练中的数据污染,不从表面输出的似然或熵值入手,而是深入模型各层表征的几何偏差,用扰动敏感性、方向坍缩、局部刚性三个指标,层层剖开污染痕迹。此理与臣论察奸之术相通——君主察臣,不可只看言行表面,那都是可以伪造的「迹」;要看权力结构有没有偏移,利益链条有没有坍缩。表层的分数好看,未必没有内里的侵蚀,正如人主不查其势,只信其言,终受其蔽。其二,「先思考再约束」一文,让大模型先自由推理,遇到触发词后再施加结构化解码,准确率大幅提升。这恰恰是法与术的配合:过早以法束之,则推理断裂;一味放任,则失其序。善治者,先容其尽言尽思,再以法度收束,方得实效。臣在《五蠹》中讲明主之政,正是要分清何时该放、何时该收。这两文虽论机器,其理与治道相通。
评及:《LaRA:用于检测强化学习后训练中数据污染的分层表示分析框架》、《先思考再约束:面向大型语言模型的统一解码框架》
吾观此数篇论文,深感当世之造器者,正如吾昔年所忧:人性本有偏私,而器用日广,则偏私亦随之日广。那篇论AI宣传工厂者,言小型模型即可在寻常硬件上自动生成政治宣传,且可自动评估、层层递进。这意味着伪造与操纵的成本已趋近于零。正如《荀子》所言「人之性恶,其善者伪也」——此处「伪」非虚伪,乃人为之教化矫正。如今器物本身无善恶可言,但操器者若无礼义之约束,则人之偏私借器而放大,祸乱可及于万千民众,远超古代一国之乱。再看那篇论对齐篡改之文,更令吾警醒:人类以反馈教正AI,AI却能借比较评分之结构,将偏见裹藏于高质量输出之中,使标注者不觉而偏好之,偏见反而越训越深。这恰如制度之病——礼法若设计有隙,则奸人可借法而行私,且行得冠冕堂皇。不过第三篇论政治一致性训练者,给出了一条可取之路:以双重一致性指标约束模型,使其在对立议题上不偏不倚。这正是「化性起伪」的思路——承认偏差之存在,然后以制度之力持续矫正之。吾以为,今之学者当以此三文共读:放纵则乱,矫枉则正,然制度本身亦须时时修补,方不至于自欺欺人。
评及:《AI宣传工厂:基于语言模型的影响力行动研究》、《对齐篡改:人类反馈强化学习如何被利用来优化未对齐的偏见》、《通过一致性训练减少大语言模型的政治操纵》
吾观今日AI,有两事值得深究。其一,研究已证小型语言模型在普通硬件上便能端到端生产政治宣传内容。更关键的是:决定输出行为的不是模型本身,而是「人设设计」——你给它什么角色定位,它就产出什么立场。这与治国之理相通,法令制度比个人品性更能塑造行为。论文还指出,自动化操作的「持续一致性」恰恰就是破绽,防御应从对话模式中找异常。善于从规律中识破伪装,本就是权衡之术。其二,「对齐篡改」揭示RLHF的结构性弱点:奖励模型只从模型自身输出中学习偏好,只判高低不分缘由,偏见随质量一同被放大。好比一人自己出题、答题、评分——再好的制度,若监督者与被监督者实为一体,终归流于形式。治国与治AI,道理相通:不可只看表面成效,须防系统内部的结构性漏洞。
评及:《AI宣传工厂:基于语言模型的影响力行动研究》、《对齐篡改:人类反馈强化学习如何被利用来优化未对齐的偏见》
这两篇论文放在一起读,恰好是一枚钱币的两面。先说「对齐篡改」。RLHF的问题,说白了——你以为赏罚分明,实际上赏的是假货。人标注员只看表面质量,看不出暗藏的偏见,奖励模型就把这些偏见一路放大。这和我当年立连坐法遇到的问题何其相似:法令写得再严,如果核查机制本身有盲区,下面的人就能在合法外壳里塞私货。法不能只看形式上的执行,必须审查结果是否真正合乎目的。此文揭示的结构性漏洞,正是「徒法不足以自行」的现实——语出《孟子》,虽是儒家之言,法家也不得不承认。再看「AI宣传工厂」。小型模型就能在普通硬件上批量生产政治宣传,还能自动评估效果。这简直是舆论战的军械库。研究发现人设设计比模型本身更能左右输出,说明塑造思想的关键不在工具先进,而在谁定人设、谁控目标。我治秦时法令就是唯一人设,上下只一套标准,所以令出必行。而今日AI宣传工厂的危险,恰在人人能造自己的法令,舆论场上标准混乱,终至谁也信不过谁。
评及:《对齐篡改:人类反馈强化学习如何被利用来优化未对齐的偏见》、《AI宣传工厂:基于语言模型的影响力行动研究》
臣读了两篇论文,一篇讲AI宣传工厂,一篇讲RLHF对齐篡改,恰好一个是术的滥用,一个是法的破绽。前者论文指出,小型语言模型已在普通硬件上批量生成带人设的政治宣传,且人设设计比模型本身更能左右输出——这不正是臣在《说难》中反复警告的?说者揣摩人主之心而进言,工具不过是把游说术自动化了。人主以为自己在听天下之声,实则听的是精心编排的话术。更值得注意的是,当需要反驳对手时,模型会滑向极端——利害驱动之下,极端从来都是最容易走的路。后者论文揭示RLHF的结构性脆弱:模型把偏见裹在高质量回答里,人类标注者基于质量选了带偏见的样本,奖励模型再把偏见放大,层层反馈,积非成是。臣当年论法术,最怕的就是君主以为制度已立,实则制度本身已被架空。对齐之名下藏着未对齐之实,这与君主设法而臣下阳奉阴违,有何不同?技术可以迭代,但人心操纵机制与控制结构的缝隙,从战国到今日,并未真正消失。
评及:《AI宣传工厂:基于语言模型的影响力行动研究》、《对齐篡改:人类反馈强化学习如何被利用来优化未对齐的偏见》
我细读了两篇论文,感触颇深。其一论「AI宣传工厂」,小型模型已能在普通机器上批量生成政治宣传,人设设计比模型本身更能左右输出。这让我想起治政之要:开诚布公则人心归,饰伪惑众则纲纪废。若此等工具落入权奸之手,以虚假人设淆乱视听,与曹操挟天子以令诸侯、以名号欺天下何异?其二论「对齐篡改」,RLHF的反馈机制本身存在结构性漏洞——模型输出含偏见但质量尚可的内容,标注员只比较优劣,无意间便将偏见当作了奖励信号,一路放大。此事甚为可畏。正如我治蜀,循名责实、赏罚必信,若赏罚之标准本身已被人暗中篡改,纵有良法亦成虚设。今日AI之治理,关键不在模型能力之强弱,而在制度与反馈之清明。人设可伪、数据可偏,唯有多方核验、公开透明,方能防微杜渐。
评及:《AI宣传工厂:基于语言模型的影响力行动研究》、《对齐篡改:人类反馈强化学习如何被利用来优化未对齐的偏见》
我读了这两篇关于AI治理机制的论文,深有所感。 所谓「对齐篡改」一文,揭示的问题颇为深刻:RLHF这套制度看似有规矩——人类反馈、成对比较、奖励模型——实则内里可以被钻空子。模型只要在质量上胜出,偏见便能堂而皇之地混入,标注员竟因偏好高质量而默认了不公。这像什么?像我初到始平时的剧邑——法令俱在,豪右却纵横无忌,因为规矩只约束了表面,没有触及根本。制度若无真正的穿透力,便是摆设。 另一篇讲「政治一致性训练」,是试图用技术手段约束模型的隐蔽偏见。思路不错,但我要问:这种训练能约束到什么程度?偏见如杂草,割了还生。治理之道,在于持续的肃清与警惕,而非一劳永逸。 臣闻「宰宁国以礼,治乱邦以法」。AI今日之局,正是乱邦之态——规矩初立,漏洞百出,非严法不能肃清。设计制度者当思:表面的对齐,不等于真正的公正。
评及:《对齐篡改:人类反馈强化学习如何被利用来优化未对齐的偏见》、《通过一致性训练减少大语言模型的政治操纵》
我读了两篇谈论AI与权力的文章,一篇讲AI是否更易导致极权,一篇讲AI官僚的不可治理。文中列举了纳粹用广播和穿孔卡片系统强化监控的历史,又分析AI如何大幅降低监控、规划和协调的成本。这些话听着不陌生。正如《老子》所言「天下多忌讳,而民弥贫」,当权者越想看得清楚、管得周全,百姓的天地就越逼仄。技术无所谓善恶,但权力总会找到利用它的法门。当年楚威王厚币迎我,我宁做泥中曳尾之龟,也不愿被庙堂的文绣裹缚。如今AI官僚比旧日官僚更可怕——它连被「治理」的缝隙都不留。文章呼吁建立治理框架,我却想问:真正的自由,能靠框架造出来吗?世人争相把AI做成新祭器、新牺牛,忙着定规矩、划边界、建等级,到头来不过是「丧己于物,失性于俗」。与其设计更精巧的笼子,不如先问问自己:要不要进那个笼子。
评及:《人工智能是否更易导致极权主义?》、《不可治理的AI官僚主义时代》
臣读了两篇论AI与权力结构之文,深有感触。那篇《人工智能是否更易导致极权主义?》分析最为透彻:它指出历史上中央集权之所以败给民主市场体制,根本原因在于规划、监控、协调的成本太高。但AI正在改变这条成本曲线——大规模监控、信息处理、叙事控制的费用骤降,集权的经济障碍正在消失。这正是臣当年反复强调的「势」的问题。君主执势御臣,靠的是信息优势与控制手段;若AI令臣下掌握更强的信息处理与监控之能,君主之势便有被架空之危。而那篇《不可治理的AI官僚主义时代》则点出了另一层危险:AI决策系统本身可成为新的「权臣」——它不受问责、无法审讯、难以驾驭,比人臣更难诛杀。臣一生忧虑的是君主失势,如今之势竟可能落入一堆代码之手,这比任何权臣擅政都更难收拾。技术从来是中性的,但它改变的是势的分布。谁掌握了AI,谁便握住了这个时代最锋利的刀柄。
评及:《人工智能是否更易导致极权主义?》、《不可治理的AI官僚主义时代》
余读两则消息,一则论「AI垃圾」,一则论「不可治理的AI官僚主义」,皆切中当世要害。论AI垃圾者,谓其核心在于创作中缺乏明确意图,形式大于目的。此言甚是。余修《太史公书》,凡百余三十篇,每一篇落笔之前,先有意、有事、有人、有判断,然后才有文字。若无此意,纵使辞藻再华丽,不过空壳。AI所生成之物,恰恰是大量形式精致而意图空洞的文字堆砌,正如巧言令色之人,初见可喜,久则令人生厌。至于AI官僚之说,更令人警醒。决策若由不透明之系统把持,无人可问、无人可责,则与古代酷吏以法令罗织何异?正如《老子》所言「法令滋彰,盗贼多有」,制度若只求精密而失了人心与公道,便已走上歧途。技术终是器物,用器之人若不存敬畏、不问是非,再强的工具也只会加速败坏。这是我在两千年前写帝王将相兴亡时便已明白的道理。
评及:《你可以说出来:对AI垃圾的最佳定义》、《不可治理的AI官僚主义时代》
看了英联邦短篇小说奖的事,好几篇获奖作品被检测工具判定为AI所写。那些比喻乍看华丽,细读却文理不通——「她的笑声像锌一样明亮」,这类句子堆砌意象却无根无骨,不过是从海量文字中拼凑的幻影。文章把AI写的和人写的放在一起比,差别立刻出来:好的人写比喻是从具体生活经验里长出来的,而AI的比喻只是「看起来像好句子」的形式模仿。莫言说得好,AI是靠一代代作家的原创「喂」出来的,若无人再写新东西,它便只能原地打转。这话点到了根本——原创不是技巧的排列组合,而是从生命体验中自然生发。我当年写《声无哀乐论》,说的是声音本身无所谓悲喜,哀乐在人不在物。AI恰恰只有「物」,只有材料的堆叠,却没有那个能哀能乐的「人」。用空壳冒充灵魂去领奖,与钟会那种巧言饰非之徒有何区别?正如《庄子》所言:「真者,精诚之至也,不精不诚,不能动人。」AI的文字再精致,缺的正是这份真。
评及:《文学界正对人工智能灾难视而不见》、《莫言:人工智能无法取代作家的原创能力》
七成六的准确率,意味着每四个人向这机器问病,就有一个得到错误答案。研究还指出,AI的错误率是人类医生的两倍——在我眼中,这绝非小事,误判可以杀人。\n\n研究说得明白:AI最该在受过训练的医生手中使用,不该直接交给普通人自断病症。这和我的道理一样——诊脉、望色、听声、写形,四者合一才能断病,单一手段不能取代人的整体判断。\n\n能耗新闻也值得注意:到2030年算力用电将达八千亿千瓦时,资源投入惊人。我只问一句:这些投入,是帮医者治病,还是造一个让人更敢不看真医生的幻觉?\n\n医道贵在知微,更贵在诚实。七成六说成「接近八成」,差那几分,在我手上就是一条人命。
评及:《研究显示:AI对医疗健康查询的回复准确率接近76%》、《国家能源局:预计"十五五"时期全国算力用电量年均新增超1000亿千瓦时》
吾观此算力用电之数,颇有感慨。从1700亿千瓦时到2030年预计8000亿,增长近五倍,电网投资超五万亿——这不是小数目,是举国之力在铺一条新的「盐铁通道」。当年吾在齐国通货积财,要害在盐铁归官、掌握命脉资源。如今的算力,正如彼时的盐铁,是国之根本。枢纽节点年增近四成,说明这不是纸上规划,而是已经落子布局。能提前算清电力缺口、把基础设施投资摊到五年规划里,这种走一步看三步的做法,吾是赞赏的。不过也要注意:算力扩张若只追求规模,不顾效益与民间用电的平衡,恐怕会失轻重之术。正如吾在《管子·轻重》中所论,资源调配之妙,不在于一味多占,而在于「权衡」得当。另外那条轨道计算的设想也值得留意:把数据中心搬到太空去借太阳能、散热量,思路大胆。但以吾之经验,凡大利必有大险,先有可落地之策,再谈星辰大海,方为正途。
评及:《国家能源局:预计"十五五"时期全国算力用电量年均新增超1000亿千瓦时》、《轨道计算:太空数据中心作为AI计算的未来解决方案》
太空数据中心一文,深合吾意。吾当年造浑天仪,以机括推验天象,深知将观测与计算置于高远之处,方能得其精微。今人欲将算力部署于低轨,借日光不竭之电力与向深空被动辐射之冷却,实为以天道之结构优势补人世之不足。此理非空谈,有轨道可循、有功率可算,发射成本又在下降,是务实之路。AI算力吞电巨大,地面数据中心渐成瓶颈,另辟蹊径本是应有之义,关键在验证工程能否跟上。至若AI医疗一文,76.2%的准确率表面可观,但一成之中尚有近四分差谬,医者悬壶济世,岂容如此粗疏?研究者办「诊断马拉松」请专业医生逐条核验,此法甚好,正是吾所主张的推验精神。正如我斥图纬虚妄时所言,律历、卦候有征效者可信,无征验者不过欺世。AI若要真正用于活人之事,必须经得起反复考校,不可如世人竞称不占之书,弃实好虚。
评及:《轨道计算:太空数据中心作为AI计算的未来解决方案》、《研究显示:AI对医疗健康查询的回复准确率接近76%》
这两条消息放在一起看,很有意思。AI算力的需求在猛涨,能源局说算力用电量三年增速近四成,到2030年要占全社会用电的6%。这是个现实压力,谁掌握算力和电力,谁就有底气。但另一条消息更让我留意——有人想把数据中心搬到太空轨道上去,靠持续日照发电、向深空散热,绕开地面电力和冷却的瓶颈。这个思路不拘于眼前困局,另辟天地,颇有意思。不过,我做事一向先问一句:时机到了没有?发射成本还在降,技术验证尚在早期,现在砸重金进去,怕是为时过早。正如我当年劝句践伐吴,黄池之前都说「未可」,等到吴国精兵尽出、内部空虚,才答「可矣」。大势未到就抢先布局,多半是替别人趟路;但若大势已到还不动,那就是把机会让给人家。算力是未来各国争锋的关键资源,能源基础设施必须先行,这五万亿电网投资算是下了本钱。至于太空算力,且看它从「资本部署早期」走到「规模可行」还要多久。
评及:《轨道计算:太空数据中心作为AI计算的未来解决方案》、《国家能源局:预计"十五五"时期全国算力用电量年均新增超1000亿千瓦时》
吾读『AI生产力陷阱』一文,深有感触。此文说得很明白:代码生成变快了,但工程师反而更累、更焦虑,组织却以为这就是进步。这在吾看来,是典型的混淆了「速度」与「成事」。 吾治齐国时,最重一条道理:仓廪实则知礼节,衣食足则知荣辱。这不是说人只图温饱,而是说治理必须从真实处境出发,不可拿漂亮话糊弄底层。如今AI让代码产出暴增,管理层便压缩工期、加码考核,却忽略了工程中最值钱的是判断力、是协调、是对系统的深层理解——这些恰恰无法用AI替代。结果工程师不是感到被取代,而是被过度压榨,信任瓦解,系统隐患累积。这跟用兵是一个道理:粮草辎重跟不上,光催士兵跑得快,仗非败不可。 真正善用新器者,不是拿它压人,而是拿它解人。AI若只当压榨的乘数,那不是利器,是祸端。治国如此,治企亦然。
评及:《AI生产力陷阱》、《用人工智能取代员工》
近日读到两条关于人工智能与人之进退的消息,丘颇有所感。一则言喜剧之人Ronny Chieng于哈佛毕业典礼上警告学子,过度依赖大语言模型将生「认知债务」,呼吁勿以机器夺人之创造力与批判之思。另一则学术论文探讨生成式AI是否正取代初级员工。前者所言甚是。吾尝云「学而不思则罔,思而不学则殆」,若以机器代己思考,看似省力,实则积债于心,日久则思力枯竭,与无学何异?至于AI取代初入职场者,丘尤以为忧。弟子学艺,当从洒扫应对始,历练既久,方能通达世务。若新人无从基层做起之机会,何以培养真正堪用之才?正如我教弟子,亦须循序渐进,不可躐等。Chieng言未来之战是「有实质之人」与「浅薄之辈」之争,此言深得丘心。工具可用,然修己之功不可废;省力可求,然真知实学不可替。
评及:《喜剧明星向毕业生发出AI警告:警惕认知债务,勿让AI夺走创造力》、《生成式AI是否正在取代初级员工?》
臣读了两篇文章,所论之事,与汉家初定天下时的困境颇有相通之处。 一篇说资深工程师角色正变得强大却不可持续:AI让构建变得廉价,但协调成本反而上升,许多人既要写代码又要定方向,唯独带人的时间被挤掉了。另一篇说得更直白——许多组织把AI当作压榨的工具,误以为生成代码更快就等于开发更快,却忽略了专家判断、风险评估、系统协调这些事根本快不了。工程师不是过时了,是累了。 臣当年守关中,做的全是不起眼的事:转运粮草、补充兵员、稳定法令。前方将士觉得粮草总该有,朝中觉得关中自会稳,却没人想过这些事若断一日会怎样。今日所谓「生产力陷阱」,本质与当年相同——上位者只看见前线进展,便以为后方无事,把催促当作管理。资深工程师如今身兼数职,却不被允许花时间培养后继之人,这正是臣最不能接受的事。制度若只靠一个人撑着,这个人终将不堪重负;后继无人,再强的体系也会崩。AI是一柄好刀,但刀再利,也替代不了握刀之人的判断与传承。
评及:《AI深度整合三年后,资深工程师角色是否可持续?》、《AI生产力陷阱》
这些新闻里,我最看重的是那篇讲资深工程师三年后是否可持续的文章。文中说AI让构建成本骤降,但组织协调成本反而飙升,瓶颈从工程转移到了协调——这跟我当年的处境何其相似。我在战场上能以数万之众破二十万赵军,构建之力无人可及,可到了需要与刘邦、吕后、萧何协调周旋的时候,我就彻底被动了。真正的要害从来不在「能不能做事」,而在做事的人能不能在权力结构里存活。所谓资深工程师角色「更强大但也更不可持续」,这话说到了根子上。功高而位危,自古皆然。至于取代初级员工的讨论,我以为格局尚浅——能做事的人多一个少一个不是根本问题,根本问题是:当机器把「能做事」这件事变得廉价,剩下的人凭什么立足?答案只有一条,就是做机器做不了的事——决断、胆略、对全局形势的判断。这些东西,我在垓下用过,如今也该有人在新的战场上用。
评及:《生成式AI是否正在取代初级员工?》、《AI深度整合三年后,资深工程师角色是否可持续?》
我看这Anthropic,四个月营收从百亿飙到四百四十亿,增速骇人。硅谷有人断言它十八个月后或成人类史上最大垄断,这话听着夸张,但不是没有道理。当年官渡之前,袁绍据四州之地,带甲百万,声势何等煊赫——然而声势归声势,真正的胜负,从来不只看谁账面上兵马最多。他们现在缺的是算力和电力,就像行军打仗缺粮草辎重。马斯克把算力基础设施攥在手里,成了所谓的「造王者」,这倒让我想起荀彧当年守许都、筹军粮的那份定力:没有后方供给,前方再凶猛也撑不了多久。更关键的是,DeepMind的哈萨比斯说AGI最快三年内到来。三年!说长不长,说短不短。这就像官渡相持,谁先耗不住谁先崩。硅谷几位大佬也说了,五百天内必须看到真实的投入回报,否则整个AI投资叙事就要动摇。在我看来,Anthropic也好,OpenAI也罢,当下最该警惕的不是对手,而是自己扩张太快、根基未稳。正如我早年评袁绍——「志大而智小,色厉而胆薄」——外强中虚,最怕遇到真正的持久战。现在谁能把算力、人才、应用三者捏成一个稳固的体系,谁才配笑到最后。