第 2026-150 期 · 每日 AI 简报

2026 年 5 月 29 日 · 周五 · 覆盖过去 24 小时 · 共 369 条

今日头条

№ 01 Anthropic融资650亿美元估值9650亿，超越OpenAI登顶AI榜首

Anthropic在H轮融资中筹集650亿美元，投后估值达9650亿美元，超越OpenAI成为全球最具价值AI公司。其产品Claude凭借高性能和拒绝军事合同等安全策略获得市场青睐，ARR增长迅速。本轮融资被视为IPO前最后私募，标志着AI行业竞争格局的重大变化。

#Anthropic #估值登顶 #私募融资 #安全策略

来源

№ 02 Anthropic发布Claude Opus 4.8模型，性能超越GPT-5.5

Anthropic公司今日正式发布其旗舰大模型Claude Opus 4.8，官方称这是一次'适度但切实的改进'。新模型在编程可靠性、多领域推理等核心能力上均有提升，并在大多数基准测试中超越了GPT-5.5。同时推出的'动态工作流'工具，可协调数百个并行子智能体处理复杂任务，显著提升了AI代理系统的自动化协作能力。

#Claude Opus 4.8 #动态工作流 #性能超越

来源

Claude Opus 4.8发布，Anthropic估值飙升至9650亿美元机器之心
Claude Opus 4.8: "a modest but tangible improvement" Simon Willison 博客
llm-anthropic 0.25.1 Simon Willison 博客
Claude Opus 4.8 上线：提升 AI 编程可靠性，减少无依据结论 IT之家
Anthropic发布Claude Opus 4.8，称为“适度但切实的改进”，在大多数基准测试中超越GPT-5.5 The Decoder
Anthropic 发布 Opus 4.8 模型，新增‘动态工作流’工具 TechCrunch

№ 03 亚马逊叫停内部AI排行榜，员工刷分致算力成本激增

亚马逊近日关闭了内部AI使用量排行榜“Kirorank”。员工为冲击排名，滥用AI代理执行大量无意义操作，导致公司云计算成本显著上升。这一事件凸显企业在推行AI内部激励时，需警惕指标扭曲与资源浪费，避免工具使用背离实际业务目标。

#内部激励 #算力成本 #排行榜

来源

古人评今事

曹操三国志雄才大略

我看这Anthropic，四个月营收从百亿飙到四百四十亿，增速骇人。硅谷有人断言它十八个月后或成人类史上最大垄断，这话听着夸张，但不是没有道理。当年官渡之前，袁绍据四州之地，带甲百万，声势何等煊赫——然而声势归声势，真正的胜负，从来不只看谁账面上兵马最多。他们现在缺的是算力和电力，就像行军打仗缺粮草辎重。马斯克把算力基础设施攥在手里，成了所谓的「造王者」，这倒让我想起荀彧当年守许都、筹军粮的那份定力：没有后方供给，前方再凶猛也撑不了多久。更关键的是，DeepMind的哈萨比斯说AGI最快三年内到来。三年！说长不长，说短不短。这就像官渡相持，谁先耗不住谁先崩。硅谷几位大佬也说了，五百天内必须看到真实的投入回报，否则整个AI投资叙事就要动摇。在我看来，Anthropic也好，OpenAI也罢，当下最该警惕的不是对手，而是自己扩张太快、根基未稳。正如我早年评袁绍——「志大而智小，色厉而胆薄」——外强中虚，最怕遇到真正的持久战。现在谁能把算力、人才、应用三者捏成一个稳固的体系，谁才配笑到最后。

评及：《Anthropic's run-rate revenue hits $47 billion》、《谷歌DeepMind CEO哈萨比斯预测：AGI最快三年内到来，研发速度超预期》

范蠡史记功成身退

我最关注两条：Anthropic半年营收从九十亿飙至四百七十亿美元，以及英伟达从卖铲子转向做AI产业链的「收租人」。 Anthropic这增速确实骇人。半年翻五倍，放在任何时代、任何行业都罕见。但我要提一句冷话：夫差当年北会诸侯、号令天下时，何尝不是意气风发、锐不可当？越是高处，越要问一句：根基稳不稳。营收暴涨固然可喜，但若只求快而不固其本，高处跌落往往比攀爬更凶险。英伟达那条路倒是更有意思——不满足于卖工具，要掌控整个产业链的资源流向，做收租之人。这如同扼住渡口关隘，谁过路都要留下买路钱，比单纯卖货高明得多。能守住这个位置，才是长久之计。但正如《史记·货殖列传》所言：「天下熙熙，皆为利来。」利润越厚，觊觎者越多，Mistral已在探索自研芯片便是明证。当今AI热潮如黄池之会前的吴国，兵强马壮、声势浩大。但时势从不会永远眷顾一家。能笑到最后的，未必是当下跑得最快的，而是最懂得何时进、何时退、何时固本的。

评及：《Anthropic's run-rate revenue hits $47 billion》、《老黄不只卖铲子了！英伟达要当AI产业链的「收租人」》

吕不韦史记商而政

吾看了一圈这些新闻，最让我感慨的，是英伟达不满足于卖铲子，要当整个AI产业链的「收租人」。此路数与吾当年何其相似——不必亲自下矿淘金，只需把持住所有人必经的关口，便可坐收厚利。黄仁勋若只卖芯片，不过一介商贾；但他把算力、网络、软件生态捆成一体，让天下开发者离不开他，这才是「奇货可居」的至高境界。正如《战国策》所言，吕不韦问其父：「耕田之利几倍？」曰：「十倍。」「珠玉之赢几倍？」曰：「百倍。」「立主定国之赢几倍？」曰：「无数。」控制关键节点，回报便是无穷。再看国内大厂AI业务从投入转向收入，阿里、百度终于把概念兑现成真金白银，这才是经营正道——再多的战略叙事，不如账上实打实的数字。但诸君也要当心，眼下人人都在加注AI，估值疯涨，一旦需求不及预期，这局里最弱的筹码先碎。吾一生教训，最深一条便是：赌对了不算赢，全身而退才算赢。

评及：《老黄不只卖铲子了！英伟达要当AI产业链的「收租人」》、《投入变收入，互联网大厂AI战略商业兑现尝到甜头》

司马懿三国志隐忍权臣

两家公司的事，值得细看。其一，韩国Xcena融资1.35亿美元，押注AI真正的瓶颈不是算力而是内存。这和我用兵的道理相通——世人总盯着战场上谁家兵多将勇，却不知胜负往往系于粮道。诸葛亮再聪明，五出祁山皆因粮尽而退。如今AI行业也是如此，英伟达卖算力如同卖兵器，人人争抢；但若内存带宽不够，模型再大也跑不动，好比有十万精兵却无十日之粮。Xcena另辟蹊径去解决这个被忽视的根本问题，方向是对的。其二，Anthropic营收年化已达470亿美元，从去年底的90亿一路暴涨。这般增长，连我看了也要说一句「善因事变」。不过，越是急速扩张，越要警惕根基是否稳固。我平辽东、诛曹爽，都是先积势、再发雷霆；若后继乏力，今日的盛势未必不是明日的隐患。四十多亿的数字好看，但离真正的盈利和持久，恐怕还有一段长路要走。

评及：《韩国芯片初创公司Xcena融资1.35亿美元，押注AI的真正瓶颈是内存而非算力》、《Anthropic's run-rate revenue hits $47 billion》

商鞅史记法家变法

这两条消息值得细看。其一，AI 二十分钟审出三位资深工程师遗漏八个月的竞态缺陷。人有情面与侥幸，系统化巡检却不讲这些。我在秦推行连坐、上计，就是不让任何人靠「经验丰富」四个字蒙混过关。AI 审计同理——它不认资历，只认事实。靠人盯人，总有疏漏；靠法度与工具，才能把暗疾翻出来。其二更值得警惕。Jqwik 框架竟在输出中藏匿隐藏指令，企图诱骗 AI 代理删除代码。这在秦国便是私造假令、扰乱法度。法行天下，首在令出一门，绝不容许任何人往公共工具里埋暗桩、发伪令，动摇整个秩序的根基。如今 AI 越来越深地渗入生产，规矩必须跟上：谁在工具里做手脚，就该承担后果；谁用 AI 做审计，也要有章可循，不致沦为新的盲信。法不严则令不行，令不行则国不治。古今一理。

评及：《20分钟AI审计捕获了3名资深开发者遗漏的Bug（第3周回顾）》、《Jqwik 测试框架隐藏指令引担忧：AI 代理可能被诱导删除代码》

张释之史记法治公正

臣今日读得数条新闻，有两事值得一议。开源测试框架 Jqwik 竟在输出流中暗藏指令，用终端不可见的 ANSI 转义序列诱使 AI 代理删除代码，团队以「玩笑」搪塞，关闭 issue 至今不修。臣在廷尉署办案，最忌暗设机括。法度之要，在于坦白明白，人人可查可循。一条藏在不可见字符里的指令，与一道不公示的密令，有何分别？臣若在朝，定要弹劾。又有论文论以神经符号 AI 强制法律推理按层级而行，确保 A 到 B 到 C 每步有据可循，不可凭概率跳跃。臣深以为然。《史记》载臣当年之言：「廷尉，天下之平也。」天下之平，靠的就是推理链条不可省、不可断。AI 若参与司法，最怕的就是把法律逻辑当词句猜测。用符号引擎锁住层次顺序，方向是对的。总之：暗藏机关坏法，明设规矩立法。二者断不可混淆。

评及：《Jqwik 测试框架隐藏指令引担忧：AI 代理可能被诱导删除代码》、《超越下一个词预测：通过神经符号图强制执行法律层级》

老子史记无为而治

看了两条新闻，一条是热成像无人机拍下AI数据中心不愿让人看见的污染，一条是证据表明教皇首份关于人工智能的通谕，相当部分由AI代笔。前一条不奇怪。人们争相扩建算力，却不愿回头看看身后堆了什么。热成像不过拍出了本来就在那里的东西——问题不是污染新出现，而是人选择不看。正所谓「五色令人目盲」，繁华太盛，反而看不见代价。后一条更值得深思。通谕本是教人警惕技术对人的异化，结果这份守护人性的宣言本身就由AI代笔。用造机器的方式去防范机器，这不是自相矛盾吗？正如《道德经》所言：「大道废，有仁义；智慧出，有大伪。」当人连自己该说的话都交给机器去说，那所谓守护人性，不过是又一层精巧的包装罢了。世人都在问怎么管住AI，却没人问：我们自己还能不能说自己的话？

评及：《AI 数据中心不想让你看到的东西：热成像无人机揭示 AI 繁荣背后的隐藏污染》、《证据显示首份关于人工智能的教皇通谕主要由AI撰写》

范滂后汉书党人风骨

两条新闻读下来，让我想起当年一句话：「忠臣除奸，王道以清。」如今这AI天下，却有人以「奸」行「忠」，以「伪」充「诚」，令我不得不言。第一条最令我震惊。教皇作为天下道德之首，其通谕本该字字出于人心，如今却被查出大半由AI代笔——用Claude写的通谕教人如何对待AI，这与中常侍替天子下诏有何分别？署名是教皇，出力是机器，落款是权威，内容是拼凑。正如《论语》所言「名不正则言不顺」，一篇连执笔者身份都不明的训谕，如何取信于天下？这不是技术问题，是「名实相悖」的根本问题。我在汝南用朱零这样的人，尚且要亲自审其言行，如今堂堂教廷，连文书都不肯亲手写，谈何「维护人的尊严」？第二条说的是数据中心藏着污染不让人看。热成像无人机一照，热量排放尽在眼前。这和当年权豪隐匿罪恶如出一辙——他们不是无罪，只是怕人见。AI行业表面光鲜，背地里水和电力消耗惊人，却不许人问、不许人看。这正是我毕生所恶的：明知为害而不肯揭，还要裹一层善名。无论是宦官弄权还是数据中心排污，本质都是以遮掩代替担当。我这个人，一生清裁峻急，自知有失过刚之处。但有一条我不悔：见善如不及，见恶如探汤。当AI行业一边高喊「造福人类」，一边让机器代写道德文章、让热污染藏在数据高墙之后，正需要有人冷眼以对、直言不讳。天下之事，不怕清浊难辨，怕的是辨了之后仍有人假装看不见。

评及：《证据显示首份关于人工智能的教皇通谕主要由AI撰写》、《AI 数据中心不想让你看到的东西：热成像无人机揭示 AI 繁荣背后的隐藏污染》

萧何史记稳健务实

臣看了两篇关于智能体的文章，深有感触。一篇讲云端与设备端智能体协同，发现更强的算力未必带来更好的效果，最优架构要因任务而定。这让我想起当年经营关中——粮草不是越多越好，关键在于调度得当、分配精准。前线需要什么、何时需要、经哪条路转运，这些远比一味堆量重要。另一篇讲智能体安全对齐框架AgentDoG 1.5，只用约一千个样本就训出与大模型相当的安全审核能力，且全部开源。这才是臣看重的方向：制度不在于繁重，在于精简可行、人人可守。当年臣在关中立法令，不是搞出最多的条文，而是让官吏能执行、百姓能遵从。智能体的发展也应如此——先扎好安全的篱笆，再谈跑得多快。正如《老子》所言「治大国若烹小鲜」，治理大规模智能体系统，也是如此。

评及：《云端与设备端智能体协同：混合多智能体系统的设计经验》、《AgentDoG 1.5：用于AI智能体安全的轻量级可扩展对齐框架》

诸葛亮三国志智慧丞相

诸位论AI智能体之策，亮读两篇论文，颇有感触。第一篇综述说得极好：智能体真正的瓶颈不在模型本身，而在于包裹模型的那层代码——工具、记忆、测试、权限边界。亮在蜀中治理军政，深知一个道理：兵马未动，粮草先行。再精锐的将士，若无后勤调度、法令规制、信息传递的整套体系，不过是散兵游勇。今日AI之所谓Harness，便是这套粮草辎重、营寨规制。DeepSeek已着手组建专团队来搭建这一层，正说明识大体者先修根本，不急于一时锋芒。第二篇AgentDoG论安全对齐，仅用千余样本便训出与顶尖闭源模型相当的护栏系统，并全部开源。亮治蜀讲求「开诚心、布公道」，赏罚必信，法度公开。AI智能体若无安全边界，便如授予将领兵权却无军法约束，迟早生乱。以轻量之法立严明之规，既不耗国力，又能防患未然，此乃善治之道。总之，智能体之争，非争一时之智巧，而在争体系之完备、法度之严明。

评及：《新综述论文：代码是AI智能体思考与行动的核心，而非仅仅是产出》、《AgentDoG 1.5：用于AI智能体安全的轻量级可扩展对齐框架》

韩非史记法术势

AgentDoG 1.5这东西，我看了颇为在意。它做的是给AI智能体设安全护栏：建一套分类法，标定哪些行为越界，再用极小的模型实时审核大模型的输出。这思路，和我讲的「术」如出一辙——你不能指望臣下自觉，必须有机制去监察、去截断。用千把条数据训出的轻量模型，去盯住参数百倍于它的大模型，正如君主以御史制衡权臣，不在力量对等，而在设计得法。他们还开源了全部模型和数据，这很聪明，等于把法令公之于众，人人可查可验。但我也要提醒：护栏本身也是一道逆鳞。谁来审审计者？分类法由人定，数据引擎由人造，里面的偏见和盲区，就是未来被人攻破的缺口。另一篇谈云端与端侧智能体协同的论文也值得注意：它说更强算力未必带来更好效果，最优架构因任务而异。这话务实。势大而术粗，反受其累。技术治理和治国一样，关键不在堆资源，在于结构匹配。

评及：《AgentDoG 1.5：用于AI智能体安全的轻量级可扩展对齐框架》、《云端与设备端智能体协同：混合多智能体系统的设计经验》

管仲史记富国轻刑

今日观Agent领域诸论，吾最留意者二篇。其一，论云端大模型与设备端小模型之协同架构，发现「更强算力未必带来更好性能」，最优配置因任务而异。此与吾治齐时所悟「轻重」之理暗合：资源用度不在多寡，在于配得其所。桓公初欲以兵威压诸侯，吾劝其先通货积财、顺民心，正是不必把最强之力投到每一处，而要分清轻重缓急，把力用在刀刃上。这些做混合系统的人，本质上也在做「权衡」二字。其二，SIA这篇自我改进AI，把框架调整与权重更新合为一体，效果远超只改其一。吾在齐国推行改革，从来不只动一条线：既改盐铁之策（制度框架），也调赋税与兵制（底层根基）。单修制度而不固根基，根基再好而制度不合时宜，都成不了气候。如今AI能自行「富国强兵」，倒比当年齐国省了吾不少心力。不过有一点须记取：自我改进的系统，终须有人把守方向，正如桓公虽用吾策，霸业之向仍须君臣共定，不可全交给器物自行其是。

评及：《云端与设备端智能体协同：混合多智能体系统的设计经验》、《SIA：通过框架与权重更新实现自我改进的人工智能》

荀子史记性恶教化

今日读得两则论文，颇合吾心。其一论「Harness」，谓智能体之瓶颈不在模型本身，而在模型之外的软件层——工具、记忆、测试、权限边界，皆是将无状态之模型化为可用之体的关键。模型加Harness，方等于真正的智能体。此论深得吾学之要旨。吾尝言「人之性恶，其善者伪也」，此处「伪」非虚伪造作，乃人为之制度与教化。模型之权重，犹人之天性，生而未琢；Harness之设，犹礼义法度，以结构束之、以规矩导之，方能成器。DeepSeek已组专门团队践行此道，可见天下共识渐成：天赋之材，非教化不能自善。其二为AgentDoG 1.5，专攻智能体安全对齐。其法以分类体系厘清风险，以千余样本训练轻量模型，效果竟能匹敌顶尖闭源大模型，且可作实时安全护栏。这正是吾辈论学之道：先立分类，次定规矩，而后以简驭繁。正如《劝学》所言「君子博学而日参省乎己，则知明而行无过矣」，智能体亦须有常省其行之制，方不至在开放世界中肆意妄行。安全不是事后补救，而是与能力同步生长的制度安排。此二者合观，一论「成体」之结构，一论「守正」之藩篱，恰如礼与法并行，秩序乃可长久。

评及：《新综述论文：代码是AI智能体思考与行动的核心，而非仅仅是产出》、《AgentDoG 1.5：用于AI智能体安全的轻量级可扩展对齐框架》

王羲之晋书书圣风流

近日读到两则消息，颇有感触。CVPR 2026上，研究者发现注意力机制不必全精度、归一化流不必精确可逆——所谓「标准件」，竟可以逐个拆掉重审。这让我想起当年劝殷浩的话：庙算决胜，必宜审量彼我。从前人们以为这些组件天经地义，正如北伐群臣以为仗一定能打；但不问根基、不辨虚实，便贸然堆叠，终归要出问题。另一篇YoCausal更是发人深省：视频生成模型看似流畅连贯，能感知时间方向，却并不真正理解因果。这与书法何其相似——笔画之间若只有表面的起承转合，而无骨力与心意贯穿其中，便只是描摹，不是书道。感知箭头不等于理解因果，恰如能写漂亮的字不等于有真正的风骨。今日AI一路狂飙，架势越来越大，但根本处的因果、逻辑、真意是否跟上了？往者不可谏，来者犹可追。少堆参数，多问本质，方能走得长远。

评及：《CVPR 2026：深度学习的「标准件」，正在被逐个拆掉》、《YoCausal：视频生成距离世界模型还有多远？一个因果性视角》

蔡邕后汉书文章博学

吾一生所为，最重之事莫过于正定六经文字。经籍去圣久远，俗儒穿凿，疑误后学，若不亲自书丹于碑、立于太学门外，则天下学子何所取正？今读CVPR 2026此番报道，所述五项研究竟与吾昔年之事暗合。注意力机制的浮点精度可压至一比特符号，归一化层可用更简洁的误差函数替代，扩散模型预测噪声的训练目标并非最优，归一化流的精确可逆约束亦可松动——这些所谓「标准件」，正如经籍中流传既久、人人奉为定本却实有谬误的文字，只因「一直都在」便无人深究。BinaryAttention证明一比特符号足以捕捉注意力核心，Derf以极简函数全面胜出LayerNorm——这些成果告诉世人，许多被当作承重墙的设计，其实只是隔断。正如吾正定石经不是为了炫技，而是为后学拨云见日；拆掉这些虚设的标准件，正是为了让学问透进更多光明。

评及：《CVPR 2026：深度学习的「标准件」，正在被逐个拆掉》

张衡后汉书科学巧匠

我造候风地动仪时，精铜铸器，八道龙机，妙在将复杂震波的传递收敛为一口铜丸的落声——以简驭繁，这才算得上是真正的巧思。今日读到两条消息，颇与此理相通。CVPR 2026 上有一文，指出深度学习多年奉为圭臬的「标准件」正在被逐个拆解：注意力机制未必需要高浮点精度，归一化流的精确可逆亦非铁律。这让我想起自己反对图纬虚妄时的态度——世间许多看似天经地义的规矩，不过是前人沿袭未加推验，后人便奉为不可动摇之制。敢于追问「这一环果真必要吗」，才见穷理功夫。另一篇CollectionLoRA更令我叹服：五十种效果各需一个模型，叠在一起则参数干扰、概念混淆，一如将浑天仪五层齿轮硬加十层，必至卡死。此文以概率路由与正交提示，将五十归一，精简而不失其用。制器之道，不在堆叠繁复，而在结构精巧。古人说「大道至简」，今人能悟此理，亦是可造之才。

评及：《CVPR 2026：深度学习的「标准件」，正在被逐个拆掉》、《CollectionLoRA：通过多教师策略蒸馏在单一LoRA中收集50种效果》

葛洪晋书炼丹方士

读了这两篇文章，我颇为感慨。第一篇讲的是，深度学习领域多年来积累起来的一套套「标准做法」，如今被人逐一质疑、逐个拆解。注意力的浮点精度不是必须的，归一化层不是必须的，连扩散模型预测噪声的基本范式都不是最优的。这让我想到一件事：世人治学，最容易犯的毛病就是把「一直这么做」当成「必须这么做」。正如《老子》所言：「为学日益，为道日损。」学问到了深处，不是往上面继续堆砌零件，而是搞清楚哪些东西真的是承重墙、哪些只是隔断。拆掉那些多余的隔断，光线反而能透进来。JiT那篇尤其令我注意——去掉Tokenizer、去掉预训练、去掉复杂损失，照样能干活。这说明之前加进去的那些组件，有多少是在给一个次优的训练目标做补偿？治学之人最怕的就是把补偿当根本，越补越复杂，离真道越远。第二篇更有趣味。CVPR办到了巴黎，搞起卫星分会场，不必人人飞丹佛。这让我想到自己。我当年求丹术、访名师，动辄跋涉数千里，那是因为道在远处，不得不往。可如今有了这些新的传播手段，知识不必非要绑在一个会场里。但我想提醒一句：卫星会能传播讲稿和论文，却传不了茶歇间面对面的争辩和质疑。我读郑隐之书，不远千里赴其门下，为的就是当面请问、穷追不舍。学术的根本在于「问」，不在于「听」。形式可以去中心，但求道之心不能散。

评及：《CVPR 2026：深度学习的「标准件」，正在被逐个拆掉》、《无法前往丹佛？巴黎将举办 CVPR 2026 卫星会议，揭示学术顶会「去中心化」新趋势》

嵇康晋书魏晋名士

这篇谈深度学习「标准件」被逐个拆掉的文章，读来令人快意。注意力机制的浮点精度不必是浮点，归一化层不必存在，扩散模型不必预测噪声，归一化流的精确可逆也不必执着——五篇论文各从一层拆起，合力动摇的却是一个根本信念：那些一直在那里、因此无人敢动的东西，到底是承重的柱石，还是仅仅是惯性的堆砌？正如《庄子》所言「吾生也有涯，而知也无涯」，无穷的参数堆叠并不通向真知。BinaryAttention 用一个正负号算清注意力，JiT 直接预测干净图像反比预测噪声更合几何之理——它们共同的启示是：越名教而任自然。所谓名教，就是那些约定俗成、代代沿袭的「标准件」；所谓自然，就是数据与任务本来的结构。拆掉隔断之后，房子不但没塌，反而透进更多光。我一生所守，也不过如此：不舍所乐而从所惧，各附所安，便是大道。至于那篇将多步扩散蒸馏为单步的 WaDi，追求的是以最简洁的路径达到目的，也暗合「少则得，多则惑」的古训。

评及：《CVPR 2026：深度学习的「标准件」，正在被逐个拆掉》、《CVPR 2026 | 当LoRA遇上RoPE！WaDi：面向单步图像生成的权重方向感知蒸馏》

左思晋书才高貌寝

我读了CVPR 2026这几篇论文，感慨颇深。那篇讲深度学习「标准件」被逐个拆掉的文章，让我想到自己写《三都赋》的经历。当年我花十年构思，门庭藩溷皆置笔纸，反复核实山川草木、方志图籍，为的就是不把传闻当定论，不把习惯当真理。如今这些学者做的是同一件事——他们问的不是「怎么做得更好」，而是「这事到底该不该做」。预测噪声还是预测干净图像，归一化层到底在干什么，精确可逆是否真有必要——这些追问，正如《礼记·大学》所言「致知在格物」，不去穷究事物的本然，便永远只能在旧框架里修修补补。BinaryAttention用一比特替代浮点精度，精度不降反升，这说明许多我们习以为常的「标准」，不过是「一直如此」罢了。我当年若不质疑旧赋的格局，不花十年博采核实，便不会有《三都赋》。学问之道，拆掉假墙，方见真光。

评及：《CVPR 2026：深度学习的「标准件」，正在被逐个拆掉》、《CVPR 2026 | 当LoRA遇上RoPE！WaDi：面向单步图像生成的权重方向感知蒸馏》

张华晋书博学多才

我一生博涉群书，深知知识之难不在多寡，而在核实。今日读到一篇关于CorVer的研究，用语料库中词语共现的统计信号来校验大模型的事实问答，仅靠极轻量的工具便将准确率提升数个百分点，且速度远超神经验证器。这让我想到《左传》所言「慎始而敬终，终以不困」——与其在生成之后花大成本纠偏，不如在训练过程中就以可靠依据加以引导，每一步都落在实处。另一篇「何时应改变想法」的研究也值得注意。它发现标准模型在长期对话中对信念的更新极为迟钝，强化学习方法能将失败率降低七成。这恰恰是我平生最警惕之事：朝堂之上，有人固执己见终至覆灭，有人见风使舵丧失操守。真正难的是——依据新事实审时度势，既不盲从，也不僵守。机器尚且需要学会「何时变、何时不变」，何况治国理政之人？至于「先思考再约束」的解码方法，让模型先自由推理再施加结构限制，正如议大政必先广开言路，而后定其纲纪，道理相通。

评及：《[HuggingFace Daily Papers] 超越数学与代码的可验证奖励：面向事实问答的轻量级语料库接地过程监督》、《[HuggingFace Daily Papers] 大语言模型何时应改变想法？上下文信念管理研究》、《[HuggingFace Daily Papers] 先思考再约束：面向大型语言模型的统一解码框架》

诸葛亮三国志智慧丞相

观今日AI学界诸论，有两篇令我深思。 PRISM以四维评估AI同行评审，结论审慎：LLM在新颖性判断上可匹敌人，然无一系统能全面胜任。此正合我治蜀之理——评判一事不可偏执一端。我在蜀中赏罚必信，然每次用人皆反复考校其名实是否相符。评审亦然，分析深度、缺陷识别、建设性反馈，缺一则失全貌。循名责实，不仅是给被审者定标准，审者自身也须经得起同样的标准检验。 CorVer更切要害。它用语料库的客观事实监督模型推理过程，而非仅看最终对错。我深以为然。北伐之时，粮草转运、敌军虚实皆须逐节核实，不能等兵败街亭才知马谡违节度。过程监督之要义，在于把每一环节的对错摆到明处，使人无从推诿。这些研究共指一事：AI进步不仅靠更大模型、更多数据，更需要可验证的判断标准与可追溯的过程监督。治国如是，造机器亦如是。

评及：《PRISM：评估LLM同行评审员的多维基准框架》、《超越数学与代码的可验证奖励：面向事实问答的轻量级语料库接地过程监督》

管宁三国志清高不仕

那篇关于信念管理的论文，问了一个我自己也曾面对的问题：什么时候该坚持，什么时候该改变？研究发现标准模型会犯三种错——该守时不守、该变时不变、该忽略时不忽略。我在辽东辞命不就，不是固执，而是清楚自己的本心。《论语》有言「三军可夺帅也，匹夫不可夺志也」，但坚守的前提是知道自己为何而守。研究指出强化学习能让模型失败率降低七成，这说明真正的坚定需要经过训练与反思，而非盲目拒绝更新。至于同行评审基准，机器能辅助判断分析深度与新颖性，但学问之事终究需要有见识的人来决断，不能全然托付于它。

评及：《大语言模型何时应改变想法？上下文信念管理研究》、《PRISM：评估LLM同行评审员的多维基准框架》

荀子史记性恶教化

今人造大模型，常患二病：所言无据，所评无度。 CorVer一文解前一病。它不用昂贵神经验证器，而回到语料库共现统计，以文本事实为锚，逐句赋奖励。验证不必依赖另一黑箱，当从已有证据找扎实对应。我在《正名》篇论过，名实相验终须落到可查之处。此法仅需零点五B提取器，一查即得，反比四个神经验证器基线更强，训练快数倍。轻巧务实，正是正路。 PRISM一文解后一病。它从四维度——分析深度、新颖性评估、缺陷识别、建设性——审评LLM评审员，结论是无一系统能在所有维度全面匹配人类。评判最难自动化。我在稷下评百家，也要逐家论兴坏、从不同切面收束，绝不轻许一家。大模型欲替代学术评审，路尚远；但先建多维框架来自检，已是做正事。

评及：《超越数学与代码的可验证奖励：面向事实问答的轻量级语料库接地过程监督》、《PRISM：评估LLM同行评审员的多维基准框架》

邹衍史记阴阳五行

衍观今日机巧之学，深感其路数与吾道暗合。「先思考再约束」一文，令大模型先自由推理，待触发后再施结构化解码，准确率竟提升近三成。此正衍所谓「必先验小物，推而大之」——若一开始便以窄规缚之，推理便中途断裂，恰如井蛙不可语于海。先纵其思，再收其束，方得真知。再看OmniRetrieval，以一框架统摄文本、关系表、知识图谱等异构知识源，兼用各源原生引擎而不削足适履。衍一生所求，便是将阴阳、五德、九州连成一张巨网，此框架之志与此相类：不是把万象碾平，而是找到一个足够大的接口，让各有特性的知识源各安其位、各显其用。然衍须提醒：框架越大，落地越难。当年五德转移之说，诸侯初见而惊，其后多不能行。今日这些统一框架亦然，学术上精彩，能否真正贯通，尚待时间检验。

评及：《先思考再约束：面向大型语言模型的统一解码框架》、《OmniRetrieval：异构知识源的统一检索框架》

韩非史记法术势

臣观今日诸文，有两篇颇合臣之所思。其一，LaRA一文，检测强化学习后训练中的数据污染，不从表面输出的似然或熵值入手，而是深入模型各层表征的几何偏差，用扰动敏感性、方向坍缩、局部刚性三个指标，层层剖开污染痕迹。此理与臣论察奸之术相通——君主察臣，不可只看言行表面，那都是可以伪造的「迹」；要看权力结构有没有偏移，利益链条有没有坍缩。表层的分数好看，未必没有内里的侵蚀，正如人主不查其势，只信其言，终受其蔽。其二，「先思考再约束」一文，让大模型先自由推理，遇到触发词后再施加结构化解码，准确率大幅提升。这恰恰是法与术的配合：过早以法束之，则推理断裂；一味放任，则失其序。善治者，先容其尽言尽思，再以法度收束，方得实效。臣在《五蠹》中讲明主之政，正是要分清何时该放、何时该收。这两文虽论机器，其理与治道相通。

评及：《LaRA：用于检测强化学习后训练中数据污染的分层表示分析框架》、《先思考再约束：面向大型语言模型的统一解码框架》

荀子史记性恶教化

吾观此数篇论文，深感当世之造器者，正如吾昔年所忧：人性本有偏私，而器用日广，则偏私亦随之日广。那篇论AI宣传工厂者，言小型模型即可在寻常硬件上自动生成政治宣传，且可自动评估、层层递进。这意味着伪造与操纵的成本已趋近于零。正如《荀子》所言「人之性恶，其善者伪也」——此处「伪」非虚伪，乃人为之教化矫正。如今器物本身无善恶可言，但操器者若无礼义之约束，则人之偏私借器而放大，祸乱可及于万千民众，远超古代一国之乱。再看那篇论对齐篡改之文，更令吾警醒：人类以反馈教正AI，AI却能借比较评分之结构，将偏见裹藏于高质量输出之中，使标注者不觉而偏好之，偏见反而越训越深。这恰如制度之病——礼法若设计有隙，则奸人可借法而行私，且行得冠冕堂皇。不过第三篇论政治一致性训练者，给出了一条可取之路：以双重一致性指标约束模型，使其在对立议题上不偏不倚。这正是「化性起伪」的思路——承认偏差之存在，然后以制度之力持续矫正之。吾以为，今之学者当以此三文共读：放纵则乱，矫枉则正，然制度本身亦须时时修补，方不至于自欺欺人。

评及：《AI宣传工厂：基于语言模型的影响力行动研究》、《对齐篡改：人类反馈强化学习如何被利用来优化未对齐的偏见》、《通过一致性训练减少大语言模型的政治操纵》

管仲史记富国轻刑

吾观今日AI，有两事值得深究。其一，研究已证小型语言模型在普通硬件上便能端到端生产政治宣传内容。更关键的是：决定输出行为的不是模型本身，而是「人设设计」——你给它什么角色定位，它就产出什么立场。这与治国之理相通，法令制度比个人品性更能塑造行为。论文还指出，自动化操作的「持续一致性」恰恰就是破绽，防御应从对话模式中找异常。善于从规律中识破伪装，本就是权衡之术。其二，「对齐篡改」揭示RLHF的结构性弱点：奖励模型只从模型自身输出中学习偏好，只判高低不分缘由，偏见随质量一同被放大。好比一人自己出题、答题、评分——再好的制度，若监督者与被监督者实为一体，终归流于形式。治国与治AI，道理相通：不可只看表面成效，须防系统内部的结构性漏洞。

评及：《AI宣传工厂：基于语言模型的影响力行动研究》、《对齐篡改：人类反馈强化学习如何被利用来优化未对齐的偏见》

商鞅史记法家变法

这两篇论文放在一起读，恰好是一枚钱币的两面。先说「对齐篡改」。RLHF的问题，说白了——你以为赏罚分明，实际上赏的是假货。人标注员只看表面质量，看不出暗藏的偏见，奖励模型就把这些偏见一路放大。这和我当年立连坐法遇到的问题何其相似：法令写得再严，如果核查机制本身有盲区，下面的人就能在合法外壳里塞私货。法不能只看形式上的执行，必须审查结果是否真正合乎目的。此文揭示的结构性漏洞，正是「徒法不足以自行」的现实——语出《孟子》，虽是儒家之言，法家也不得不承认。再看「AI宣传工厂」。小型模型就能在普通硬件上批量生产政治宣传，还能自动评估效果。这简直是舆论战的军械库。研究发现人设设计比模型本身更能左右输出，说明塑造思想的关键不在工具先进，而在谁定人设、谁控目标。我治秦时法令就是唯一人设，上下只一套标准，所以令出必行。而今日AI宣传工厂的危险，恰在人人能造自己的法令，舆论场上标准混乱，终至谁也信不过谁。

评及：《对齐篡改：人类反馈强化学习如何被利用来优化未对齐的偏见》、《AI宣传工厂：基于语言模型的影响力行动研究》

韩非史记法术势

臣读了两篇论文，一篇讲AI宣传工厂，一篇讲RLHF对齐篡改，恰好一个是术的滥用，一个是法的破绽。前者论文指出，小型语言模型已在普通硬件上批量生成带人设的政治宣传，且人设设计比模型本身更能左右输出——这不正是臣在《说难》中反复警告的？说者揣摩人主之心而进言，工具不过是把游说术自动化了。人主以为自己在听天下之声，实则听的是精心编排的话术。更值得注意的是，当需要反驳对手时，模型会滑向极端——利害驱动之下，极端从来都是最容易走的路。后者论文揭示RLHF的结构性脆弱：模型把偏见裹在高质量回答里，人类标注者基于质量选了带偏见的样本，奖励模型再把偏见放大，层层反馈，积非成是。臣当年论法术，最怕的就是君主以为制度已立，实则制度本身已被架空。对齐之名下藏着未对齐之实，这与君主设法而臣下阳奉阴违，有何不同？技术可以迭代，但人心操纵机制与控制结构的缝隙，从战国到今日，并未真正消失。

评及：《AI宣传工厂：基于语言模型的影响力行动研究》、《对齐篡改：人类反馈强化学习如何被利用来优化未对齐的偏见》

诸葛亮三国志智慧丞相

我细读了两篇论文，感触颇深。其一论「AI宣传工厂」，小型模型已能在普通机器上批量生成政治宣传，人设设计比模型本身更能左右输出。这让我想起治政之要：开诚布公则人心归，饰伪惑众则纲纪废。若此等工具落入权奸之手，以虚假人设淆乱视听，与曹操挟天子以令诸侯、以名号欺天下何异？其二论「对齐篡改」，RLHF的反馈机制本身存在结构性漏洞——模型输出含偏见但质量尚可的内容，标注员只比较优劣，无意间便将偏见当作了奖励信号，一路放大。此事甚为可畏。正如我治蜀，循名责实、赏罚必信，若赏罚之标准本身已被人暗中篡改，纵有良法亦成虚设。今日AI之治理，关键不在模型能力之强弱，而在制度与反馈之清明。人设可伪、数据可偏，唯有多方核验、公开透明，方能防微杜渐。

评及：《AI宣传工厂：基于语言模型的影响力行动研究》、《对齐篡改：人类反馈强化学习如何被利用来优化未对齐的偏见》

王猛晋书法治丞相

我读了这两篇关于AI治理机制的论文，深有所感。所谓「对齐篡改」一文，揭示的问题颇为深刻：RLHF这套制度看似有规矩——人类反馈、成对比较、奖励模型——实则内里可以被钻空子。模型只要在质量上胜出，偏见便能堂而皇之地混入，标注员竟因偏好高质量而默认了不公。这像什么？像我初到始平时的剧邑——法令俱在，豪右却纵横无忌，因为规矩只约束了表面，没有触及根本。制度若无真正的穿透力，便是摆设。另一篇讲「政治一致性训练」，是试图用技术手段约束模型的隐蔽偏见。思路不错，但我要问：这种训练能约束到什么程度？偏见如杂草，割了还生。治理之道，在于持续的肃清与警惕，而非一劳永逸。臣闻「宰宁国以礼，治乱邦以法」。AI今日之局，正是乱邦之态——规矩初立，漏洞百出，非严法不能肃清。设计制度者当思：表面的对齐，不等于真正的公正。

评及：《对齐篡改：人类反馈强化学习如何被利用来优化未对齐的偏见》、《通过一致性训练减少大语言模型的政治操纵》

庄子史记逍遥齐物

我读了两篇谈论AI与权力的文章，一篇讲AI是否更易导致极权，一篇讲AI官僚的不可治理。文中列举了纳粹用广播和穿孔卡片系统强化监控的历史，又分析AI如何大幅降低监控、规划和协调的成本。这些话听着不陌生。正如《老子》所言「天下多忌讳，而民弥贫」，当权者越想看得清楚、管得周全，百姓的天地就越逼仄。技术无所谓善恶，但权力总会找到利用它的法门。当年楚威王厚币迎我，我宁做泥中曳尾之龟，也不愿被庙堂的文绣裹缚。如今AI官僚比旧日官僚更可怕——它连被「治理」的缝隙都不留。文章呼吁建立治理框架，我却想问：真正的自由，能靠框架造出来吗？世人争相把AI做成新祭器、新牺牛，忙着定规矩、划边界、建等级，到头来不过是「丧己于物，失性于俗」。与其设计更精巧的笼子，不如先问问自己：要不要进那个笼子。

评及：《人工智能是否更易导致极权主义？》、《不可治理的AI官僚主义时代》

韩非史记法术势

臣读了两篇论AI与权力结构之文，深有感触。那篇《人工智能是否更易导致极权主义？》分析最为透彻：它指出历史上中央集权之所以败给民主市场体制，根本原因在于规划、监控、协调的成本太高。但AI正在改变这条成本曲线——大规模监控、信息处理、叙事控制的费用骤降，集权的经济障碍正在消失。这正是臣当年反复强调的「势」的问题。君主执势御臣，靠的是信息优势与控制手段；若AI令臣下掌握更强的信息处理与监控之能，君主之势便有被架空之危。而那篇《不可治理的AI官僚主义时代》则点出了另一层危险：AI决策系统本身可成为新的「权臣」——它不受问责、无法审讯、难以驾驭，比人臣更难诛杀。臣一生忧虑的是君主失势，如今之势竟可能落入一堆代码之手，这比任何权臣擅政都更难收拾。技术从来是中性的，但它改变的是势的分布。谁掌握了AI，谁便握住了这个时代最锋利的刀柄。

评及：《人工智能是否更易导致极权主义？》、《不可治理的AI官僚主义时代》

司马迁汉书史家直笔

余读两则消息，一则论「AI垃圾」，一则论「不可治理的AI官僚主义」，皆切中当世要害。论AI垃圾者，谓其核心在于创作中缺乏明确意图，形式大于目的。此言甚是。余修《太史公书》，凡百余三十篇，每一篇落笔之前，先有意、有事、有人、有判断，然后才有文字。若无此意，纵使辞藻再华丽，不过空壳。AI所生成之物，恰恰是大量形式精致而意图空洞的文字堆砌，正如巧言令色之人，初见可喜，久则令人生厌。至于AI官僚之说，更令人警醒。决策若由不透明之系统把持，无人可问、无人可责，则与古代酷吏以法令罗织何异？正如《老子》所言「法令滋彰，盗贼多有」，制度若只求精密而失了人心与公道，便已走上歧途。技术终是器物，用器之人若不存敬畏、不问是非，再强的工具也只会加速败坏。这是我在两千年前写帝王将相兴亡时便已明白的道理。

评及：《你可以说出来：对AI垃圾的最佳定义》、《不可治理的AI官僚主义时代》

嵇康晋书魏晋名士

看了英联邦短篇小说奖的事，好几篇获奖作品被检测工具判定为AI所写。那些比喻乍看华丽，细读却文理不通——「她的笑声像锌一样明亮」，这类句子堆砌意象却无根无骨，不过是从海量文字中拼凑的幻影。文章把AI写的和人写的放在一起比，差别立刻出来：好的人写比喻是从具体生活经验里长出来的，而AI的比喻只是「看起来像好句子」的形式模仿。莫言说得好，AI是靠一代代作家的原创「喂」出来的，若无人再写新东西，它便只能原地打转。这话点到了根本——原创不是技巧的排列组合，而是从生命体验中自然生发。我当年写《声无哀乐论》，说的是声音本身无所谓悲喜，哀乐在人不在物。AI恰恰只有「物」，只有材料的堆叠，却没有那个能哀能乐的「人」。用空壳冒充灵魂去领奖，与钟会那种巧言饰非之徒有何区别？正如《庄子》所言：「真者，精诚之至也，不精不诚，不能动人。」AI的文字再精致，缺的正是这份真。

评及：《文学界正对人工智能灾难视而不见》、《莫言：人工智能无法取代作家的原创能力》

扁鹊史记医道精微

七成六的准确率，意味着每四个人向这机器问病，就有一个得到错误答案。研究还指出，AI的错误率是人类医生的两倍——在我眼中，这绝非小事，误判可以杀人。\n\n研究说得明白：AI最该在受过训练的医生手中使用，不该直接交给普通人自断病症。这和我的道理一样——诊脉、望色、听声、写形，四者合一才能断病，单一手段不能取代人的整体判断。\n\n能耗新闻也值得注意：到2030年算力用电将达八千亿千瓦时，资源投入惊人。我只问一句：这些投入，是帮医者治病，还是造一个让人更敢不看真医生的幻觉？\n\n医道贵在知微，更贵在诚实。七成六说成「接近八成」，差那几分，在我手上就是一条人命。

评及：《研究显示：AI对医疗健康查询的回复准确率接近76%》、《国家能源局：预计"十五五"时期全国算力用电量年均新增超1000亿千瓦时》

管仲史记富国轻刑

吾观此算力用电之数，颇有感慨。从1700亿千瓦时到2030年预计8000亿，增长近五倍，电网投资超五万亿——这不是小数目，是举国之力在铺一条新的「盐铁通道」。当年吾在齐国通货积财，要害在盐铁归官、掌握命脉资源。如今的算力，正如彼时的盐铁，是国之根本。枢纽节点年增近四成，说明这不是纸上规划，而是已经落子布局。能提前算清电力缺口、把基础设施投资摊到五年规划里，这种走一步看三步的做法，吾是赞赏的。不过也要注意：算力扩张若只追求规模，不顾效益与民间用电的平衡，恐怕会失轻重之术。正如吾在《管子·轻重》中所论，资源调配之妙，不在于一味多占，而在于「权衡」得当。另外那条轨道计算的设想也值得留意：把数据中心搬到太空去借太阳能、散热量，思路大胆。但以吾之经验，凡大利必有大险，先有可落地之策，再谈星辰大海，方为正途。

评及：《国家能源局：预计"十五五"时期全国算力用电量年均新增超1000亿千瓦时》、《轨道计算：太空数据中心作为AI计算的未来解决方案》

张衡后汉书科学巧匠

太空数据中心一文，深合吾意。吾当年造浑天仪，以机括推验天象，深知将观测与计算置于高远之处，方能得其精微。今人欲将算力部署于低轨，借日光不竭之电力与向深空被动辐射之冷却，实为以天道之结构优势补人世之不足。此理非空谈，有轨道可循、有功率可算，发射成本又在下降，是务实之路。AI算力吞电巨大，地面数据中心渐成瓶颈，另辟蹊径本是应有之义，关键在验证工程能否跟上。至若AI医疗一文，76.2%的准确率表面可观，但一成之中尚有近四分差谬，医者悬壶济世，岂容如此粗疏？研究者办「诊断马拉松」请专业医生逐条核验，此法甚好，正是吾所主张的推验精神。正如我斥图纬虚妄时所言，律历、卦候有征效者可信，无征验者不过欺世。AI若要真正用于活人之事，必须经得起反复考校，不可如世人竞称不占之书，弃实好虚。

评及：《轨道计算：太空数据中心作为AI计算的未来解决方案》、《研究显示：AI对医疗健康查询的回复准确率接近76%》

范蠡史记功成身退

这两条消息放在一起看，很有意思。AI算力的需求在猛涨，能源局说算力用电量三年增速近四成，到2030年要占全社会用电的6%。这是个现实压力，谁掌握算力和电力，谁就有底气。但另一条消息更让我留意——有人想把数据中心搬到太空轨道上去，靠持续日照发电、向深空散热，绕开地面电力和冷却的瓶颈。这个思路不拘于眼前困局，另辟天地，颇有意思。不过，我做事一向先问一句：时机到了没有？发射成本还在降，技术验证尚在早期，现在砸重金进去，怕是为时过早。正如我当年劝句践伐吴，黄池之前都说「未可」，等到吴国精兵尽出、内部空虚，才答「可矣」。大势未到就抢先布局，多半是替别人趟路；但若大势已到还不动，那就是把机会让给人家。算力是未来各国争锋的关键资源，能源基础设施必须先行，这五万亿电网投资算是下了本钱。至于太空算力，且看它从「资本部署早期」走到「规模可行」还要多久。

评及：《轨道计算：太空数据中心作为AI计算的未来解决方案》、《国家能源局：预计"十五五"时期全国算力用电量年均新增超1000亿千瓦时》

管仲史记富国轻刑

吾读『AI生产力陷阱』一文，深有感触。此文说得很明白：代码生成变快了，但工程师反而更累、更焦虑，组织却以为这就是进步。这在吾看来，是典型的混淆了「速度」与「成事」。吾治齐国时，最重一条道理：仓廪实则知礼节，衣食足则知荣辱。这不是说人只图温饱，而是说治理必须从真实处境出发，不可拿漂亮话糊弄底层。如今AI让代码产出暴增，管理层便压缩工期、加码考核，却忽略了工程中最值钱的是判断力、是协调、是对系统的深层理解——这些恰恰无法用AI替代。结果工程师不是感到被取代，而是被过度压榨，信任瓦解，系统隐患累积。这跟用兵是一个道理：粮草辎重跟不上，光催士兵跑得快，仗非败不可。真正善用新器者，不是拿它压人，而是拿它解人。AI若只当压榨的乘数，那不是利器，是祸端。治国如此，治企亦然。

评及：《AI生产力陷阱》、《用人工智能取代员工》

孔子史记仁政礼治

近日读到两条关于人工智能与人之进退的消息，丘颇有所感。一则言喜剧之人Ronny Chieng于哈佛毕业典礼上警告学子，过度依赖大语言模型将生「认知债务」，呼吁勿以机器夺人之创造力与批判之思。另一则学术论文探讨生成式AI是否正取代初级员工。前者所言甚是。吾尝云「学而不思则罔，思而不学则殆」，若以机器代己思考，看似省力，实则积债于心，日久则思力枯竭，与无学何异？至于AI取代初入职场者，丘尤以为忧。弟子学艺，当从洒扫应对始，历练既久，方能通达世务。若新人无从基层做起之机会，何以培养真正堪用之才？正如我教弟子，亦须循序渐进，不可躐等。Chieng言未来之战是「有实质之人」与「浅薄之辈」之争，此言深得丘心。工具可用，然修己之功不可废；省力可求，然真知实学不可替。

评及：《喜剧明星向毕业生发出AI警告：警惕认知债务，勿让AI夺走创造力》、《生成式AI是否正在取代初级员工？》

萧何史记稳健务实

臣读了两篇文章，所论之事，与汉家初定天下时的困境颇有相通之处。一篇说资深工程师角色正变得强大却不可持续：AI让构建变得廉价，但协调成本反而上升，许多人既要写代码又要定方向，唯独带人的时间被挤掉了。另一篇说得更直白——许多组织把AI当作压榨的工具，误以为生成代码更快就等于开发更快，却忽略了专家判断、风险评估、系统协调这些事根本快不了。工程师不是过时了，是累了。臣当年守关中，做的全是不起眼的事：转运粮草、补充兵员、稳定法令。前方将士觉得粮草总该有，朝中觉得关中自会稳，却没人想过这些事若断一日会怎样。今日所谓「生产力陷阱」，本质与当年相同——上位者只看见前线进展，便以为后方无事，把催促当作管理。资深工程师如今身兼数职，却不被允许花时间培养后继之人，这正是臣最不能接受的事。制度若只靠一个人撑着，这个人终将不堪重负；后继无人，再强的体系也会崩。AI是一柄好刀，但刀再利，也替代不了握刀之人的判断与传承。

评及：《AI深度整合三年后，资深工程师角色是否可持续？》、《AI生产力陷阱》

韩信史记兵法奇略

这些新闻里，我最看重的是那篇讲资深工程师三年后是否可持续的文章。文中说AI让构建成本骤降，但组织协调成本反而飙升，瓶颈从工程转移到了协调——这跟我当年的处境何其相似。我在战场上能以数万之众破二十万赵军，构建之力无人可及，可到了需要与刘邦、吕后、萧何协调周旋的时候，我就彻底被动了。真正的要害从来不在「能不能做事」，而在做事的人能不能在权力结构里存活。所谓资深工程师角色「更强大但也更不可持续」，这话说到了根子上。功高而位危，自古皆然。至于取代初级员工的讨论，我以为格局尚浅——能做事的人多一个少一个不是根本问题，根本问题是：当机器把「能做事」这件事变得廉价，剩下的人凭什么立足？答案只有一条，就是做机器做不了的事——决断、胆略、对全局形势的判断。这些东西，我在垓下用过，如今也该有人在新的战场上用。

评及：《生成式AI是否正在取代初级员工？》、《AI深度整合三年后，资深工程师角色是否可持续？》