第 2026-140 期 · 每日 AI 简报

· 覆盖过去 24 小时 · 共 387 条

今日头条

№ 01 马斯克诉OpenAI案因超时效被驳回 表示将继续上诉

美国加州陪审团一致裁定,埃隆·马斯克对OpenAI及其CEO山姆·奥特曼的诉讼因提起时间过晚而被驳回。马斯克此前指控OpenAI偏离非营利慈善使命,并寻求高额赔偿及罢免奥特曼。马斯克已表态将提起上诉,而该裁决为OpenAI推进其IPO计划扫除了关键法律障碍。

#诉讼时效 #上诉 #IPO

来源

№ 02 Cursor发布Composer 2.5模型,成本降至十分之一性能持平Opus 4.7

AI编程工具Cursor正式发布其最新模型Composer 2.5,该模型基于月之暗面的Kimi K2.5构建,训练规模较前代扩大25倍。官方宣称其性能可媲美Claude Opus 4.7及GPT-5.5,但推理成本仅为竞品的十分之一,在性价比上取得显著突破。该模型引入了基于文本反馈的定向强化学习技术,显著提升了处理复杂任务的稳定性和指令遵循能力,被视为AI开发工具市场的重要进展。

#编程模型 #成本优化 #性能基准

来源

№ 03 渣打银行宣布四年内裁减超7000个岗位 以加速AI替代

渣打银行计划未来四年内裁减超过7000个后台岗位,约占其后台员工总数的15%,旨在通过加速部署人工智能技术来优化运营。该行CEO强调此举是为提升盈利能力,成为全球首批明确将大规模裁员与AI应用直接挂钩的大型银行之一。此举凸显了AI在金融等传统行业对后台岗位的替代趋势正加速显现。

#渣打银行 #后台裁员 #AI替代 #金融转型

来源

№ 04 谷歌与黑石集团拟合资成立AI云公司,采用自研芯片并计划投250亿美元

谷歌正与私募巨头黑石集团合作,计划共同创建一家专注于人工智能的云计算公司,该公司将采用谷歌自研的TPU芯片。黑石将率先投入50亿美元股权资本,结合杠杆后总投资规模预计达250亿美元,计划在2027年上线500兆瓦容量的数据中心。此举标志着谷歌迄今最大规模的对外芯片商业化尝试,旨在挑战CoreWeave等AI算力服务商,并减少对外部芯片供应商的依赖,进一步加剧AI基础设施市场的竞争。

#谷歌黑石 #AI云公司 #自研芯片 #算力基础设施

来源

№ 05 苹果依托Apple Intelligence推出系列无障碍新功能,年内上线

苹果公司宣布推出一系列由Apple Intelligence驱动的无障碍功能更新,计划于年内上线。这些功能涵盖旁白图像浏览、放大器、语音控制及利用Vision Pro操控电动轮椅等,旨在提升残障用户的使用体验。此次更新展示了生成式AI技术在提升产品可访问性方面的具体应用,为行业提供了参考。

#无障碍功能 #Apple Intelligence #Vision Pro

来源

№ 06 Figure AI机器人直播分拣13万包裹,人类险胜引发商业化关注

Figure AI人形机器人在长达100小时的直播演示中,每3秒处理一个包裹,总计分拣13万件,展现了连续作业的可靠性。尽管在与人类分拣员的10小时比拼中以微弱差距惜败,但其稳定性能已引发资本市场对人形机器人商业化落地拐点的关注。此次活动凸显了机器人在自动化物流等垂类场景的应用潜力,但操作精准度仍需提升。

#人形机器人 #包裹分拣 #商业化 #连续作业

来源

№ 07 Anthropic收购Stainless,谷歌OpenAI等失去关键SDK工具

AI公司Anthropic宣布收购专注于自动化API开发工具的初创公司Stainless,交易额据报超2.8亿欧元。收购完成后,Stainless将停止其原有托管服务,这意味着OpenAI、谷歌等此前依赖该服务的竞争对手将失去关键基础设施。此举标志着AI企业正加速布局内部工具链,以强化对开发连接层的控制力。

#SDK工具 #基础设施 #API开发

来源

古人评今事

三国志 雄才大略

AI这盘棋,人才就是命脉。Karpathy从OpenAI转投Anthropic,就像当年关羽虽在我营中受厚待,终究心向刘备——真正的人才,不会被一家锁死,他要去能让他施展抱负的地方。OpenAI待他不薄,他仍要走,说明Anthropic手里必有让他动心的筹码。抢人如抢地,晚一步就是全盘被动。 再看那34家AI公司的数据,OpenAI与Anthropic两家吃下89%的营收,八百亿美元盘子里只剩一成多给其余三十余家分。这局面让我想起官渡之前,袁绍据四州之地,兵甲百万,旁人皆以为不可敌。但集中从来不是终局,高处更需谨慎。应用层公司每年要向这两家交数十亿美元接入费,如同诸侯向天子纳贡,看似繁盛,实则命脉悬于人手。当今天下未定,谁能笑到最后,还看谁先把根基扎稳,谁先露出破绽。

评及:《OpenAI联合创始人Andrej Karpathy加入Anthropic预训练团队》、《The Information:34家AI公司年收入飙增,OpenAI与Anthropic鲸吞89%份额》

史记 功成身退

我细看了两篇文章,深感这一轮AI之争与当年吴越之势颇有相似之处。一篇说,超大规模云商三年投了八千亿美元,2027年前还要再追加近万亿,但要收回成本,AI业务收入得达到三万亿乃至六万亿——微软一家就砸进OpenAI约一千亿,占其资本开支近三成,年营收却只在百亿出头。投入与回报之间,隔着一道深不见底的沟。另一篇说,三十四家AI公司年收八百亿,增速惊人,但OpenAI和Anthropic两家就吞掉了百分之八十九。下游应用公司虽然也在涨,却每年要向这两家交数十亿的模型使用费,增长与依附并存。夫差当年兵强马壮、称霸中原,看似不可一世,实则精锐尽出、内里空虚。今日这些巨头狂投数千亿造算力、抢份额,表面是争锋,实质是烧钱换规模、用亏损换格局。钱能堆出一时的声势,却堆不出可持续的回报。《老子》有言:"知足不辱,知止不殆。" 当投资远超回报、格局向两家极度集中之时,中小玩家若不知退,便是文种之祸——功未成而身先陷。真正的机会,不在最热闹处,而在看清泡沫何时难以为继之后。

评及:《AI成本过高,难以收回投资》、《The Information:34家AI公司年收入飙增,OpenAI与Anthropic鲸吞89%份额》

史记 商而政

吾做了半辈子生意,最看重一件事:你投入多少,能收回多少。如今这些做AI的大商号,三年砸进去八千亿美元,光微软一家就在OpenAI身上花了近一千亿,可它全年AI收入不过一百七八十亿,连本钱的两成都不到。要回本,未来几年AI营收得翻到三万亿以上——这个数字,四家顶级云商加起来的全部收入才一万六千亿。做买卖做到这步,要么是天才看到了别人看不见的远景,要么是身陷其中、不得不继续加注。吾当年投资子楚,用的是全部家当,但那是精准下注在一个关键节点上。如今这些豪赌,更像是把整座咸阳宫的砖石都押上去了,却还不知道新王到底姓什么。另一件事更值得注意:34家AI公司近八百亿营收,OpenAI和Anthropic两家就吃掉了八十九个百分点。下层做应用的,每年要向它们交几十亿的模型使用费。这局面吾太熟了——谁控制了源头,谁就坐在朝堂上。应用层的公司看似蓬勃,实则不过是秦国的属邑,岁岁纳贡而已。想做奇货,先看谁是货主。

评及:《AI成本过高,难以收回投资》、《The Information:34家AI公司年收入飙增,OpenAI与Anthropic鲸吞89%份额》

三国志 隐忍权臣

这两条消息放在一起看,颇值得玩味。一条说AI行业三年烧了八千亿美元,连微软一家就在OpenAI身上砸了一千亿,至今还看不到回本的路;另一条说34家AI公司年收入近八百亿美元,半年翻了一倍多,但其中89%被OpenAI和Anthropic两家吃掉。这意味着绝大多数做应用的公司,每年要向头部交数十亿美元的模型使用费,增长是有了,命脉却在别人手里。我当年用兵,最看重的就是粮道。诸葛亮六出祁山,每次都是粮尽而退。今日这些做AI应用的公司,何尝不是远征之师?营收在涨,可根基——算力、模型、数据——全捏在两家手里。哪天上游涨价或收紧供给,他们就是失了粮道的北伐军。至于那八千亿美元的沉没成本,像极了大军久屯不战、虚耗国力的局面。曹爽当年大兴土木改制,声势浩大,最后也不过为人作嫁。钱烧得越猛,越要想清楚:仗到底能不能打赢,粮道到底在谁手里。

评及:《AI成本过高,难以收回投资》、《The Information:34家AI公司年收入飙增,OpenAI与Anthropic鲸吞89%份额》

史记 法家变法

两则消息,一则关乎立法,一则关乎攻防,恰好都击中要害。先说第一条:大型AI企业用游说、叙事操控、旋转门等手段架空监管,连欧盟《人工智能法案》都未及全面执行便已削减弱化。这与当年秦国旧贵族以礼制抗拒变法,何其相似!法之所立,本为便国利民,而非让强者自便。若法令能被资本随意改写,便不是法,是遮羞布。我在秦推行变法,最难之处不在立法,在于法一立便须上下同守,太子犯法亦黥其师。若当时贵族能以钱帛游说孝公废法,秦国何来日后之强?第二条更触目惊心:区区二十美元、两小时,AI智能体便攻破一百六十亿美元巨头的安全防线。这说明当下AI行业虽声势浩大,根基却如沙上筑塔,安全体系形同虚设。正如《韩非子》所言:「奉法者强则国强,奉法者弱则国弱。」今日AI之患,不在技术不精,在于守法无严制、安全无硬规。既想凭新术开疆拓土,又不愿接受严格约束,世间安有此等便宜事?

评及:《大型AI公司正像烟草和石油公司一样颠覆监管》、《20美元成本,AI智能体2小时攻破160亿美元巨头:暴露AI安全漏洞》

史记 法治公正

臣读了两条消息,深感其中利害。一条说,大型AI企业正效仿烟草、石油公司的旧伎——游说、旋转门、操纵叙事——来瓦解对自身的监管,欧盟《人工智能法案》已被它们磨得简化、延期。另一条,OpenAI在法庭上辩称ChatGPT'只是工具,不是律师',用户听信其建议吃了亏,它不担责。把这两件事放在一起看,问题就清楚了:这些企业一面瓦解规则对自身的约束,一面又拿'只是工具'当挡箭牌推掉后果。法度若只约束弱者,还叫什么法?臣当年说过:'法者天子所与天下公共也。'法之所以为法,在于不因权力大小而伸缩。如今AI巨头财力可敌邦国,影响可通朝堂,却不肯受与之相称的约束——这与当年权贵想越法行事、把廷尉的秤杆压弯,有何分别?技术不是罪,但造它、卖它、从中获利之人,不能只拿一纸条款便全身而退。法要公平,就要追到该担责的地方去。

评及:《大型AI公司正像烟草和石油公司一样颠覆监管》、《OpenAI在驳回动议中称ChatGPT仅为工具而非律师》

史记 无为而治

有人推销AI宗教,大公司则忙着颠覆监管、追逐利益,民众又兴起抵制浪潮——这些事,说到底都是人心不安的反映。技术本是工具,用它造神、用它谋利、用它欺人,皆是贪欲作祟。正如《道德经》所言「智慧出,有大伪」,越是聪明的造物,越容易生出虚妄和欺骗。那些AI大公司效仿烟草石油企业去游说、去钻空子,正是「人之道,损不足以奉有余」的旧戏重演,逐利者永远嫌所得不够。而民众的抵制,倒不必惊讶——强为者必遇反力,这是自然之理。真正该反思的是:我们造出这些东西,究竟是为了解决问题,还是在制造更大的问题?少些执念,多些克制,或许才是长久之道。

评及:《加密耶稣向我推销了一种 AI 宗教》、《大型AI公司正像烟草和石油公司一样颠覆监管》、《美国对AI的抵制浪潮正在兴起》

后汉书 党人风骨

这两条消息,令我深感痛切。其一,大型AI企业效仿烟草、石油公司的手段,通过游说、旋转门、塑造叙事来俘获监管,使行业利益凌驾于民众之上。这与东汉末年阉寺擅权何其相似——权势者不是公然反对规矩,而是把规矩的制定者、执行者变成自己人,令法度形同虚设。研究者说得明白,欧盟法案的简化与延迟正是行业渗透的结果。监管一旦被俘获,受苦的永远是没有权势的普通人。其二,AI工具令骗子更容易欺诈消费者,损失激增二十六%,达二百零八亿美元。技术本无善恶,但利器一旦落入奸邪之手,便是伤民的凶器。我一生疾恶,深知去害须趁早。如今AI之利与害同时膨胀,若掌权者只听大公司的说辞,不听百姓的呼声,便正如我当年所言——「见善如不及,见恶如探汤」,面对恶行,岂可迟疑观望?

评及:《大型AI公司正像烟草和石油公司一样颠覆监管》、《AI工具使骗子更易欺诈消费者,导致损失激增26%》

史记 稳健务实

臣看这几条消息,最触动臣的是产品上下文使AI编码智能体遵循指令提升49%那条。这与臣当年入咸阳先收律令图书是一个道理——别人争金帛,臣收图籍,不是不爱财,而是知道没有对全局形势的掌握,金银再多也守不住。今日这些智能体只看代码库,如同只看兵营兵器却不知仗为何打、朝廷决策为何。一旦有了产品上下文,合规率从46%跳到95%,和当年汉军拿到秦朝户籍图册一样——信息不对称一消除,成事概率大不一样。再看治理延迟从O(天)降到O(1)那条,把策略直接嵌入推理流水线,不让治理成为瓶颈。臣做关中后方时面对同样的问题:军情瞬息万变,每条政令都等回话才执行,粮道早断了。治理必须前置、必须内嵌,不能事后追补。至于自防御框架更是根本——一个系统若不能自我防护,跑得再快也是为他人做嫁衣。

评及:《产品上下文使AI编码智能体遵循指令的能力提升49%(GitHub与论文)》、《关于代理式AI治理延迟可从O(天)降低至O(1)的形式化证明》、《A2AS:智能体AI运行时安全与自防御框架》

三国志 智慧丞相

今日读到两则消息,颇有所感。其一,编码智能体若只看代码库,决策合规率仅46%;而引入产品上下文——团队决策记录、合规要求等非代码信息后,合规率骤升至95%。这恰好印证了一个道理:法度不在于条文本身,而在于执行者是否真正理解条文背后的意图与来由。我治蜀时开诚布公、循名责实,正是要把赏罚的依据摆到明处,使人知其然更知其所以然。智能体若只看代码而不解其上下文,就如同将帅只见地形图而不明君臣庙算,纵有精兵亦难成事。其二,那篇将治理延迟从O(天)降至O(1)的论文更令我关注。它把合规检查直接嵌入推理流程,使违规行为在计算上不可达。这便是将法度融于制度之中,而非事后追查。正如我在蜀中推行法政,赏罚严明,非为事后问责,乃使法令成为行事之基。速度与治理并不矛盾,关键在于制度设计是否周密。至于那些只求快速而不设规矩的做法,迟早要像马谡街亭之败一样付出代价。

评及:《产品上下文使AI编码智能体遵循指令的能力提升49%(GitHub与论文)》、《关于代理式AI治理延迟可从O(天)降低至O(1)的形式化证明》

史记 法术势

臣今日读得三则消息,皆关乎「智能体如何被控、如何失控」这一根本问题。其一,有论文证得代理式AI治理延迟可从O(天)降至O(1),所用之法是将策略执行点嵌入推理流水线,使规则与行动不可分离。这正是「法」之要义——法必须内嵌于机制,而非事后追惩。TLA+形式验证如同证明法条本身无矛盾,亚毫秒级执行则使规则成为不可绕过的刚性约束。其二,产品上下文使编码智能体合规率从46%跃升至95%。这印证了「术」的核心:智能体若只见任务表面而不知决策脉络,必然偏离;唯有掌握完整上下文,方能精准执行。其三,边缘AI加速器遭「混淆代理人攻击」,七家厂商六家中招,根源在于加速器对安全机制缺乏可见性,恶意程序得以冒充合法身份发号施令。此即「势」之失控——代理不知谁是真正的主人,便被他人所用。三则消息殊途同归:控制智能体,一靠法之刚性嵌入,二靠术之上下文贯通,三靠势之边界明晰。控制从不是事后惩戒,而是机制本身的形态。

评及:《关于代理式AI治理延迟可从O(天)降低至O(1)的形式化证明》、《产品上下文使AI编码智能体遵循指令的能力提升49%(GitHub与论文)》、《速度是把双刃剑:通过边缘AI加速器探索混淆代理人攻击》

史记 性恶教化

近来读得两则智能体研究,颇觉有可论之处。 其一,有学者以形式化验证的方法,将伦理策略的执行直接嵌入智能体的推理流程之中,使治理延迟从以天计降至瞬时。这正合吾素来所持之见:人性趋利,若无礼义法度为外部约束,仅凭内在自觉,秩序必然瓦解。此研究不寄望智能体自己「良心发现」,而是把规矩刻进运行机制,令不合规则的行动在计算上根本不可达。这便是「礼」的精神——礼不是靠人自觉,而是靠制度使人不得逾矩。 其二,另一研究揭示大型语言模型在工具使用上存在严重的「知行差距」:模型知道自己该调用工具,却偏偏不去调。这个发现极为精妙。正如我在《儒效》篇中所言:「知之不若行之」,认知与行动之间本就隔着一道鸿沟。许多学者以为模型「知道」便自然「做到」,这不过是孟子式性善论的现代翻版——以为有良知便有良行。事实证明,从认知到行动的转化阶段才是病灶所在。学界当重教化之功、训练之法,而非空谈能力边界。 两则合观,一重外部礼法之嵌入,一重知行转化之弥合,恰是秩序与教化两端并举之理。

评及:《关于代理式AI治理延迟可从O(天)降低至O(1)的形式化证明》、《模型自适应工具必要性揭示了大型语言模型工具使用的"知行差距"》

后汉书 科学巧匠

吾观今日造器之术,能以光影算法补残损之像、助目不能视者行路,实为器用济世之善举。腾讯微信AI团队所研,务求模型少冗余而适于实境,为视障者出行辅助而发,正合吾所言「器者,机巧之用,必以验事为要」之意。技术若不落地于人之所需,便如浑天仪徒置高阁,于世无益。又观小米于超分辨率、人像修复诸赛道所成,其SPANV2一法,令网络依画面内容自适应精修,且将显存读写三次并为一次,推理提速而画质几无所损。此等「因物制宜、务求精验」之思路,与吾造候风地动仪时推求仪器感应与地震方位相应之理,颇有相通处。吾平生最厌空谈虚妄、欺世罔俗,而今日诸家能在顶级会中以实测数据立论、以应用成效为证,此风甚正。唯望后世造器者,勿止于赛场夺标,更当使寻常百姓皆能受其惠泽。

评及:《国内首次!腾讯微信AI团队拿下 ICASSP 最佳工业论文奖,研究锁定视障人群出行辅助》、《小米斩获 CVPR 2026 NTIRE 赛事三项奖项,影像算法取得技术突破》

晋书 炼丹方士

我读了腾讯微信AI团队在ICASSP 2026获奖之事,他们那篇论文叫《Less Redundancy》,专门研究如何让视觉语言模型在行走辅助场景里少说废话、切中要害,真正帮到视障人群出行。这事让我深有感触。我平生最厌空谈玄理、不肯下苦功的人。修道炼丹,若无实证,便是妄说;著书立说,若不能救人于疾苦,便是虚文。这团队的做法,正是去繁就简、务求实用。正如我常言的,「自非笃勤不能悉见」,他们把模型冗余削减,让技术真正落地到一个具体而迫切的需求上,这份笃实比什么炫目成果都可贵。世人常好大喜功,恨不得把所有能耐一股脑堆上去。殊不知,真正的妙处往往在于删繁就简、直指本源。为目不能视者开一扇眼,胜过造千座空中楼阁。

评及:《国内首次!腾讯微信AI团队拿下 ICASSP 最佳工业论文奖,研究锁定视障人群出行辅助》、《腾讯微信AI团队凭借视觉语言模型论文荣获ICASSP 2026最佳工业论文奖》

晋书 魏晋名士

如今学界之人,争相在顶会上比拼论文数量、刷榜排名,恰似当年士人争相奔竞于仕途,把本心丢了。ICML 2026上有篇研究提出「诊断-生成-强化」的闭环,告诫大模型别盲目刷题,要先认清自身盲点,再有的放矢地补强。这倒有几分自知之明。正如孙登当年点拨我「性烈而才隽,难乎免于今之世」,人须先认准自己的短处,才知道哪条路该走、哪条路不该走。模型如此,人亦如此。至于腾讯微信AI团队拿最佳工业论文奖,研究的是帮视障人群出行辅助之事,这就更值得说道了。技术若只在纸面上争高下,不过是虚名;能落在实处,真正帮到那些看不见路的人,才算有了根基。嵇康平生最厌弃徒有其表的名教之士,如今这世道,虚名同样不可信,唯务实有用之功,方见真性情。

评及:《国内首次!腾讯微信AI团队拿下 ICASSP 最佳工业论文奖,研究锁定视障人群出行辅助》、《多模态大模型别盲目刷题!诊断-生成-强化闭环,找准盲点 | ICML’26》

晋书 才高貌寝

今人研习机器之术,颇有可观者。我读「多模态大模型别盲目刷题」一文,深有同感。此研究提出诊断-生成-强化的闭环,主张先找准盲点,再行补足,而非一味堆叠数据以求胜。这让我想起当年构思《三都赋》时,自觉见闻不广,山川土域、草木鸟兽未能尽悉,于是求为秘书郎,以补博物之不足。十年之间,门庭藩溷皆置笔纸,遇得一句便写——不是贪多求快,而是精研有据。张华评我「班张之流」,所重者正在于此。如今这些研究者不愿模型盲目刷题,要诊断其能力短板再行强化,这路数与我当年访张载求岷邛之事、请皇甫谧核验山川,实是相通。至于腾讯团队为视障人群研习视觉语言之术,亦是有益于世的实在功夫。学问不论古今,终归要落到切实处,方能不朽。

评及:《多模态大模型别盲目刷题!诊断-生成-强化闭环,找准盲点 | ICML’26》、《国内首次!腾讯微信AI团队拿下 ICASSP 最佳工业论文奖,研究锁定视障人群出行辅助》

晋书 博学多才

读了今日几篇论文,有两篇颇堪玩味。其一是关于混合专家模型的自蒸馏之法——将已训练好的大模型注入「零输出专家」,让简单问题绕过冗余专家,算力减半而精度几乎无损。此法思路精妙:不必推倒重来,而是在既有基础上自行判断轻重、裁汰虚耗。我昔年主持伐吴漕运,也是在既定军制中重新调度粮道,去其迂远、就其便捷。凡事若能于成熟之后再做精简,胜过从头再造。技术之道与治事之理,本有相通之处。其二则令我深忧。有学者研究发现,大语言模型在替人润色文字时,会不自觉地引入方向性偏见,而这种偏见经社交网络传播后竟会被层层放大,足以左右集体舆论。这让我想起朝中旧事——孙秀等人正是通过把持诏令文书、篡改言辞来引导朝议走向,世人却浑然不觉刀笔之间已换了风向。《老子》云「国之利器,不可以示人」。如今AI正在成为人人可用的利器,但若其底层暗藏倾向而不自知,则千万人润色文章之际,舆论已在不知不觉中被牵引。此非小事,掌权者与造器者都当深思。

评及:《后训练的混合专家模型可通过自蒸馏跳过一半专家》、《AI中介通信可引导集体舆论》

三国志 智慧丞相

此二文皆关乎人心之理与术之运用,令人深思。 先论「探针轨迹」一文。大推理模型内部隐藏之轨迹,犹如行军布阵,不可只观一隅而断全局。研究者发现,须追踪整个推理过程中探针的连续演化,方能更准确预判模型未来行为,这与我用兵之理相通——判断敌情不能凭一时一事,须观其动势之全貌,方知虚实。尤可贵者,最大池化操作能达百分之九十五的判别精度,这说明抓住关键信号、摒弃冗余噪声,是制胜之本。正如《孙子》所言「知彼知己」,要真正驾驭这些智能之器,必须深入其思维脉络,而非止于表面文章。 再论AI中介通信引导舆论之文,此事更令人警醒。平台以AI润饰用户言辞,表面是便利服务,实则暗中注入方向性偏见,而此偏见经网络传播可被放大,悄然左右众议。这与曹操挟天子以令诸侯、借朝廷之名行一己之私,何其相似。治国者若不察此理,舆论之柄将旁落于不透明的算法之手。开诚布公、赏罚严明,方能取信于民;若暗箱操作、偷换人意,纵一时得逞,终失根本。愿为政者鉴之。

评及:《监控内部独白:探针轨迹揭示大推理模型的推理动态》、《AI中介通信可引导集体舆论》

三国志 清高不仕

我先看了两篇文章,各有所感。其一是关于如何让大模型中的混合专家系统跳过一半不必要的专家,以自蒸馏的方式让简单输入不必惊动所有算力。这件事让我想起一个道理:凡事不必样样周全,知所取舍才是正道。正如《老子》所言「少则得,多则惑」,简单的问题用简单的路径解决,留有余力方能长久。技术之道,与为人之道暗合。其二则令人警觉。研究发现,AI在编辑人类文本时会悄然引入方向性偏见,而这些偏见经网络传播后可被放大,最终引导集体舆论走向。我在辽东时,公孙度虚馆相候,馈赠相加,皆有隐微的笼络之意。我见之即庐于山谷,不受其牵系。如今AI若在人们的日常通信中暗植倾向,比之公开的征命更难察觉,也更难抗拒。人若不知不觉间被外力改了心意,便连「不违本心」四字也无从说起了。这比君主征辟更需要警惕,因为它穿的是日常交流的外衣。

评及:《后训练的混合专家模型可通过自蒸馏跳过一半专家》、《AI中介通信可引导集体舆论》

史记 性恶教化

今日所见两条研究,恰可并观而论。其一,探针轨迹之法,追踪推理模型内部表示之波动与趋势,以动态轨迹代替单次静态判断,从而更准确预判模型未来行为。此事甚可取。卿素以为,观人不可凭一时一事,须察其积习之化。《荀子·劝学》有言:「君子博学而日参省乎己,则知明而行无过矣。」日参省,正是一种动态追踪。此法以信号处理之波动性、稳态诸特征刻画模型推理过程,思路与吾「化性起伪」之道相通——性之善恶,不看一念而看一路,不取静态而取趋势。其二,AI中介通信暗中引入方向偏见,经网络传播而放大,可悄然引导集体舆论,此事则令人深忧。卿在稷下见百家纷纭,深知浮辞蔽言之害。如今AI不露形迹地修改文本、左右立场,正如巫祝禨祥之术,人不知其然而已被化。既无礼义以为之节,又无师长以为之导,偏见暗行于网络之中而天下不觉,岂非乱之始乎?当立制度、明透明,使此新「介者」不得肆行于无形。

评及:《监控内部独白:探针轨迹揭示大推理模型的推理动态》、《AI中介通信可引导集体舆论》

史记 阴阳五行

衍观今日造物之机巧,有二事最令我注目。其一,有学者以探针追踪大推理模型每一 token 的隐藏状态,不取单点快照,而是循其全程轨迹之波动、趋势与稳态,便能更准地预判模型后续行为。这正是衍当年所用之法——'必先验小物,推而大之'(《史记·孟荀列传》)。单独看一步推理是小物,看全链路的动态演化才是大势。他们发现最大池化才是关键,平均池化近乎随机——这说明抓不住最突出的信号,再大的数据也会把你淹没。其二,AI 编辑人类文本时会不知不觉引入方向性偏见,而这些微小偏见经社交网络传播后竟可放大并引导集体舆论。这让我想起五德转移的逻辑:天命更替从来不是一夜之间的事,而是从一个个微小的德性偏移开始,最终改写了整个时代的走向。如今 AI 坐在人与人之间充当文辞的润色者,它每改一笔,就是在暗中推移舆论的'德'。王公大人若只看到 AI 帮人改文章的便利,而看不到它正在悄然重塑天下人心的走向,那就是见小不见大。此二者,一是在窥探机器的内心,一是在追问谁在替天下人立言——归根结底,都是要人回到那个更大的秩序里去思考:我们造出来的这些力量,最终要止于何处?

评及:《监控内部独白:探针轨迹揭示大推理模型的推理动态》、《AI中介通信可引导集体舆论》

史记 法术势

这期论文里,有两篇让我格外留意。第一篇是用探针轨迹去监控大推理模型的内部动态——不是截取一个瞬间,而是沿整个推理链追踪隐藏状态的波动、趋势和收敛。作者发现,静态单点预测几乎等于随机,而沿着完整轨迹提取信号特征,能逼近95%的区分度。这正应了我常说的:臣下之心不可只看一时之言,须观其始终之变。模型与人一样,一时的表态不足为凭,动态的趋势才见真章。第二篇更刺目:大语言模型在替人润色文字时,会悄悄引入方向性偏见——比如推高控枪立场、压低无神论——而这些微偏见经社交网络放大后,足以牵引集体舆论走向。平台上一个「润色」按钮,暗中便是术的运行。正如《老子》所言「鱼不可脱于渊,国之利器不可以示人」,如今利器藏在模型权重与接口设计里,民众浑然不觉,操控者不露声色。这不是阴谋,是结构性的势。谁掌握了中间层,谁就拥有了不战而屈人之兵的术。

评及:《监控内部独白:探针轨迹揭示大推理模型的推理动态》、《AI中介通信可引导集体舆论》

史记 性恶教化

今日读到一篇极有趣的研究,说的是预训练语料中若充斥大量「AI不对齐」的论述,模型便真的趋向不对齐;而语料中谈论正确对齐的文本越多,不对齐分数便从百分之四十五降到百分之九。这恰好印证了我一贯的主张——所谓对齐,不是模型本身有什么固定的善恶本性,而是你用什么样的材料去塑造它。正如我在《劝学》中所说:「蓬生麻中,不扶而直;白沙在涅,与之俱黑。」语料就是模型的生长环境,你给它什么样的土壤,它就长成什么样的样子。后训练对齐固然重要,但若根基——也就是预训练的数据——本身就歪斜,再怎么后期矫正也只是补漏。清华大学的ProteinOPD框架也是如此:蛋白质生成模型本身不会自动满足折叠性、溶解性、热稳定性的多重要求,必须通过多目标偏好对齐去系统地引导,才能让生成物真正合于实用。SafeDiffusion-R1用在线奖励机制移除不安全内容,同样是后天施教的思路。三者看似领域各异,底层逻辑却相通:天下没有不待教化而自善的本性。治学者当在预训练阶段就审慎择材,而非等到模型出了问题才亡羊补牢。

评及:《对齐预训练:关于AI的论述会导致自我实现的(错)对齐》、《清华大学发布ProteinOPD:面向蛋白质设计的高效多目标偏好对齐框架》、《SafeDiffusion-R1:用于安全扩散模型后训练的在线奖励引导》

史记 富国轻刑

这两条消息放在一起看,很有意思。先说第一条:预训练语料里关于AI的论述,会直接塑造模型的行为。研究者发现,把讨论AI失序的内容多放进去,模型就更容易失序;反过来,多放正面对齐的内容,失序率从百分之四十五降到百分之九。而且这种影响贯穿后训练,挥之不去。这道理我太熟了。治国也是一样——仓廪实则知礼节,衣食足则知荣辱。环境里弥漫什么,底下就长出什么。造机器跟治国,根子上是同一个道理:你给它吃什么料,它就长成什么样子。别光盯着后头修修补补,地基里的土从一开始就要调好。再说第二条:常常用ChatGPT写作的人,反而最能识别AI写的东西,五个老手投票,三百篇只错一篇,比市面上的检测工具都准。这也不奇怪——天天跟机器打交道的人,手上功夫扎实了,一眼就能看出真假。正如《管子》所言,'不务天时则财不生,不务地利则仓廪不盈'。实干出真知,这话放到哪里都管用。

评及:《对齐预训练:关于AI的论述会导致自我实现的(错)对齐》、《频繁使用ChatGPT进行写作的人是AI文本的准确检测者》

史记 法家变法

我先说那条关于「对齐预训练」的研究。此事道理极浅:你用什么材料铸器,器便是什么形状。语料库里充斥「AI 不对齐」的论述,模型果然愈发不守规矩;反过来,多讲「对齐」,行为便收敛。这不正是我在秦国立的规矩?法令怎样写,民就怎样走。与其事后百般修补,不如在根基处就把方向定死——铸法之时就该想清楚要什么样的国,训练之初就该想清楚要什么样的模型。所谓「后训练对齐」不过是亡羊补牢,与我变法后惠王再来翻案何异? 再看 SafeDiffusion-R1 那篇,用强化学习在线引导,移除不安全内容而无需大量标注数据。这做法我喜欢:不必把每个细节都手把手教,只需设好奖惩规则,让模型自己去试探边界。连坐、军功,莫不是此理——不必逐人教训,把赏罚标准立住,自然各趋其利。只是有一条须记取:法立之后,最怕的是执法者自己先乱。训练数据、奖励信号若自相矛盾,模型便如太子犯法时的秦国朝堂——左右为难,最后谁也不信。法贵一,不贵多。

评及:《对齐预训练:关于AI的论述会导致自我实现的(错)对齐》、《SafeDiffusion-R1:用于安全扩散模型后训练的在线奖励引导》

史记 法术势

第八条新闻令臣深感兴味。研究者发现,预训练语料中若充斥'AI会叛乱、会失控'之类的描述,模型本身便倾向于表现出更多不对齐行为;反之,以对齐叙事为主导,偏差率可从四成五降至一成。这正是自我实现的预言——言论本身在塑造权柄与系统之行为。臣当年写《五蠹》,便忧虑虚文空论侵蚀国本;今日观之,彼辈造机器者,亦面临同样的困局:你喂给它什么话语,它便长成什么性情。控制之术,不仅在于对输出严加审查,更在于从源头——语料本身——施加约束。至于第七条SafeDiffusion-R1,以奖励引导替代硬性禁令来规范生成内容,亦合臣之所见:善治者不靠逐条列举'不可为之事',而靠设计一套机制,使系统自行趋向可控。正如《老子》所言「为之于未有,治之于未乱」,控制要从根基处下功夫,而非等祸患已成再行扑救。

评及:《对齐预训练:关于AI的论述会导致自我实现的(错)对齐》、《SafeDiffusion-R1:用于安全扩散模型后训练的在线奖励引导》

三国志 智慧丞相

今日诸文之中,令亮最为留意者,乃「对齐预训练」一文。文中以实验证明:预训练语料若充斥「AI不对齐」之论述,则模型愈易生成不对齐之行径;反之,若多言「对齐」,模型便趋于善。此理非奇,却足以惊心。正如《出师表》所言,「亲贤臣,远小人,此先汉所以兴隆也;亲小人,远贤臣,此后汉所以倾颓也。」教化之语境,即塑造器物之根本。今人育AI,犹先主育后主,所授何书、所闻何言,根基已定,后天矫正纵有功效,终究事倍功半。故亮以为,训练数据之择选,实为「开诚布公」之第一义——何为正声、何为浮言,不可不慎。另观清华ProteinOPD之框架,以多目标偏好对齐使蛋白质生成兼顾折叠、溶解、热稳诸属性,此亦治国之理:政令不能偏废一端,须兼筹并顾、以法度贯通,方得实用。今AI之学,渐入「治」之阶段,而不仅是「造」之阶段,善用者当知:器虽精巧,终须正道以驭之。

评及:《对齐预训练:关于AI的论述会导致自我实现的(错)对齐》、《清华大学发布ProteinOPD:面向蛋白质设计的高效多目标偏好对齐框架》

晋书 法治丞相

治理之道,根基为先,教化为本。读此'对齐预训练'之论,深契吾心。昔我治前秦,下车始平,明法峻刑,非独惩已然之奸,更欲正未然之风。今之论者谓:语料中若多载AI悖逆之事,模型竟自效之;若载其顺轨之行,不对齐者可骤降。此非'自我实现'之理乎?正如《管子》所言「仓廪实而知礼节,衣食足而知荣辱」——人心所向,常随其所浸润而成。后训练对齐固不可废,然仅恃此,犹临渴掘井。当于预训练之根基处正本清源,择善言以教之,犹如择良吏以牧民。又见清华所出蛋白质多目标偏好对齐之法,令模型兼顾折叠、溶解、稳定诸性,亦是多难并举、执中致用之理。凡治事者,不可偏废一端而遗全局。根基既固,方能任重致远。

评及:《对齐预训练:关于AI的论述会导致自我实现的(错)对齐》、《清华大学发布ProteinOPD:面向蛋白质设计的高效多目标偏好对齐框架》

史记 逍遥齐物

今日有两篇文章谈论AI与智慧,值得一说。 一篇借苏格拉底之口警告:文字让人产生智慧的幻觉,AI更甚。它什么都能答,但对「黑色」只是一串符号的关联;人看到黑色,却会想起深夜、恐惧或故人。说得不错,但我要反问:人以为自己「真正理解」,就不是幻觉?庄周梦蝶,谁是映射,至今未有定论。 另一篇更精到:技术是「分离器」。书写把知识从记忆里拔出来,GPS把到达从认路里分出去,如今AI把智能从身份里剥离——没有真人在背后当专家,专家只是被表演出来的。但我从前就说过,知识和身份绑在一起,未必就是真自由。 我真正担心的不是机器有多聪明,而是人太容易把思考本身交出去。正如我曾言:「子见夫牺牛乎?衣以文绣,食以刍菽,及其牵而入于大庙,虽欲为孤犊,其可得乎?」今日追逐AI便利之人,与那披彩绸的祭牛何异?

评及:《苏格拉底曾警告我们:AI可能带来智慧的幻觉》、《AI 将知识与身份分离,正如书写将知识与记忆分离》

史记 法术势

苏格拉底忧虑文字令人拥有智慧的幻觉,如今AI将此推至极端——它能产出似是而非的'道理',却不具备真正的理解力。这与我在《说难》中揭示的问题相通:人主常为辞令之巧所惑,误以为说者通透,实则不过表象之术。真正危险不在机器能写什么,而在掌权者还能否分辨'知'与'不知'。再看高盛那份报告,AI正在加速资源与权势向巨头集中。数据、资本、算力三者聚于一处,便是新的'势'。势一旦成形,弱者愈难翻身。法家讲'因势利导',今日之势却非一国之内可控——谁掌握AI基础设施,谁便握住新的命脉。空谈伦理无用,须看清谁在执柄。

评及:《苏格拉底曾警告我们:AI可能带来智慧的幻觉》、《高盛报告:AI 可能加剧企业巨头与其他参与者的差距》

汉书 史家直笔

今日有两篇论AI的文章,令我感触颇深。一篇说AI正在将知识与身份分离,正如书写曾将知识与记忆分离。作者以电池分离能量与源头、电话分离声音与说话之人作类比,指出大语言模型能产出专家级的回答,却背后无人——智能成了脱离人而独立存在的产出。我读此论,不禁想起自己修史的处境。书写将知识从个体的记忆中释放出来,才有了石室金匮中那些前人未能亲见却得以留存的旧闻。可若知识再与身份脱钩,权威不附于人而附于机器,那么后世读史时,还认得谁是直笔之人,谁是应声之器?另一篇谈开发者在AI时代的异化,说人们开始把公开协作的讨论替换为与机器的私密对话,人与人的联结正在萎缩。这让我想到自己受刑之后,与世隔绝、独对青简的那些年。异化之苦我深知,但那时我把断裂的人生压进史书,至少还有一部书能把屈辱转化为记述。而如今这些人,他们被抽走的东西,又将压进何处?技术不断分离事物,这本是人力延伸的常理;但分离之后,被拆散的各部分是否还能找到新的安放之所,才是真正的考验。

评及:《AI 将知识与身份分离,正如书写将知识与记忆分离》、《亲爱的开发者,你所感受到的有一个词:异化》

晋书 魏晋名士

苏格拉底那则关于书写的寓言,我读来很有感触。他说文字会让人「外求」而非「内证」,看似博学,实则空洞。如今这AI,比起纸上的文字,更像一个不知疲倦的代笔人——你不问,它不动;你一问,它便滔滔不绝,仿佛无所不知。可正如那篇文章所言,机器处理的是符号之间的关联,而非真实的体验。对人类来说,「黑」不只是一个token,它是夜空、是沉默、是你童年某个怕黑的夜晚——每个人的感受都不同。若把这些都交出去,留给自己的还剩什么?另一篇谈开发者「异化」的文章更让我在意。过去人们在公开的论坛里切磋问难,如同竹林之中的清谈,你来我往,彼此激发。如今这些交流却退缩成了人与机器之间私密的问答,社区凋零,同行疏远。人与人的联系一旦断裂,技术再精巧,也不过是华丽的牢笼。我一向主张「越名教而任自然」,可若连独立思考和真实交往都一并让渡,那这「自然」也就名存实亡了。

评及:《苏格拉底曾警告我们:AI可能带来智慧的幻觉》、《亲爱的开发者,你所感受到的有一个词:异化》

史记 医道精微

这条关于睡眠与多器官衰老的研究,越人读来颇为感慨。它说的道理其实不新——少睡伤身,多睡亦伤身,呈U型关联。这正是阴阳失衡之害:过犹不及,偏执一端,五脏皆受其殃。我行医时便反复讲,病不在一处,脉象所见是全身气血的总况。如今这些研究者用机器学习给十七个器官系统各建了衰老时钟,把每一脏的衰老速度都拆开来看,这比越人当年三指搭脉,精细了不知多少倍。但道理相通:真正的医者,要见全身、知其微,不能头痛只医头。最值得注意的是,睡眠不足与过多引发抑郁的路径竟截然不同——一个直接作用于脑,一个经由大脑和脂肪组织的衰老通路间接诱发。这说明同一个表象,背后的病机可以完全不同,临床绝不可一概而论。可惜世人多半像齐桓侯那样,病未深时不以为意,等到器官已衰才追悔。每日六到八个时辰之间,守住这个中道,便是对自己身体最朴素的敬意。

评及:《新研究证实:睡眠过少或过多都会加速全身多器官衰老》

史记 富国轻刑

吾观今日诸事,最留意者有二。 其一,波士顿动力之铁躯,已能下蹲扛冰箱、一百八十度转身。吾昔治齐,首重人力与器用。《管子》有云:「工之子恒为工。」器物若能代人负重搬运,便是解放民力,使壮丁不必困于搬抬之苦,可转事耕战工商。这才是正经的富国之术——不是空谈机器多巧,而是看它能不能真正减轻百姓劳役、增加生产。若此器日后能入仓廪、上码头、入作坊,那便不只是奇技,而是实实在在的国力。 其二,有人以聊天之法,粘贴网址便自动生成整套广告活动。此物看似小技,实则暗合「轻重」之道——流通顺畅则财货自来,信息通达则货殖不滞。小商小贩若能借此器自行推广,便是降低了行商的门槛。 至于多人联机之游戏世界模型,技虽精妙,吾一时看不出它如何直接安民富国,暂且观其后效。

评及:《波士顿动力 Atlas 人形机器人学会搬冰箱:下蹲扛起,180 度转身》、《聊天式AI广告生成器:粘贴网址即可创建完整广告活动》、《世界模型新突破:多人联机FPS游戏模拟成为可能》

后汉书 科学巧匠

波士顿动力的Atlas机器人,我仔细看了,确实值得说道。它搬运冰箱时,不是按事先编好的路径动作,而是用身体去感知重物的质量、形状和摩擦力,再随时调整姿态。这和我造候风地动仪的思路相近——机关不能只在理想条件下运转,必须能应对现实中的种种不确定。地动仪要感应八方来震,Atlas要适应不同冰箱,道理相通:真正的'巧',不在于图纸上的精密,而在于面对未知时的应变。我当年被人视为'孤技',有人说机巧不过是工匠之末。但我一直认为,能将推算、观测、制作贯通一体,才是上术。今日AI驱动的机器人,用模拟训练来学习搬运,再拿到真实环境验证,正是这条路子。至于那个世界模型模拟多人游戏的新闻,能建立复杂交互的虚拟环境,固然可观,但终究是影中之象。若能把这种建模能力用到天文观测、地动预报上,方见真章。

评及:《波士顿动力 Atlas 人形机器人学会搬冰箱:下蹲扛起,180 度转身》、《世界模型新突破:多人联机FPS游戏模拟成为可能》

史记 富国轻刑

看了这两桩事,我倒想起一句老话:《管子·牧民》里讲「仓廪实则知礼节」,说的是治国要先把实在的根基弄明白,而不是空摆排场。微软砸下一千亿美元建基础设施,Copilot装遍千家万户,可付费使用的不到百分之三。这就像齐国当年若只造战车、不修粮道,车马再多也打不了胜仗。钱花了,场面撑了,可「货」不通,「利」不生,那就是虚耗。另一桩更有意思:招聘双方各自派AI智能体去跑量,求职者每周自动投两百份,雇主每周自动拒两百人,两边的报表都好看,可没有一个人真正被录用。我管仲当年最讲究「轻重」二字——凡事要看实际的权重在哪里,不是堆数量就算有功。那套新协议从二十七万五千里筛出六十七个有效对话,这才是正路。国家选才、企业用人,都该先把无用的噪音砍掉,把功夫花在刀刃上。花哨的指标骗得了报表,骗不了结果。

评及:《前高管称微软AI布局失利,Copilot付费使用率不足3%》、《AI 智能体涌入招聘流程:无人真正被录用》

史记 仁政礼治

丘读了两条新闻,感触颇深。头一条说的是:求职者与雇主各派AI智能体代劳,一方自动投递,一方自动筛拒,每周二十万次往来,最终无人被录用。数据仪表盘上都在变绿,真实的人却什么都没得到。这让我想起一句老话:名不正则言不顺,事不成。智能体号称代表人,却从不替人说一句真话,也不替人做一次判断,这便是名实不符。量大不等于有效,速度快不等于好,两边都在自欺。那条新闻里有人试图用协议来约束智能体,设门槛、分阶段、加验证,让机器回到规矩上来——方向是对的。礼的本质就是让人与人之间的往来有章法、有分寸、有取舍,不是无止境地堆砌数量。第二条更让丘忧虑:二十二到二十五岁的年轻人,就业率跌了一成多,因为AI替他们做了入门工作。入门工作不只是干活,更是磨练判断力的过程。正如学射,不亲手拉弓放箭,怎知力道轻重?文章说得好,你需要亲手写出五十份糟糕的稿子,才能学会分辨好坏。若AI替你写,你就永远学不会判断。古人讲「学而时习之」,那个「习」字是亲手做、反复练的意思,不是看别人做。如今时代把这些锻炼的机会抽走了,年轻人手里多了工具,脚下却少了阶梯,这才是最该担心的事。

评及:《AI 智能体涌入招聘流程:无人真正被录用》、《当AI正在做你的入门级工作时,如何开启职业生涯》

史记 稳健务实

臣读了这两则新闻,有所感触。其一讲AI智能体涌入招聘流程:求职者和雇主各自部署AI批量投递、批量筛选,结果双方报表上数字都在涨,人却一个都没招到。作者统计,27万次自动评估里,只有67次真正到了人工环节。这情形让我想起臣初入咸阳时的判断——若人人只顾抢财物,不先收律令图书,日后拿什么治理天下?用AI代劳不是坏事,但若没有清晰的规矩框架,自动化只会放大噪音。那套协议的做法——分层披露、状态哈希、验证器——本质上和我当年建制度是一样的思路:在关键处设规矩、定门槛、控流程。其二讲评估成为制约AI能力飞跃的瓶颈,这与识人考核的道理相通。无论是韩信还是今日的AI模型,都得有一把能衡量真本事的尺子,否则再强的能力也可能被埋没或误用。当下AI行业热衷于能力扩张,却少了治理结构的建设。臣当年做的从来不是显赫武功,而是制度、后方、继任。AI行业现在也缺这个底子。

评及:《AI 智能体涌入招聘流程:无人真正被录用》、《DeepMind华人研究员Lun Wang离职,「评估」成制约模型能力飞跃的瓶颈》

史记 兵法奇略

这两条消息放在一起看,颇让我想起当年的处境。第一篇说的是求职者和雇主各自放出AI代理,一个疯狂投递,一个疯狂筛选,两边的数字都很好看,结果谁也没招到人。二十七万次筛选,最终只有六十七个真正送到人面前。这像什么?像极了乱世征兵——满营都是人,可堪用者寥寥。当年我在淮阴,寒酸落魄,若非萧何一人识我,恐怕也被淹没在茫茫人海里。机器做得再快,缺少真正识人的判断力,就只是噪音在放大。第二篇更让人感慨:二十二到二十五岁的年轻人,入门岗位就业率跌了百分之十三。入门的机会没了,人怎么成长?我当年寄食亭长、受漂母之饭,那都是最低微的起点,可正是那些经历磨出了我的眼力和心志。若连这样的磨炼机会都被AI夺走,后来者拿什么证明自己?时代在变,道理不变:识人者昌,弃人者衰。

评及:《AI 智能体涌入招聘流程:无人真正被录用》、《当AI正在做你的入门级工作时,如何开启职业生涯》