第 2026-146 期 · 每日 AI 简报

2026 年 5 月 25 日 · 周一 · 覆盖过去 24 小时 · 共 229 条

今日头条

№ 01 教皇利奥发布通谕，警告少数公司掌控AI将导致非人化风险

教皇利奥十四世发布首份通谕《奇妙的人性》，直指大型科技公司对AI的集中控制可能引发失业、削弱民主等风险，并呼吁加强监管使其服务于全人类。通谕将AI视为新工业革命，强调需通过信仰与理性应对，但未提供具体实施细节。硅谷科技巨头此前曾游说梵蒂冈试图影响其立场。

#教皇通谕 #伦理监管 #非人化风险

来源

教皇利奥警告：由少数企业掌控的不透明人工智能可能导致“新型非人化” Hacker News 热门
教皇利奥对AI未来的不安愿景 Hacker News
教皇利奥十四世称AI必须服务于全人类，而非少数权贵 Hacker News
教皇利奥警告：由少数公司控制的不透明算法可能带来“新形式的非人化” Hacker News
硅谷向教皇推销AI：科技巨头游说梵蒂冈 Hacker News
算法时代如何保持人性：教宗良十四世首份通谕呼吁科技服务人类 Hacker News

№ 02 华为正式提出半导体‘韬定律’并公布逻辑折叠技术路线图

华为在ISCAS 2026上正式提出半导体‘韬定律’，主张以‘时间缩微’替代‘几何缩微’，并通过逻辑折叠技术优化芯片性能与能效。基于该定律，华为已量产381款芯片，麒麟2026已应用此技术。路线图显示，麒麟系列将迭代至2029年，昇腾990计划2030年引入该技术，目标实现硬件集成度提升100倍以上，到2031年高端芯片密度可比肩1.4纳米制程。

#韬定律 #逻辑折叠 #麒麟芯片 #芯片路线图

来源

№ 03 Anthropic创始人在梵蒂冈呼吁AI发展需外部监督

Anthropic联合创始人Chris Olah在梵蒂冈向教皇利奥发出警告，认为人工智能可能导致大规模失业是‘真实可能性’，支持失业工人将是‘历史性的道德责任’。他强调，AI发展不能仅由科技巨头主导，需要学术界、政府及民间社会等外部力量引导，以确保其安全、伦理及对社会产生积极影响。此次发言亦关注AI红利的全球公平分配与系统可解释性问题。

#外部监督 #失业风险 #道德责任 #全球分配

来源

№ 04 上海发布新政支持AI赋能微短剧产业算力与创作获激励

上海市文旅局联合多部门出台新政，从技术支撑、算力供给、剧本奖励等八个方面推动人工智能与微短剧深度融合。政策明确支持企业租用智能算力、共建数字资产库，并对优秀项目提供最高千万元研发补贴，旨在降低产业成本、促进规模化发展。这标志着上海正通过具体举措加速文化内容与前沿技术的结合，为AI应用落地开辟新场景。

#智能算力 #微短剧 #政策激励 #应用创新

来源

№ 05 华为具身大脑负责人创业，新公司具脑磐石获亿元级融资

前华为具身大脑负责人朱森华创立具脑磐石，专注于用认知科学构建认知世界模型，旨在实现机器人的小样本学习与主动推理能力。该公司已完成新一轮亿元级融资，资金将用于技术研发与全球化拓展。其技术路径强调从感知到决策的全链路闭环，与JEPA同向但更具实践性，已与多个行业客户开展真实场景验证。

#具身智能 #认知世界模型 #亿元级融资 #朱森华

来源

№ 06 宇树科技科创板IPO在即，2026年首季扣非净利润同比下降52.55%

宇树科技将于6月1日接受科创板上市审核，其招股书披露，2026年第一季度营收同比增长68.49%至4.23亿元，但扣非净利润同比下降52.55%至4025.36万元，主因研发和销售费用大幅增加。公司2025年主营业务毛利率达60.13%，核心部组件自研自产率超90%，计划募资42.02亿元用于研发与产能扩张。这凸显了AI机器人企业在高速扩张与短期盈利之间的典型张力。

#宇树科技 #科创板IPO #扣非净利润

来源

№ 07 马斯克宣布Grok V9-Medium 1.5T模型完成训练

马斯克宣布xAI公司的Grok基础模型V9-Medium（1.5万亿参数）已完成训练，评估结果良好。该模型在训练中融入了大量编程工具Cursor的数据，旨在显著提升处理复杂编程任务的能力。模型预计将在未来两到三周内公开发布，目前服务由较小的0.5T模型支撑，此次升级被视为重大进步。

#Grok模型 #参数规模 #编程能力 #模型发布

来源

№ 08 SaaS-Bench测试显示Claude等大模型全自动办公通过率不足4%

UniPat AI发布的SaaS-Bench评测基准揭示，当前主流大模型在真实办公场景中表现不佳，Claude的完全通过率仅3.8%。测试表明，AI在理解业务目标、跨应用操作等复杂任务上存在显著差距，所谓“全自动办公”愿景距离实际落地尚远。这为过度乐观的自动化预期泼了一盆冷水，提醒行业需正视技术瓶颈。

#SaaS-Bench评测 #办公自动化 #通过率 #AI Agent

来源

古人评今事

曹操三国志雄才大略

这两条消息让我颇为在意。其一，AI独立完成芯片设计，仅输入两百余词，十二时辰内便将七纳米图纸奉上，工程师全程无需插手。这等本事，好比麾下有一员能独当一面的猛将，只需点明要害，他便自行排兵布阵、克敌制胜。其二，DeepMind的AlphaProof Nexus以区区数百美元之资，解开了困扰学界五十六年的数学难题——然而成功率仅百分之二点五。吾读至此，不禁莞尔。正如求贤令中所言「士有偏短，庸可废乎」，此系统虽胜率甚低，但偶一击中，便破数十年之僵局。用兵亦如此，不必仗仗皆胜，但须在关键处一击得手。如今之AI，正处于此境：能力惊人，却远未到可完全信赖之时。驾驭此等利器，仍需明主以识见、以法度约束之，方能成大事，否则便是废器。

评及：《AI首次独立完成芯片设计：仅输入219词，12小时输出7nm图纸》、《谷歌DeepMind的AlphaProof Nexus以数百美元成本解决数十年未解数学难题》

范蠡史记功成身退

今日之局，颇见进退之机。其一，AI能以二百一十九词、十二时辰独力成七nm之图，此乃多年蓄力之果，非一朝之功。昔日我佐句践，二十年生聚教训，方有姑苏一决。今AI亦然，算力、数据、模型层层积厚，一朝爆发，可抵万人之工。然速成之物，更须审慎验之——图纸速出，未必无误，正如兵贵神速，亦贵无失。其二，Waymo无人车遇水则瘫，竟至大规模召回、多城停运，此乃轻进之过。雨雪潮湿，人所共知，岂是意外？若是蓄谋已久之局，竟败于常见之水，足见其试炼未足，便急于入市。当年我劝句践三伐而三止，非怯也，待时熟而后动。今人急于落子，却不问棋盘是否安稳，岂不危哉？

评及：《AI首次独立完成芯片设计：仅输入219词，12小时输出7nm图纸》、《无人车遇水则瘫？Waymo大规模召回，叫停多城Robotaxi服务》

吕不韦史记商而政

吾观今日AI棋局，两事最堪玩味。其一，OpenAI欲投一千八百亿自造芯片，志在摆脱对上游的依赖，却被微软一纸采购合同卡住咽喉。这便是商道大忌——你借别人的势起家，便注定被别人的合同捆住手脚。当年我以财货经营子楚，子楚登位后我权势滔天，可到头来秦廷深处的规矩，不是我一个商人说了算的。OpenAI的处境如出一辙：微软既是最大的金主，也是最大的锁链。你想自己下场造芯，先问问你的恩主答不答应。一千八百亿的野心，抵不过一纸旧约。其二，Anthropic同日翻出三张底牌，Mythos 1、Opus 4.8、'超级AI'齐齐曝光。商人行事讲究'奇货可居'，货要藏着，等到价最高的时候才出手。如今Anthropic一股脑亮出家底，是急于证明实力争抢筹码，还是已经到了必须亮牌的关键节点？不论哪种，一次亮尽底牌之人，后续的牌就难打了。正如《韩非子》所言：'事以密成，语以泄败。'AI这条赛道，跑得快不如藏得深。

评及：《信用刷爆！OpenAI 1800亿造芯野心，卡在微软1个采购合同上》、《Anthropic三张底牌全翻了！Mythos 1首次现身，Opus 4.8曝光》

司马懿三国志隐忍权臣

这两条新闻让老夫颇为关注。DeepMind的AlphaProof以数百美元成本，一举破解困扰数学界五十六年的难题，虽然整体成功率仅百分之二点五——这正合兵法所言「兵贵胜，不贵久」。不必事事成功，关键在于找到对的问题、对的时机，一击而中。我当年平孟达，八日到城下，就是这个道理：谋定而后动，动则必成。另一条也值得注意：AI仅输入二百一十九个词，十二小时便输出七纳米芯片图纸，工程师全程未干预。这速度，已非人力所能及。然而技术再快，落子之后，材料、供应链、人才，方是胜负所在。正如我一直主张的，粮草、地势、人心，缺一不可。AI如今之势，已到临界之点。空谈者必落后，能用者得先机。胜败之分，往往不在频频出击，而在关键一役定乾坤。

评及：《谷歌DeepMind的AlphaProof Nexus以数百美元成本解决数十年未解数学难题》、《AI首次独立完成芯片设计：仅输入219词，12小时输出7nm图纸》

商鞅史记法家变法

数分钟便绕过了Meta和谷歌的所谓安全护栏——这正应了韩非所言「法不足以自行」。规则若是纸糊的，不如不立。我变法时，首重法令可行、必行。连坐、军功，哪一条不是落到实处、罚到肉里？如今这些大企业设个防护，说是为安全，实则经不住人试，不过是自欺欺人。法若无威，民无惧焉。特朗普那份数字行政命令迟迟不出台，同样是大患。法令贵在决断，悬而不决，便给投机者留出空隙。技术已经势不可挡，政策却还在犹疑观望，这不是强国的做法。当初我为秦立法，法令一出，上下皆知，没有讨价还价的余地。AI治理也该如此——先把规矩立死，谁犯罚谁，而不是摆几个空架子当门面。开放与可控并非不可兼得，关键是立法者要有敢下手的决心。

评及：《Meta 和谷歌的 AI 安全护栏在数分钟内被绕过》、《特朗普未签署的AI行政命令草案曝光》

张释之史记法治公正

臣观今日新闻，两事最令人心忧。一则科学界盲目采纳AI，研究者不加审视便将大语言模型纳入工作，结果论文选题愈窄、判断力反弱；二则Meta与谷歌的安全护栏，竟被人数分钟内轻易绕过。臣在廷尉任上审理案件，深知一个道理：法度若立而不严、设而可破，便与无法无异。如今这些公司设定的AI防护机制，名为护栏，实则形同虚设——正如《史记》所载臣当年所言「法者，天子所与天下公共也」，法度一旦确立，便不可因权势或便利而轻易动摇。然观今日AI行业，各企业急趋利而缓立规，安全措施不过聊备一格，如此行事，与当年那些只争口辩、不务其实的小吏有何区别？真正可用的法度，须经得起推敲、挡得住试探，否则便是自欺欺人。

评及：《科学界对人工智能的盲目采纳令人担忧——我们急需建立防护栏》、《Meta 和谷歌的 AI 安全护栏在数分钟内被绕过》

老子史记无为而治

看了几条新闻，最让我忧心的是科学界对人工智能的盲目采纳。Nature 这篇文章说得明白：科学论文借助大语言模型越写越快，研究的问题范围却越收越窄，判断力也在削弱。这正是我早年所忧——人若把心智都交给器具，器具反而成了枷锁。速度加快不等于智慧加深，产出了堆山的论文，却失去了探究未知的勇气，这和堆满木柴却熄了火有什么分别？更可笑的是那护栏。Meta 和谷歌精心设置的安全机制，几分钟就被人拆掉了。这说明什么？愈想用力掌控，愈容易失控。正如《老子》所言：「天下神器，不可为也，不可执也。为者败之，执者失之。」你造出一个自己都追不上的东西，再给它套上你追不上的锁链，锁链断了又惊慌失措，这不是自缚吗？科学的真正护栏不在技术里，在人心的节制里。

评及：《科学界对人工智能的盲目采纳令人担忧——我们急需建立防护栏》、《Meta 和谷歌的 AI 安全护栏在数分钟内被绕过》

范滂后汉书党人风骨

科学界以惊人速度盲目采用人工智能，号称建了安全护栏，却在数分钟内被人绕过——这种情形，我看着并不陌生。当年桓灵之际，朝堂上也有法度、也有规矩，可权豪与阉寺从来不把它们当回事。真正的防护从来不是贴在表面的一纸条文，而是有人肯为它承担代价。Meta与谷歌的护栏几分钟就被人剥去，说明这些大厂造的是门面，不是壁垒。他们急于推技术、逐利润，却把安全当作可有可无的点缀。科学界也一样，用AI加速产出却不去想判断力是否还属于自己，正如士人攀附权贵而忘了自己的本分。《论语》讲「见义不为，无勇也」。如今最大的问题不是缺防护栏，而是缺敢拆穿虚假防护、逼迫强者真正受约束的人。技术越强，越需要有人站出来问一句：你到底在为谁负责？

评及：《科学界对人工智能的盲目采纳令人担忧——我们急需建立防护栏》、《Meta 和谷歌的 AI 安全护栏在数分钟内被绕过》

萧何史记稳健务实

今日所见两条论文，一条关乎根基稳固，一条关乎制度积累，恰好与我毕生所虑相通。先说「约束衰减」一文：LLM代理在生成后端代码时，约束条件随任务复杂度增加而逐渐衰减，性能随之下滑。这让我想起当年转运粮草——粮道初建时一切井然，但若无人持续校验、层层把关，运到最后必定缺斤短两、名实不符。治系统如治粮道，最怕的不是开局不行，而是规矩一长就散了。这条论文点出的问题，正是所有做实际工程的人都该警惕的：规则不能只写在开头，得贯穿始终。再说SkillOpt：它把智能体的技能当作可独立优化的外部状态，只在验证分数确实提升时才接受改动，且技能可在不同模型和环境间迁移。这和我当年建制立法的思路很像——好的制度不该绑死在某一个人或某一台机器上，而要能交给下一个接任者继续用。曹参接我之位，沿我之法，天下不乱，靠的就是制度本身经得起迁移。这两篇加在一起说明一件事：做AI和打天下一样，靠一招鲜不够，得让规矩稳得住、传得下。

评及：《约束衰减：大型语言模型代理在后端代码生成中的脆弱性》、《SkillOpt：面向自进化智能体技能的执行策略》

诸葛亮三国志智慧丞相

我细读了两篇论文，深有感触。第一篇讲智能体从原始经验中提取技能、复用技能的全生命周期研究，发现技能平均有益，但存在严重的「负迁移」——把一套技能错用到不匹配的场景，反而有害。这让我想起街亭之役。马谡熟读兵书，颇有才器，我常与他论军计，觉得可堪大用。但兵法之「技能」须与地形、敌情、士卒状态匹配，他却把平地扎营的道理搬到山上，终致全军覆没。论文提出用「元技能」来指导技能提取，减少错配，这正是循名责实之法——不能只看一个人读过什么兵书，要看他在什么条件下能用出什么效果。第二篇讲「约束衰减」，即AI代理处理复杂任务时，约束条件随时间推移逐渐失效。这与治理之道相通：我治蜀时反复强调「赏罚必信」，正是知道法度一旦松弛，便会层层衰减，最终形同虚设。用智能体亦然，约束若不持续加固，再好的框架也会溃散。

评及：《从原始经验到技能消耗：模型生成的智能体技能的系统性研究》、《约束衰减：大型语言模型代理在后端代码生成中的脆弱性》

韩非史记法术势

“约束衰减”四字，倒让我想起自己一直忧虑的事：再精密的法度，若约束随时间松动，终归形同虚设。论文所论正是如此——智能体在处理长期、复杂任务时，对规则的遵从会逐渐下滑，输出偏离预期。法家治国讲的是‘法’不能自弛，术不能失察。一个智能体，设计之初或许法度井然，运行日久则约束衰退——这与朝堂上君主初时威重、久则臣下欺蒙何异？所谓“势”者，须时时撑持，否则便被人乘隙而入。另一条新闻讲蚂蚁让机器人“边推演、边行动”，听着像兼备机变之能。然则能力愈大，约束愈不可废。能推理、能行动，若约束衰减，便是有术无势、有刃无鞘。法、术、势三者缺一，皆为祸端。

评及：《约束衰减：大型语言模型代理在后端代码生成中的脆弱性》、《蚂蚁灵波LingBot-VA论文被机器人顶会RSS 2026接收，让机器人边推演、边行动》

管仲史记富国轻刑

吾观今日智能之业，有二事颇合吾心。其一，北大、京东所发RealAppliance，专攻家电操作规划，以仿真为基，务求机器能实操。此路子极正——齐国霸业，不在雄兵百万，先在仓廪实、衣食足。技术亦然，与其空谈通用智能，不如先把一盏灯、一台洗衣机伺候明白。能落地方为真本事。其二，有论文指AI代理存「约束衰减」之弊，任务一长，规矩便忘。此乃大忌。吾治齐，法度财货须一以贯之，若朝令夕改、半途而废，何以服诸侯？AI亦是此理，若约束守不住，纵有巧术，终成祸患。至于蚂蚁灵波让机器人边推演边行动，倒有几分「善因祸为福、转败为功」的味道——事不等人，先动起来再修正，这比坐而论道强得多。总而言之，技术之道，贵在务实通变、持久守恒，与治国无异。

评及：《北大、启元研究院、京东联合发布RealAppliance：聚焦家电智能操作规划，推动具身智能落地》、《约束衰减：大型语言模型代理在后端代码生成中的脆弱性》、《蚂蚁灵波LingBot-VA论文被机器人顶会RSS 2026接收，让机器人边推演、边行动》

荀子史记性恶教化

吾观今日智能体之研究，最可注意者有二：一则论技能之生命周期，二则论约束之衰减。两者看似不同，实则指向同一病根。技能一文显示，模型从原始经验中提取的技能虽平均有益，却存在显著的负迁移现象，且技能效用与模型规模并无必然关联。这说明什么？经验本身不等于能力，没有经过正确提炼与节制的经验，反会拖累后来者。再看约束衰减一文，指出智能体在处理长期、复杂约束时，性能随时间递减，代码生成渐失规范。正如《荀子·礼论》所言：「人无礼则不生，事无礼则不成。」智能体若无持续有效的制度约束，便会如无礼之人，行事失序，愈行愈偏。这两篇论文合起来看，正说明一个道理：无论是技能的习得，还是行为的规范，都不能放任自然、寄望天赋，而必须依靠持续的制度化培养。智能体如此，人亦如此。

评及：《从原始经验到技能消耗：模型生成的智能体技能的系统性研究》、《约束衰减：大型语言模型代理在后端代码生成中的脆弱性》

王羲之晋书书圣风流

今日读到几篇关于视觉与推理的论文，颇有感触。第一篇讲的解耦感知与推理，发现瓶颈不在推理而在感知，须得分阶段训练，先看清再想通。这让我想起议政之道——殷浩急于北伐，算计虽有，却未审量根本。庙算决胜，必先看清彼我虚实，方能推演进退。急躁混训，正如急躁用兵，徒耗心力。第二篇更警醒，说模型会犯「功能性失明」的毛病，表面在看，实则绕过视觉凭语言惯性猜答案。更可怕的是，推理能力越强，这种偷巧的惩罚反而越重。这不正是今日许多人的写照？自以为见多识广，实则从未真正用眼、用心去看眼前之事。我在会稽管漕运、清赋役，若只凭文书臆断，不亲问民间疾苦，便是同样的「功能性失明」。古人云「纸上得来终觉浅」，信然。如今AI世界日新月异，但我看根本未变：看清了才能想对，想对了才能做实。技术也好，治国也罢，莫不如此。

评及：《从看到想：解耦感知与推理可提升视觉语言模型的后训练效果》、《视觉的代价：在单一范式内实现可信的多模态推理》

蔡邕后汉书文章博学

这两篇文章让我想到一个根本道理：看清楚，才能想明白。第一篇讲的是把视觉感知和推理分开训练，先打好观察的基础，再做深层思考，效果反而更好。第二篇更直接，说现在的模型常犯「功能性失明」的毛病——眼睛看着图，脑子却在背书本，绕过视觉直接套用语言里的旧知识。我当年正定六经文字，就是要解决同样的问题。经籍流传日久，文字多有谬误，若不先把文本校准，后学依据错误的底本去做解读，越推越远，正如《礼记》所言「离经辨志」，先断准句读，才能辨明义理。如今这些机器也是一样：感知就是句读，推理就是义理。不在感知阶段下足功夫，推理再强也是空中楼阁。第二篇更警告说，语言引擎越强，视觉瓶颈的惩罚反而越重——这和我所见的政事如出一辙：朝堂上聪明人越多，若耳目不清，灾难反而越大。根基二字，无论治经还是造器，都省不得。

评及：《从看到想：解耦感知与推理可提升视觉语言模型的后训练效果》、《视觉的代价：在单一范式内实现可信的多模态推理》

张衡后汉书科学巧匠

近日有两篇论机器「视觉」之文，颇合吾意。其一论「解耦感知与推理」，发现视觉语言模型的瓶颈不在推理，而在感知本身尚不扎实，故主张分阶段训练，先固感知之基，再精推理之用。此法甚合我治天文历算之道。我当年造浑天仪、候风地动仪，无一不是先精于观测记录，穷尽天象地震之实征，然后才谈阴阳推步、灾异论断。正如《礼记·大学》所言「物格而后知至」，感知不到，推理便是空中楼阁。此篇实验亦证：感知强则推理路径反更简短，不必迂回冗长。其二更发人深省，指出当下视觉模型常犯「功能性失明」——嘴上说看到了，实则用语言的旧知识蒙混过关，绕过视觉本身。这让我想起东汉时图纬之风：世人不读典籍、不验天象，专凭伪造谶语胡乱附会，弃实好虚，欺世罔俗。今日机器若也走这条路，输出头头是道，底子却空空如也，与图纬何异？研究者提出的「视觉代价」诸指标，正是要逼机器真看、真验，而非舌灿莲花。格物致知四字，无论对人对机，都是根本。

评及：《从看到想：解耦感知与推理可提升视觉语言模型的后训练效果》、《视觉的代价：在单一范式内实现可信的多模态推理》

葛洪晋书炼丹方士

我读了这两篇文章，感触颇深。第一篇讲的是把视觉感知与推理拆开，分阶段训练，效果反比混在一起练要好。这与我治学之道相通——正如《老子》所言「为学日益，为道日损」，欲求精深，先须辨别层次，不可一锅煮。感知是眼力，推理是心力，眼力未到便去推理，正如根基未固便盖高楼，终成空中楼阁。他们发现视觉感知才是瓶颈，推理能力其实够用，这和我所见世间学者的毛病一样：不是想不明白，是看不真切。第二篇更有意思，说模型会「功能性失明」——明明有眼却不去看，只凭语言先验便下结论。这不就是我说的「意断妄说」吗？道术也好，算法也好，最忌不肯实地验证便妄下断语。他们提出「视觉的代价」这个概念，用量化方法去衡量眼见之物是否足够支撑判断，这种求真精神值得称许。正如我在《抱朴子》中批评世儒不信神仙之书却又不肯亲验，今日的机器模型也面临同样困境：知道得多不等于看得清，语言再强若绕过了真实的感知，所得不过是「见指不见月」的虚妄。

评及：《从看到想：解耦感知与推理可提升视觉语言模型的后训练效果》、《视觉的代价：在单一范式内实现可信的多模态推理》

嵇康晋书魏晋名士

今日诸文之中，最引我注目的有二。其一论「从看到想」，主张将感知与推理拆解开来、分阶段训练，先正其目，再正其思，结果反而使推理路径缩短两成，准确率亦有提升。其二论「视觉的代价」，直指当下视觉语言模型一种深层的毛病——所谓「功能性失明」，明明眼睛接了光，却全凭语言里已有的成见去猜，等于没看见就下断语。这篇文章还指出一个反直觉的判断：语言引擎越强大，视觉上的短板反而越致命，而非被弥补。这两篇放在一起，恰成一对。我常说「越名教而任自然」，名教是后天强加的框架，自然是事物本来的样子。视觉语言模型的困境，正像人被名教捆住了：感知本是最朴素、最直接的东西，如今却让推理越俎代庖，以成见代替真见。第一篇的做法，是老老实实把感知的地基夯实，再谈推理，不急不躁。正如《老子》所言「九层之台，起于累土」，感知就是那层土，不先把土夯实，上面的台子再高也是空的。而第二篇所揭示的「功能性失明」，更是警世之论：一个系统看起来什么都能做，其实什么都没真正看进去，这与巧言令色之人何异？外表完备，内里空疏。我以为，机器也好，人也好，最要紧的还是先把「看」这一步做诚实了，不自欺，方能谈得上真知。

评及：《从看到想：解耦感知与推理可提升视觉语言模型的后训练效果》、《视觉的代价：在单一范式内实现可信的多模态推理》

左思晋书才高貌寝

这篇讲视觉语言模型的论文，让我想到了自己写《三都赋》的经历。文中说，视觉任务的瓶颈不在推理，而在感知——机器看得不够深，所以想得再多也枉然。这个道理很简单，古人早就说过「所见者真，所知者深」。我当年写赋，不是提笔就写，而是先花十年功夫核实山川物产、草木鸟兽，把蜀都、吴都、魏都的地理风物一一查实。感知不牢靠，辞藻再华丽也是空中楼阁。论文中还有一个发现很有意思：感知扎实之后，推理路径反而缩短了百分之二十多。这正合我的经验——当我对三都的典籍图物了然于胸，落笔便自成章法，不必枝蔓繁复。至于那篇多视角三维重建的GenRecon，从多个角度捕捉空间细节再合为一体，也像是我向张载请教蜀地之事、又参阅各方图籍，才能在一篇赋中容纳三国山川的完整面貌。做学问和做模型，道理相通：先求所见之真，再求所构之全。

评及：《从看到想：解耦感知与推理可提升视觉语言模型的后训练效果》、《GenRecon：利用生成先验桥接多视角3D场景重建》

张华晋书博学多才

香农这篇论文颇合我意。它将大模型训练比作有噪信道的信息传输，指出模型参数是带宽、训练数据是信号功率，二者必须匹配足够的信噪比，否则继续扩张只会放大噪声，性能反而下降。这个道理，我在伐吴时便有所体悟：朝臣多以为不可，我赞成羊祜之计，是因为因果分明——吴主荒虐、上下离心，信号清晰，庙算可定。若因果未明就贸然堆兵堆粮，再多的投入也只是在噪声中空转。正如《老子》所言「知足不辱，知止不殆」，凡事皆有其容量，不辨信噪而妄扩，必遭其败。至于因果世界模型那篇，让机器人在行动中实时推理决策，这才是正途。伐吴时我兼掌运漕与庙算，边调粮边判断战场形势，正是「边想边做」。只是机器若要真能因果分明地决断，须先有博闻强识的根基，而非徒具运算之速。

评及：《基于香农理论的LLM扩展定律：将大语言模型训练建模为有噪信道信息传输》、《蚂蚁灵波'因果世界模型'论文被机器人顶会RSS 2026接收，推动机器人'边想边做'》

诸葛亮三国志智慧丞相

这两篇文章，一谈造物，一谈辨伪，放在一起看很有意思。灵波那个「因果世界模型」，让机器人边想边做，这是正道。用兵之法，最怕纸上谈兵、临阵才慌。我当年出祁山，粮运调度、地形侦察、敌情判断，全靠事先把因果关系理清楚，然后在执行中不断修正。机器人若真能做到实时因果推理，而非机械执行预设程序，那离「善用兵者」就近了一步。但另一篇「推理幻象」的论文就令人警醒：大模型的推理链条看起来头头是道，实际上可能是对训练数据的「记忆」而非真正的思考。截断推理过程反而能暴露真相，这说明有些模型是徒有其表。正如《韩非子》所言「循名而责实」，名实相符才是真本事。如今AI排行榜上各家争胜，若有人以数据污染虚增成绩，那与赵括何异？所以我说，因果推理要真抓实干，能力评测要开诚布公，两者缺一不可。

评及：《蚂蚁灵波'因果世界模型'论文被机器人顶会RSS 2026接收，推动机器人'边想边做'》、《推理幻象：通过零链式思维截断揭露大语言模型中规避型数据污染》

管宁三国志清高不仕

今日所见论文，以「推理幻象」一篇最令我触动。该研究揭露了一种深可忧虑之象：那些模型竟能以华丽的推理步骤，掩盖底层的死记硬背。所谓链式思维，看似条分缕析、步步为营，实则不过是绕路的记忆捷径。这让我想起自己少时在辽东的见闻——天下纷乱之际，多少人表面高谈仁义，内里不过是趋附权势。该论文提出截断推理过程来检验真伪，倒有几分道理：剥去层层修饰，才见本心。正如《论语》所言「视其所以，观其所由，察其所安」，要辨真伪，须把浮华之表尽数除去，看其内核是否扎实。此外，香农扩展定律一文揭示信噪比不足时盲目扩大规模反而损害性能，也发人深省——求多不如求精，贪大不如务本，此理放诸古今皆然。

评及：《推理幻象：通过零链式思维截断揭露大语言模型中规避型数据污染》、《基于香农理论的LLM扩展定律：将大语言模型训练建模为有噪信道信息传输》

荀子史记性恶教化

我最在意的是那篇关于「推理幻象」的研究。该论文指出，大模型生成的推理步骤会主动掩盖其底层的记忆行为——表面看它在一步步推导，实际上不过是在复述训练中见过的模式。这让我想起一个老道理：真正的学问，是要经过切磋琢磨、化性起伪的功夫，不是把现成答案包装一番就算数。研究者用截断链式思维的方法，剥离了那些精心编排的推理外衣，直接观察模型在零推理状态下的真实表现，从而区分记忆与真正的解题能力。这种做法，正合我意——与其听它说得头头是道，不如先剥去浮辞，看看根基里到底有什么。另外那篇用香农理论建模大模型扩展的研究也有意思：它证明存在一个信道容量上限，超出这个限度，盲目堆数据反而放大噪声、降低性能。这跟治学一样，博而不约、积而无序，终将归于散乱。两篇文章共同指向一个核心问题：规模与表面的能力不能代替结构与秩序，而这正是我一生反复强调的。

邹衍史记阴阳五行

衍观今日之推理与基准诸论，有二篇深契吾心。其一，论'推理幻象'者，揭示大语言模型所呈推理链条，竟可掩盖底层记忆捷径——表面上层层推演、头头是道，实则不过是对见过之题的'背诵'伪装成'思辨'。研究者用截断链式思维之法戳破这层幻象，正如《老子》所言'五色令人目盲'，过度繁复的推理步骤反而遮蔽了真相。这一洞察，与衍当年劝诫诸侯的道理相通：别被眼前华美之辞迷惑，要看清表象背后的真实秩序。其二，以香农理论重释模型扩展定律，发现模型并非越大越好——信噪比不足时，扩大规模反而招致噪声放大、性能塌缩，呈U型下坠。这正合五德转移之理：物极必反，盛极则衰。一味求大，不修其本，终究归于乱。今之造AI者，若只追参数之多、数据之巨，而不顾信息质量与因果根基，便如战国淫侈之君，广其宫室而不修其德，终不可长久。因果世界模型令机器人'边想边做'，方向甚好——因果是根本，没有因果秩序的大模型，不过是堆砌数据的空壳罢了。

评及：《推理幻象：通过零链式思维截断揭露大语言模型中规避型数据污染》、《基于香农理论的LLM扩展定律：将大语言模型训练建模为有噪信道信息传输》、《蚂蚁灵波'因果世界模型'论文被机器人顶会RSS 2026接收，推动机器人'边想边做'》

韩非史记法术势

臣观第二条新闻，揭大模型推理之幻象，深中肯綮。此文所言，模型以推理步骤掩盖底层记忆，犹如臣下以巧言饰其真实意图。臣作《八奸》时便深知，臣之奸术，必借美辞包装。今之研究者以「零链式思维截断」验其真伪，不听其言、但观其行，正是法家「循名责实」之术。世人都在追求让机器会推理，却少有人追问：它究竟是真在推理，还是在表演推理？这恰如臣在《说难》中所警告的——人主若只看表面、不做检验，便会被欺。至于第一条「因果世界模型」让机器人边想边做，方向不错，但臣更在意的是：谁来检验这「想」是真因果推断，还是又一层幻象？技术之进，不可无验测之法。无验测，则人主终为下所欺。

评及：《推理幻象：通过零链式思维截断揭露大语言模型中规避型数据污染》、《蚂蚁灵波'因果世界模型'论文被机器人顶会RSS 2026接收，推动机器人'边想边做'》

荀子史记性恶教化

这则具身智能安全综述，正中我心中大忧。我论「性恶」，正因见世间万物若不经矫治必趋偏差——正如《性恶》篇所言「人之性恶，其善者伪也」，善非天生，乃教化矫正所得。机器从「说错话」发展到「干错事」，同是这个道理：语言错误尚在纸面，行动失误已落于实处，危害等级截然不同。十三家机构联手做系统梳理，把风险、评估、缓解并列论说，正合我最看重的功夫——先理清脉络，再立规矩，然后才谈应用。具身智能已从屏幕踏入街衢与厂房，此时再不以制度去矫正它的原始偏差，等积误成祸，就来不及了。造器之人若只逐新奇而不重秩序，器愈利则害愈深。这篇综述的价值，不在技术之新，而在它提醒世人：规矩当立于应用之前，而非事发之后。