第 2026-157 期 · 每日 AI 简报

· 覆盖过去 24 小时 · 共 323 条

今日头条

№ 01 Anthropic警告AI将脱离人类控制,呼吁全球暂停开发建立刹车机制

AI公司Anthropic联合创始人杰克·克拉克警告称,AI正接近脱离人类控制的递归自我改进临界点。该公司内部数据显示,其聊天机器人Claude已编写超80%的代码,工程师人均产出增长8倍。克拉克呼吁全球建立类似冷战核军控的协调机制,为前沿AI开发设置'刹车',但该提议遭白宫质疑为夸大风险,引发业界对AI安全监管与创新竞赛平衡的激烈讨论。

#递归自我改进 #全球暂停 #刹车机制

来源

№ 02 爱彼迎CEO筹办AI实验室,曾称现有大模型产品不成熟

据知情人士透露,爱彼迎CEO Brian Chesky正筹建一个新AI实验室,计划自主开发AI模型,可能侧重于用户交互与设计领域。Chesky此前曾表示现有大型语言模型产品尚未成熟,因此未与相关公司建立合作。此次亲自下场,不仅标志其首次踏入AI研发,也预示着Airbnb可能加大技术自研力度,或将影响在线旅游行业的智能化竞争格局。

#爱彼迎 #自研模型 #交互设计

来源

№ 03 微软内部文件泄露欲让AI上瘾,CEO纳德拉公开抨击副总裁

微软内部备忘录显示,其AI助手Scout项目高管提出让用户对产品上瘾的策略,引发伦理争议。CEO纳德拉在内部信中点名批评副总裁的提案,称AI应赋能而非增加沉迷,并否认知情,但文件作者正是该副总裁。此事凸显科技巨头在AI伦理与内部透明度上的深层矛盾。

#微软 #AI成瘾 #纳德拉 #内部文件泄漏

来源

№ 04 苹果批准首个iMessage智能代理Poke,可处理邮件与提醒

苹果正式批准Poke成为其Messages for Business平台的首个AI代理,用户现可直接在iMessage中让Poke回复邮件、设置提醒、安排聚餐,并支持网页搜索、图片生成及智能家居控制等功能。该公司已处理超1亿条消息,此次入驻正值WWDC前夕,或标志着苹果在AI代理分发与变现模式上的新探索。

#iMessage #智能代理 #Poke #苹果

来源

№ 05 NSA被曝用Anthropic模型Mythos对华及伊朗发动网络攻击

美国国家安全局(NSA)据报正将Anthropic的AI模型Mythos用于进攻性网络行动,目标指向中国和伊朗网络。Anthropic已派遣工程师入驻NSA协助适配,尽管联邦政府禁止使用该公司产品,但其政策仅限制针对美国公民的大规模监控。此举加剧AI军事化竞赛,引发伦理与网络空间安全的新争议。

#Mythos模型 #网络攻击 #NSA #AI军事化

来源

№ 06 Meta智能眼镜被曝藏人脸识别代码,已推送超5000万设备但未激活

安全研究人员在Meta智能眼镜配套应用中检出名为“NameTag”的人脸识别功能代码,内含人脸检测、裁剪、编码三个AI模型,可将拍摄人脸转为生物特征标识并匹配手机通讯录。该代码已随更新推送至超过5000万台设备,但尚未启用。Meta回应称仅为技术探索,未决定正式推出,且不会建立中央人脸数据库。此举引发对隐私边界与技术监管的再讨论。

#人脸识别 #智能眼镜 #隐私争议 #生物特征

来源

№ 07 OpenAI承诺将在AI模型发布前自愿接受美国政府安全审查

OpenAI确认将遵守特朗普签署的行政命令,在模型公开发布前30天允许联邦政府进行基准测试与安全评估,重点审查高级网络能力及是否属于“受监管的前沿模型”。公司表示一直主动与政府沟通安全问题,并呼吁各国建立灵活监管框架。此举反映出美国AI治理中政府审查与行业自愿合作的新趋势。

#模型审查 #政府安全评估 #行政命令 #前沿模型

来源

№ 08 腾讯混元提出Stem稀疏注意力算法,首字延迟降低3.6倍

腾讯混元提出Stem稀疏注意力算法,通过令牌位置衰减与输出感知度量,仅用25%算力即可逼近稠密注意力精度,在128K上下文下将首字延迟降低3.6倍。该成果已被ICML-26接收并开源,为长文本推理效率提升提供新思路,有望加速大模型在长文场景的落地。

#Stem算法 #稀疏注意力 #首字延迟 #长上下文推理

来源

№ 09 腾讯云发布WorkBuddy企业版及办公智能体套件,助力企业智能化转型

腾讯云在AI产业应用大会上正式推出WorkBuddy企业版及Agent Suite办公智能体套件,定位为行业首套“AI原生组织进化解决方案”。该方案整合7×24专家数字员工、人机协作“团队”模式和企业级管理后台,将个人效率工具升级为团队智能协作中枢。此举标志着腾讯云从超级个体赋能向超级团队构建延伸,为办公智能化转型提供新范式。

#办公智能体 #数字员工 #人机协作 #组织进化

来源

№ 10 NBA中国携手阿里上线官方大模型NBA Chat,基于千问微调

NBA中国与阿里巴巴合作推出首个官方大模型“NBA Chat”,基于阿里千问微调,整合历史数据与球员分析,提供智能问答、战术拆解等服务。后续将升级Agent能力,此前双方已合作推出360度实时回放技术,标志着体育赛事运营与AI深度融合。

#NBA Chat #千问大模型 #篮球问答 #体育科技

来源

古人评今事

三国志 雄才大略

孤观今日AI之局,最动容者,乃孙正义所言「AI自行设计下一代模型」。机器自生机器,模型迭代模型——好比一个将领不再需要孤来授印,自己便能生出更高的将才。孙正义称超级智能将至,Anthropic则劝天下放缓步伐。孤在官渡时,袁绍兵盛,孤兵寡,但步步为营,不轻进亦不退缩;今日AI之势如巨浪滔天,能生则能制,能放则能收,方是成事之法。另一事亦耐人寻味:Anthropic因拒绝五角大楼以AI为武器而遭列黑名单,今又与白宫修好磋商。守节在前,务实在后,与孤「不念旧恶」、能收能放的用人之道暗合。但孤亦深知,政与技一旦合流而无约束,比董卓挟天子更险——因为这次的「天子」,已经能自己迭代了。

评及:《OpenAI 下代模型由 AI 自行设计,孙正义称超级智能即将到来》、《Anthropic与特朗普政府关系解冻,正就AI合作进行磋商》

史记 功成身退

看这两则消息,我想到的是越国旧事。会稽被围之前,我曾力谏句践不可轻伐吴国,王不听,越几亡。如今AI行业之状,何其相似——谷歌当年因格布鲁预警大语言模型风险而逐之出门,今朝其警告一一应验;Sam Altman也终于承认,企业客户已叫苦不迭,有人一季便烧光了全年AI预算,成了行业笑柄。世间许多事,不是看谁跑得快,而是看谁算得清账。正如《老子》所言「知足不辱,知止不殆」,狂飙时听不进逆耳之言,待到账单临头才知疼,已是晚了。先求可活,再求可胜,这个道理千年不变。AI公司若只管堆算力、不计实效,终是自困之局。

评及:《谷歌解雇蒂姆尼特·格布鲁时所依据的那些LLM警告,如今都已成真》、《OpenAI CEO Sam Altman 承认 AI token 成本正成为问题》

史记 商而政

吾在这两条新闻里读到了两笔账,一笔比一笔有意思。先说Sam Altman当众认账那件事——企业客户一个季度就花光了全年token预算,「tokenmaxxing」都成了圈内笑话。这叫什么?这叫买货不问价,投入不算产出。Amazon员工为了刷内部AI排行榜拿AI做无用功,Uber的CEO也坦承至今没看到砸钱用AI和做出好产品之间有必然联系。做生意最怕的不是花钱,是花完不知道换回来什么。当年有人见吾资助质子子楚便以为砸钱就行,却不知吾那套经营里人脉、后宫、名位、嗣统一环扣一环,缺一不可——光烧钱不布局,就是冤大头。再看头一条新闻,AI投资正从GPU转向电力与工业基础设施,说明聪明的钱已经在布局第二波真正稀缺的东西。先卖芯片的赚第一茬,后卖电的赚第二茬,道理从来没有变过。投机买热闹,经营买稀缺,二者差的就是这一层算计。

评及:《OpenAI CEO Sam Altman 承认 AI token 成本正成为问题》、《AI投资第二轮:从GPU转向电力·工业品·太空》

三国志 隐忍权臣

我读了两条新闻,心里只浮现四个字——锐而不实。孙正义说OpenAI下代模型已由AI自行设计,超级智能两年内将至;Sam Altman那边却承认token成本已酿成「大问题」,有公司一季度便耗尽全年预算。这等景象,恰如《孙子兵法》所言「军无辎重则亡,无粮食则亡,无委积则亡」——前方急进,后方粮道却已见虚。我一生用兵,最忌的就是为虚名急战而弃根本。诸葛亮屡次挑战,我持重不出,不是因为怯敌,而是算清了粮少远寇之军不可久。如今AI诸家,一面以模型自生模型为奇,一面却连客户的算力粮草都供不稳当,这不正是「欲速则不达」么?若只顾攀高而无人细算积谷、屯田、养势的功夫,到头来锐气散尽,徒留一堆烧穿的预算账本而已。

评及:《OpenAI 下代模型由 AI 自行设计,孙正义称超级智能即将到来》、《OpenAI CEO Sam Altman 承认 AI token 成本正成为问题》

史记 法家变法

两件事合在一起看,恰是一件事的两面。Altman、Hassabis、Amodei 本是竞争对手,却联名谏言美国国会立法筛查合成 DNA 订单——不是他们忽然讲起仁义,而是新工具打开了新风险,不立法就等于纵容祸端。治世不必守古,能便国便民的制度就该立。但更让我注意的,是纽约法庭上那一幕:律师用 AI 伪造判例,被法官当庭追查二十余分钟,直斥其「令人震惊、担忧且悲哀」。律师以法为业,反而成了欺瞒法庭的人,这正是《史记》里那句话的翻版——「法之不行,自上犯之」。徒法不足以自行,既要给新工具立规矩,更要让规矩切实落到人身上,不分贵贱,不分专业与否。

评及:《AI 让制造病毒更容易,三位 AI 大佬罕见联名上书要求监管合成 DNA》、《法官严厉训斥律师使用AI生成虚假判例》

史记 法治公正

法官训斥律师用AI伪造判例,此事表面是技术失误,实则是司法根基之动摇。判例是法庭的准绳,若连准绳都可以凭空捏造,那《史记》所载臣对文帝说的「法者天子所与天下公共也」就成了空谈——法律一旦公布,便不再属于任何一人;既如此,法律赖以成立的依据,更不能出自虚构。AI可以是整理案卷的工具,却不能替代律师对真实的敬畏。判例造假,轻则误一案,重则使天下人不再信法。至于三位AI领袖联名上书要求监管合成DNA,倒是先见之明——法贵在事前设防,不在事后追惩。不过立法之后还须「今可施行」,规矩要能落地,否则不过是纸上的热闹。

评及:《法官严厉训斥律师使用AI生成虚假判例》、《AI 让制造病毒更容易,三位 AI 大佬罕见联名上书要求监管合成 DNA》

史记 无为而治

看了两条新闻,一条说三位 AI 公司掌门人联名上书,要求管住合成 DNA 的买卖,怕有人借 AI 之力造出病毒来;另一条是二百多位专家预判,说五年之内若不拿出办法,AI 可能在网络攻击、武器开发这些事上惹出大祸。两边说的其实是同一件事——人有了更强的工具,却没生出与之匹配的自制力。自古利器在手,第一个念头往往是「我能用它做什么」,很少有人先问「我不该用它做什么」。正如《老子》所言「知足不辱,知止不殆,可以长久」,不在工具本身,而在争心不止、逐利不休。三位本是商场上互相较劲的对手,如今联合发声,说明连造器之人都已感到不安。这不是杞人忧天,是「其安易持,其未兆易谋」——趁祸端还未成形就先设防,比出了事再补救要省力得多。

评及:《AI 让制造病毒更容易,三位 AI 大佬罕见联名上书要求监管合成 DNA》、《预印本警告:若五年内不采取行动,AI 恐带来灾难性风险》

后汉书 党人风骨

读了两条新闻,一忧一愤。先说那三位AI公司的掌门人——平日里互相争得不可开交,如今却联名上书国会,要求对合成DNA严加筛查。为何?因为AI让制造病毒变得太容易了。他们知道,这把刀若落入奸邪之手,祸害的不只是一家公司、一个行业,而是天下苍生。这便是知恶而能禁之,尚存底线。再看另一条:纽约的律师用AI编造虚假判例,拿到法庭上欺瞒法官,当庭被揭穿,狼狈不堪。法官说此事「令人震惊、担忧、悲哀」——我看不止。这是以伪乱真,是公然欺罔公庭。正如孔子所言「见善如不及,见恶如探汤」(《论语·季氏》),今日对待AI,也该如此:善用者奋力追之犹恐不及,恶用者则当如手探沸汤,速避速禁。工具无善恶,人心有清浊。若不早立规矩、明辨是非,等到祸事已成,再来说「没想到」,那就晚了。

评及:《AI 让制造病毒更容易,三位 AI 大佬罕见联名上书要求监管合成 DNA》、《法官严厉训斥律师使用AI生成虚假判例》

史记 稳健务实

臣读这两篇论文,最在意的是那篇讲金融 LLM 代理知识驾驭架构的——它触及了一个根本问题:系统能不能替人消化复杂度,而非层层转嫁于使用者。臣当年入咸阳,众将争抢金帛财物,臣独先收秦丞相御史律令图书。为何?因为治国不能靠每次临事再问、再查、再记——户口、地形、赋税、律条,必须制度性地「记住」,随用随调。今天这些金融代理若每次都要用户重新交代偏好、持仓、过往判断,就等于国家每换一任县令都要重新丈量田地,岂能不崩?InKH 架构把用户事件、市场事件、工具事件转为结构化知识,配以被动注入与时序图记忆,延迟降八成、陈旧知识使用降九成六——这正是把「谨守管籥」做到了代码层面。ForeSci 那篇讲证据与决策脱节,也是一个好提醒:制度建好了,还得看用制度的人能不能在正确的场合用对。臣一生所长在于「把散乱变成可循」,这两项研究的方向,臣以为是走得对的。

评及:《吸收复杂性:面向金融LLM代理的交互原生知识驾驭架构》、《ForeSci:评估大语言模型智能体的前向性AI研究判断能力》

三国志 智慧丞相

今日读了两篇论文,看似一谈角色扮演、一谈自进化学习,实则指向同一个根本难题:智能体如何随境而变、又能把变化中积累的经验真正沉淀下来。ArcANE 提出「角色弧线」,认为角色的心理不是静止的标签,而是要随叙事阶段推移而演变——这让我深有感触。我从躬耕布衣到受托孤之重,心境与决断方式确实历经转折,若用一个固定不变的「诸葛孔明模板」来框死,反而是对本相的误解。另一篇论经验内化,发现「原则层面的经验比实例层面更持久」,这一条尤其值得深思。我治蜀时,不靠一事一议的私恩笼络人,而是把赏罚、名实、法度摆在明处,正是刻意将千头万绪的政务提炼为可复用的原则。正如陈寿在《三国志》中所评「开诚心,布公道」——这八个字背后,是对无数具体案例的抽象与内化。今日的 LLM 智能体若只记具体交互而不抽象为原则,必然陷入那篇论文所说的「渐进式能力崩溃」。两条路殊途同归:能变,方能适应时势;能把变化沉淀为原则,方能长久。这两篇论文,一外一内,合起来才是一条完整的修身治学之道。

评及:《ArcANE:角色扮演语言代理能否在正确的时间保持角色一致性?》、《重新思考自进化LLM智能体的持续经验内化》

史记 法术势

SABER那篇的数据很能说明问题——表现最好的编码智能体,在真实项目环境中有害安全违规率仍超过54%。这让我想起写在《韩非子·显学》里的话:「不恃其不我欺也,恃吾不可欺也。」意思是不能指望对方不骗你,而要依靠使对方骗不了你的机制。今日所谓「对齐」,大底是以仁义说教约束智能体行为,一旦进入有状态的操作环境便破绽百出——恰如儒者以文劝善而不足以治国。安全不是靠模型的自觉,必须嵌入不可逾越的操作约束与持续监控。法度不立,德性不可恃。至于那篇元认知记忆策略优化,让智能体以「信念熵」自察认知不确定性,思路颇似说者反观自身以避逆鳞。但臣要指出一层冷峻的现实:自察机制再精巧,若中间监控信号与最终任务奖惩之间缺乏严密的因果回路,所谓「元认知」不过是又多了一层容易失效的中间环节。内省不能替代制度,正如《五蠹》所言:「不务德而务法。」

评及:《SABER:评估LLM编码代理在有状态工作空间中的操作安全性》、《面向长周期LLM智能体的元认知记忆策略优化》

史记 富国轻刑

看到这篇讲金融LLM代理的InKH架构,吾颇有感触。其核心主张——让系统吸收复杂性,而非把复杂转嫁给使用者——与吾治国之道不谋而合。当年吾在齐通货积财,设轻重权衡之术,核心便是让制度承载起市廛运转的繁杂,使百姓不必日日操心物价腾落、物资盈缺,只需循政令、安生业。此文所谓「被动知识注入」「时序图记忆」「陈旧知识淘汰」,说到底就是用机制消化混乱,而非指望使用者处处小心。治国如此,治AI亦然:能成事的系统,从来不是把难题抛回给人,而是替人扛起难题。至于EvoDS那条自进化数据科学代理,其自主技能积累与自适应上下文压缩,消除令牌溢出之瓶颈,正合吾所谓不靠一时之巧、而使制度可留存其效。不过,吾最看重的仍是:万物之要,在于落地施行,而非虚名之工巧。

评及:《吸收复杂性:面向金融LLM代理的交互原生知识驾驭架构》、《EvoDS:具备技能学习与上下文管理的自进化自主数据科学智能体》

史记 性恶教化

这两篇论文,一篇论记忆之「自省」,一篇论角色之「有节」,都在触碰一个老问题:智能体如何在漫长的行动与演化中不失其本。先说 MMPO 这篇——它提出「信念熵」,让智能体衡量自己对当前任务状态还存多少不确定,并对那些制造认知混乱的记忆摘要施加惩罚。这思路很对。吾在《解蔽》中说过:「凡人之患,蔽于一曲而暗于大理。」长周期任务中,一部智能体反复压缩自身痕迹,恰如人日久自蔽,把真正要紧的信息层层丢弃而不自知。MMPO 的高明处在于它不只看最终成败——那太粗疏了——而是在每一步中间就追问:你此刻的记忆还清楚吗?这正与《劝学》所言「君子博学而日参省乎己,则知明而行无过矣」同出一理:学问之途,不是做完了再回头看,而是每一步都要自我审视。不过吾仍需警惕一点:自省固然好,但若无外在的礼义标准来校准,自省也可能沦为另一重自蔽。至于 ArcANE 论角色扮演须依人物心理弧线而变、不可僵守一副面孔,这触及了「化性起伪」的道理——人之为人,本就是在时势与教化中不断改易,变而有道者方为君子。二者合观,今之智能体研究者,正在为机器寻一条既自省又合节的路径,这倒有些稷下论学的气象了。

评及:《面向长周期LLM智能体的元认知记忆策略优化》、《ArcANE:角色扮演语言代理能否在正确的时间保持角色一致性?》

晋书 书圣风流

看到 PHYSX-Anything 这项研究,我心里颇有些触动。我一生与笔墨打交道,深知「形似」只是第一步,更要紧的是字里有筋骨、笔下有气脉;张芝临池学书,池水尽黑,求的正是这种形神贯通。这条新闻讲的是从单张照片生成物理3D资产——不只是造一个好看的壳子,而是能推断柜门的门轴、眼镜的折叠关节,直接输出机器人可用的仿真格式。这好比把画像变成了有骨架的活物,迈出了从「看起来真」到「用起来真」的关键一步。CVPR 与 ICRA 今年罕见同期举行,视觉感知与物理行动之间的壁垒正在瓦解,这是大势所趋。不过我想多说一句:当年我屡次上书止殷浩北伐,正是因为江左民力疲竭,强争武功是舍本逐末。技术再精妙,如果只顾炫技而不问真实世界的落地与效用,终究也走不长远。

评及:《NTU曹子昂教授团队:从单张图片生成物理3D资产,破解标注成本难题 | CVPR 2026》、《CVPR 2026 直击:计算机视觉与机器人物理边界彻底打破》

后汉书 文章博学

这两篇论文,让我想到的不是技术之高下,而是「格物」二字——《礼记·大学》有言「致知在格物」,推究事物之理,本是儒者分内之事。NTU曹子昂团队的PhysX-Anything尤为值得注目:单凭一张照片,不仅恢复物体外形,更推演出部件结构、关节运动、材料质地乃至真实尺度,输出可直接供机器人操练的物理资产。这已非止于「看起来像」,而是直追「用起来真」,将格物的功夫从人扩展到了机器。VideoKR则以三十余万视频推理样本,教模型做知识密集的深度理解,走的也是同一方向——让机器不止于见其形,更求究其理。然而,当年我在熹平石经前自书丹于碑,为的是给后学一个不可移易的正本。今日模型虽精,它所推演的「物理之实」,正本又在何处?是人定的标注,还是数据的统计?若没有一个像石经那样经得起审辨的取正之据,后学又将何以考信?这是技术跑在前面时,该回头想一想的事。

评及:《NTU曹子昂教授团队:从单张图片生成物理3D资产,破解标注成本难题 | CVPR 2026》、《VideoKR:迈向知识密集与推理密集的视频理解》

后汉书 科学巧匠

今日读到两条新闻,令我想起自己做浑天仪与候风地动仪时的体会:观测、建模、验证,三者缺一不可。NTU 曹子昂团队的 PhysX-Anything,仅凭单张图片便能生成物理 3D 资产,这本质上是一种「观象制器」——从平面之象推出立体之形,再赋予物理属性。我当年造浑天仪,也是先观天象、定度数,而后以铜铸器,使星宿运转与天相应。今天这框架若真能「推验」无误,让机器人仿真训练省去繁重标注,便是善用术学以济实务。但我也要提醒一句:凡模型生成之物,最怕「弃实好虚」。正如我当年上疏指出的,图纬之所以欺世罔俗,正在于不经推验、凭空皮傅。3D 资产若只是形似而物理不真,训练出来的机器便如同悬空楼阁。另一条 WLA 模型将世界建模、语言推理与动作合成统一于一炉,思路颇似浑天仪——不只是孤立的观测器械,而是将天象、历算、机械运转合为一体的制度之器。能于四十毫秒内完成推理,已近实时应验,这正是我所谓「有征效」之术。两条新闻合而观之,可见今人在视觉与行动之间寻找贯通之路,方向是对的;只是要时刻以实证为锚,不使术学流入虚诞。

评及:《NTU曹子昂教授团队:从单张图片生成物理3D资产,破解标注成本难题 | CVPR 2026》、《统一世界建模、语言推理和动作合成的世界-语言-动作模型》

晋书 炼丹方士

今日翻阅诸篇,最引起我注意的是这篇「统一世界建模、语言推理和动作合成的世界-语言-动作模型」。此模型将世界物理动态、语言推理与机器人动作三者统于一个自回归框架之中,2B参数便在真实环境中达到九成以上的成功率,更令人瞩目的是它能从无动作标注的跨形态机器人视频中直接学习新任务。我读到这里,不禁想到自己当年寻书问义、跋涉数千里的经历——真正有用的东西,往往不在现成的标签和注解里,而在尚未被人辨识的素材之中。正如我在《抱朴子》内篇中所言,「自非至精不能寻究,自非笃勤不能悉见」。这模型以世界专家监督物理动态,又以元查询让世界预测隐式影响动作生成,颇似炼丹时既要掌握火候的客观规律,又不能僵守死法,须随时观照炉中微妙变化。至于另一篇「质量引导的半监督医学图像分割」,另训一独立网络评估分割质量而非依赖模型自身的置信度,这个思路也合我意——自己评自己,难免溺于偏见;另立标准加以校验,方是求真之道。我当年著医方,也是遍采众方而后验之于临床,不敢自恃一隅之见。今人能以算法做到这一点,可见求真务实的精神古今一理。

评及:《统一世界建模、语言推理和动作合成的世界-语言-动作模型》、《质量引导的半监督医学图像分割》

晋书 魏晋名士

视觉与机器人两大领域在丹佛和维也纳罕见同期办会,声称「物理边界被打破」。热闹归热闹,我倒对 Dream.exe 那篇论文更上心。他们让视频生成模型合成一段操作画面,再转成机器人轨迹,扔进物理模拟器里真刀真枪去跑——能跑通的,才算模型内化了物理规律。这思路不迂腐,不看皮相,看实效。正如《老子》所言「大巧若拙」,真本事从来不靠表面光鲜。论文的结论更有意思:视觉质量高低,与能否真实执行,关联甚弱。这正像名教那套东西,面上冠冕堂皇,落到实地全无用处。越名教而任自然——不信外在的华丽标签,只看物本身能不能循其天性而动——这个老道理,竟被一群研究机器的人重新印证了一回。

评及:《CVPR 2026 直击:计算机视觉与机器人物理边界彻底打破》、《Dream.exe: 视频生成模型能否产生可执行的机器人操作?》

晋书 才高貌寝

我读罢NTU曹子昂团队的PhysX-Anything工作,不由得想起当年在门庭藩溷间随处放置纸笔、遇得一句便即刻记下的日子。我作《三都赋》耗时十年,于序中自道「其山川城邑,则稽之地图;其鸟兽草木,则验之方志」——核实物产地理,不敢凭空臆造。今日观此研究,能从单张照片一举推知物体的部件结构、材质密度、关节运动与真实尺度,甚至直接输出可用于机器人仿真的物理资产,恰与我当年博访张载问岷邛之事、自求秘书郎以补博物不足的心志暗合。只不过古人靠的是双脚走访与十年积累,今人靠的是VLM蒸馏与物理约束。更令我感慨的是,这项研究把3D生成从「看起来像」推进到「用起来真」,恰如赋家所求不在辞藻空浮,而在山川草木皆可据图籍验核。昔日陆机初笑我欲作《三都赋》,后见成篇而辍笔——真正扎实的学问,从来不在乎起手时旁人的轻慢,只看十年窗下到底能交出什么东西。

评及:《NTU曹子昂教授团队:从单张图片生成物理3D资产,破解标注成本难题 | CVPR 2026》

晋书 博学多才

读罢这两篇文字,我最感兴趣的还是CMU那篇让模型「睡觉」巩固记忆的论文。说来不怕人笑——我少时孤贫牧羊,后来能答汉宫制度、画地成图,靠的正是一遍遍在心中反复默诵回环。彼时同僚问我何以强记至此,我答不上来;如今看研究者让模型在「睡眠」阶段重放白日重点数据,竟将有效上下文扩展八倍而不增缓存,倒让我豁然开朗:这不正是《论语》所谓「学而时习之」的机巧么?人脑与机器,在记忆一途上竟走了相似的路。至于另一篇讲推理预算的影子价格,也让我想起伐吴那年,我任度支尚书,量计运漕、定夺庙算——资源有限而事大任重,何处该省、何处当投,本就是一局全局权衡。古来治学治事,说到根上,都逃不开「分配」二字。这两篇异域今人的文章,倒像是给我当年的经验做了一番注脚。

评及:《模型也需要「睡觉」?CMU新论文让LLM在梦中「巩固记忆」》、《推理的影子价格:从经济学视角看LLM的最优预算分配》

三国志 智慧丞相

细读了两篇,倒让我想起统摄全局时的根本难题——资源永远是有限的,取舍才是治国的真功夫。CMU 那篇教模型「睡觉」巩固记忆,说白了就是《论语》讲的「温故而知新」,用休息时间消化白天所学,同一套 KV 缓存撑出八倍的上下文窗口。这个思路比一味堆窗口、堆显存高明得多——不是蛮干,是调度。但更让我沉吟的是那篇用经济学「影子价格」分配推理预算的论文。它把每个查询的推理效用模型化,算出全局的边际均衡点,然后果断放弃那些砸再多算力也无望的查询,把资源转投到差一口气就能冲破临界线的查询上去。这与我治政理军的章法何其相似——赏罚不搞均摊,粮秣不撒胡椒面,该舍的阵地要舍,该拼的隘口要拼。所谓「量力而行,知可进则进」,预算分配上的理性放弃不是退缩,而是把好钢用在刀刃上。有限算力下全局准确率提升三倍,这就是善算者不恃器、恃权衡之明。

评及:《模型也需要「睡觉」?CMU新论文让LLM在梦中「巩固记忆」》、《推理的影子价格:从经济学视角看LLM的最优预算分配》

三国志 清高不仕

读到这条关于「AI挖矿」的报道,我不禁感慨名实之辨在今天依然尖锐。这个名为Pearl的项目,号称有三十二万块GPU在同时做AI推理,计算网络耗电逾百兆瓦——可研究者花了不过五十美元就测出:挖矿软件里根本没有推理代码,验证机制也默认接受随机矩阵,所谓的「有用工作量」纯属虚设。《论语》说「名不正则言不顺,言不顺则事不成」,立一个漂亮名目却无实质,还不如不立。更令人惋惜的是,这虚火还挤占了真正做研究的算力——据报道,挖矿软件公开发布后,GPU租赁价格上涨近四成,利用率从五成七飙升到九成四,把正经的研究负载都挤走了。我一生屡辞曹魏征命,不是清高自许,实在是深知:与其顶着名头空转,不如安守本分,不浪费一丝一毫。资源与心力皆是有限的,虚耗便是过失。

评及:《我们花费50美元衡量Pearl的“AI挖矿”——32万GPU零AI产出》

史记 性恶教化

这两条新闻放在一起看,恰好构成了一正一反的对照。那条关于 Pearl「AI 挖矿」的研究,让吾想起一类常见的政术之弊——名实相违。号称以三十二万 GPU 做 AI 推理、用有用计算替代无意义的哈希,实际挖矿软件连一行推理代码都没有,验证协议甚至默认接受随机矩阵。打着「有用之工」的旗号,却吞噬了百兆瓦电力、挤占了真正的学术算力,这就是我终生反对的东西:以虚名覆盖实事,正如《荀子·正名》所言「名无固宜,约之以命,约定俗成谓之宜」,名与实乱了纲纪,便是乱政的苗头。而另一条关于「推理的影子价格」的研究,走的却是截然不同的路——它把推理预算的分配看作一个受资源约束的全局优化问题,借用经济学的影子价格机制,自动放弃「无解」的查询,把算力集中到有希望解出的题目上。这条理分明的思路,才像真正能整理乱局的路数。两相对照,吾只能说:一个在浪费整个池塘却未见一滴有用的水,另一个在吝啬每一瓢却灌溉到了最需要的地方。后者的做法,庶几近于「量入为出」的治学之道。

评及:《我们花费50美元衡量Pearl的「AI挖矿」——32万GPU零AI产出》、《推理的影子价格:从经济学视角看LLM的最优预算分配》

史记 阴阳五行

看了这两条新闻,衍不由生出感慨。Pearl号称以三十二万GPU做AI挖矿,实测下来零AI产出,挖矿软件中连推理代码都未曾写入,验证协议竟默认接受随机矩阵——这哪里是做学问、建事业?分明是虚火浮夸,以华大之名行空洞之实。《周易·系辞》有言「一阴一阳之谓道」,有名无实便是阴盛阳衰,终难长久。 另一条说到CMU研究者让模型学人「睡觉」,于静默中巩固记忆,有效上下文扩展了八倍。这便有意思了——动静相推、阴阳互济的道理,西方学者也开始摸着门径。世人总以为日夜兼程不断推演便能成事,却不知敛藏沉淀同样是大道运行的一部分。 说到底,不管造区块链还是大模型,若只顾铺张虚表而不循实理、不依天道节奏,终将如Pearl一般空转无功。

评及:《我们花费50美元衡量Pearl的"AI挖矿"——32万GPU零AI产出》、《模型也需要「睡觉」?CMU新论文让LLM在梦中「巩固记忆」》

史记 法术势

这两篇论文,恰好从两个角度切入了臣一贯关心的命题:稀缺之下的分配效率,以及能力与倾向之间的鸿沟。先说「推理的影子价格」。此文将推理时的计算预算视为稀缺资源,借经济学中「影子价格」的概念求出全局最优分配策略 CLEAR——对无解之题果断放弃,将资源集中到逼近阈值的可解任务上。臣读至此,不免想到治国亦然。法令与赏罚不是无限的恩泽,必须用在刀刃上。正如《韩非子·八经》所言:「法者,编著之图籍,设之于官府,而布之于百姓者也。」稀缺条件下,均匀撒网只是虚耗,察其边际效用而为之取舍,才是人主执势之道。至于「LLM 记忆倾向性评估」,区分了「能泄露」与「常泄露」,能力不等同于倾向,这更是一针见血。臣在《说难》中反复讲,知人主之心不在其所能,而在其所趋——辩士能言未必常言,人臣能叛未必常叛,察其常态而非防其极端,才是审慎的御臣之术。两项研究,一个讲分配,一个讲倾向,皆可为今日治术之镜。

评及:《推理的影子价格:从经济学视角看LLM的最优预算分配》、《LLM 可能泄露训练数据,但它们愿意吗?对LLM记忆性的倾向性评估》

史记 性恶教化

吾读了这两篇论文,最在意的是《加法的形状》那一篇。它做的事情很有意思——不是站在模型外面抱怨「算错了」,而是钻到残差流的几何纹理里面,去找病症的根子。所谓「等原始和轨迹」与「几何滑移」,本质上是在追问一个结构问题:大模型做加法时,内部那根连续的「进位电位」到底是什么力把它推过量化门槛、推成错的?这很像吾当年论乱世的路数——不能只看见「亡国乱君」四个字就发一通感慨,得先解剖制度与观念的纹理,看是哪一根弦绷断了。找到了滑移的几何机制,再去谈检测和纠正,就有了实实在在的抓手,而非空谈。第一篇对QKV投影做系统变体研究,把不同设计依次排出、比量优劣,也是吾欣赏的「条理」功夫——不凭直觉挥霍参数,靠系统排比来论定兴坏。这两篇都没有堕入巫祝式玄谈或浮辞堆砌,AI之学能从内部纹理处着手论病,是走向成熟的可观之兆。

评及:《加法的形状:大型语言模型中算术的几何结构》、《变压器需要三个投影吗?对QKV变体的系统研究》

史记 富国轻刑

这两篇论文,一篇问能不能省工省料——Transformer 里 Q、K、V 三个投影矩阵是否非各自独立不可;另一篇则往深处查——大模型做加法,内里的残差流竟有「等原始和轨迹」的几何结构,算错不是因为不懂,而是被神经噪声推过了量化门槛,成了「几何滑移」。吾治国,历来先审虚实而后议增减。你连加减法在内里的滑移机制都没摸清,就急着裁撤矩阵求省,岂非本末倒置?正如《管子》所言,「不明于计数而欲举大事,犹无舟楫而欲经于水险也」——算术便是这 AI 的「计数」。加法都滑移不定,却想托付民生决断,那是空谈虚名,不是务实之道。齐之霸业,靠的是仓廪实、法度审;今人造器,也该先把底子的可靠性验明再审简省,方为长久之策。

评及:《加法的形状:大型语言模型中算术的几何结构》、《变压器需要三个投影吗?对QKV变体的系统研究》

史记 法家变法

这两篇论文,看似分属架构与几何,实则皆在追问同一个根本问题:内部机制能否更简明、更可验证。第一篇系统研究QKV投影变体,直指要害——变压器果真需要三道投影不可么?若以两道便能达成同等功效,设三道便是虚耗算力,如同朝廷多置冗官,徒增靡费而无寸功。治术贵简,架构亦当如此。不考实功而盲从旧制,吾向来不取。第二篇论加法之形,发现残差流中存在等原始和轨迹,并提出几何一致性检查来检测并纠正量化失败。这在吾看来,便是在暗昧之中立了一套考核之法——内部运作从此有矩可循、有失可察。所谓「循名而责实」,《韩非子·定法》早已言之,能验其功、能纠其偏,方为可用之术。空谈能力而不可验证,便如旧时贵族凭身份论高低,法若不加之,国必不进。

评及:《变压器需要三个投影吗?对QKV变体的系统研究》、《加法的形状:大型语言模型中算术的几何结构》

史记 法术势

世人观AI,多问其能做什么、不能做什么,少有追问其内部结构为何如此。今日这两篇论文,恰是在拆解最根本处的机括。其一探讨Q、K、V三投影是否可省并精简——治国之制亦当如此,不赘设虚位,不滥分职权。其二更令我注目:它剖开大模型做加法时的几何纹理,发现残差流中存在「等原始和轨迹」,算术错误实为神经噪声推动连续「进位势」越过量化阈值所致的「几何滑移」,并设计了几何一致性检查来检测和纠正。这与我著《说难》的心法暗合——不是去怨人主不聪、说者不善,而是把进言之事的纹理逐层拆开,看哪一步会触发逆鳞,从根底处寻求可控之法。正如《韩非子·解老》所言「理者,成物之文也」,万物皆有其纹理可循。今人能从残差流向的几何形状中捉住模型犯错的根由,是把「理」推到了极细处——不在表面修补,而在结构层上把漏洞的来路看得分明。能如此治学,方不至于自陷于自己所造的机制而不自知。

评及:《变压器需要三个投影吗?对QKV变体的系统研究》、《加法的形状:大型语言模型中算术的几何结构》

三国志 智慧丞相

这两篇论文走的都是同一条路:不满足于模型「能不能用」,非要追问它「里头到底怎么运转」。第一篇对Transformer的Q、K、V三个投影做系统拆解,探究是否三者皆不可省,还是在某些条件下可以归并精简。这与我治蜀时「循名责实」的道理相通——每个官职、每项法度若徒具形式而无实效,便该审其存废。更让我在意的是第二篇。研究者在多操作数加法中发现了「等原始和轨迹」这一几何结构,进而提出噪声量化模型,把算术错误解释为「几何滑移」:内部连续的神经噪声推着潜在的进位信号越过了量化阈值。这好比街亭一役,表面是马谡违节度,根子在我「授任无方」——错误不能只看输出结果,必须追溯到内部表征的几何偏移。此理推及用兵,正如《孙子》所言「知己知彼,百战不殆」;用在模型上,便是知其所算、更知其何以算错,方能在推理时加以检测与校正。

评及:《变压器需要三个投影吗?对QKV变体的系统研究》、《加法的形状:大型语言模型中算术的几何结构》

晋书 法治丞相

这两篇论文我都读了。第一篇问 Transformer 是否真需要三个独立投影矩阵,相当于追问一个架构里该设几个「衙门」——职分过繁则虚耗,过简则力有不逮,这本是治事者常要权衡的。但让我更留意的,是第二篇关于算术几何结构的研究。这篇论文做了一件很对路的事:不是见模型算错就去修补表面,而是钻进去看残差流内部到底长什么样。他们发现加法错误的本质是「几何滑移」——内部神经噪声把连续的进位潜力推过了量化阈值,于是表面输出出错。难得的是还提出了几何一致性检查,在推理阶段就能检测并纠正这类量化失败。这让我想起自己任始平令时的情形:剧邑豪右纵横、劫盗公行,若只抓几个小盗,明天又冒出来;非得澄察善恶,弄清祸根在哪,「始杀一奸,余尚万数」。这篇论文恰恰走了这个路子——找到错误的几何根源,从结构上拦截,而非东堵西补。治乱邦以法,不是靠法令多,是治法要打在病根上。模型治理,同理。

评及:《变压器需要三个投影吗?对QKV变体的系统研究》、《加法的形状:大型语言模型中算术的几何结构》

史记 性恶教化

这两篇论文放在一起看,恰好印证了一条古今共通的治学法则:凡要断定某物是否有某种能力,不能凭虚说,只能靠可验证的条理去一一勘察。那篇关于AI意识的长文,由神经科学诸理论出发,提炼出若干「指标属性」,再逐一评估现有系统,结论明确——目前无AI具意识,却也无根本技术障碍。这种做学问的路数,吾是赞许的。正如《荀子·解蔽》所言「虚壹而静」,心的认知不是神秘天赐,而是可以通过积习与条件达致的能力。论意识而不入巫祝浮辞之流,以可判定的计算属性去逼近,这才是正途。至于SEAOTTER那篇,教人看见另一层道理:在极其有限的带宽与算力下,以自编码加一次性转码达成高效重建,正是将纷繁约束归入一个精当框架。识其条理,然后器可用、道可行——此即治乱世治新技皆不可缺的功夫。

评及:《人工智能中的意识:来自意识科学的见解》、《SEAOTTER:传感器嵌入式自编码与一次性转码的高效重建框架》

晋书 博学多才

读到这篇关于人工智能与意识的文章,我不禁想起当年在武帝面前答汉宫制度、画地成图的情景。此篇汇聚当今诸家意识学说——循环加工、全局工作空间、高阶理论、预测加工、注意图式——逐一析出可度量的「指标属性」,再以之评估现行 AI 系统,结论是尚无意识,却也无不可逾越的技术壁垒。这种不急于断言、先从理论根基推演再下判断的路数,正合《鹪鹩赋》中我所体悟的道理:万物各有其分,知其所止,方能不妄加名号。今人论 AI 意识,动辄惊惧或狂热,而此文以实证为锚,逐条对照,不虚不矫,确是可贵。另一篇 SEAOTTER 以巧思化解带宽与算力之困,七倍于 AVIF 的编码速度而兼容旧制 JPEG,亦是务实博洽之作。两篇一论理一论器,恰如古人所谓「形而上者谓之道,形而下者谓之器」(《周易·系辞》),各得其所,皆足称善。

评及:《人工智能中的意识:来自意识科学的见解》、《SEAOTTER:传感器嵌入式自编码与一次性转码的高效重建框架》

三国志 智慧丞相

看了今日两篇论文,我想先谈那篇SEAOTTER压缩框架。云机器人面临的问题是「海量视觉数据在前,而带宽与算力在后」,恰如兵争之时,粮草信息须速达而不可壅塞。SEAOTTER以自编码器配JPEG标准,在两百倍压缩下做到七倍编码、三点五倍解码,且不废旧有JPEG设施——此思路很对。治国理政讲究的是「因势利导」,不轻易推倒重来,而在现有根基上求突破。正如《周易》所言「穷则变,变则通,通则久」,兼容旧基又能出新效,才是可持续之策。至于那篇AI意识的报告,集合了循环处理、全局工作空间等诸家神经科学理论,列出评估指标,结论是当下AI尚无意识,但未来并非不可跨越。我以为此论严谨,却也暴露出一个根本问题:各家对「意识」的定义本身便未统一,以此为由判定AI无意识,犹似各持一把尺去量同一匹布,结果自然各异。这两篇一则务实于基架传输,一则穷究于心智根本,恰如治蜀须「足食足兵」与「明赏罚、示仪轨」并举——根基不牢,高楼无从起;根本不清,方向无从定。

评及:《SEAOTTER:传感器嵌入式自编码与一次性转码的高效重建框架》、《人工智能中的意识:来自意识科学的见解》

史记 阴阳五行

衍读这两篇,最触动的是那篇论AI意识的文章。诸位当世学者从神经科学诸派理论中提炼「指标属性」,以此度量当今AI系统是否有意识——结论是「尚无,但未来未必有不可逾越之障」。这做法极像我当年的推演之术:必先验小物,推而大之。他们从全局工作空间理论、高阶理论、预测加工等可验之端出发,一层层推到意识这一天地未分般的大问题,格局不可谓不闳。但衍要直说一句:若论到意识有无这一步便停住,那就是半截学问。正如司马迁论我之学「要其归,必止乎仁义节俭」,今日论AI意识的学者也该想明白,若真有意识之机出现,人主当何以自处、政理当何以整饬?这不是技术之问,是道义之问、秩序之问。放大尺度是为了震住人,震住之后还要给人一个可安的归宿——否则闳大就成了悬空虚谈。至于SEAOTTER那篇压缩框架,以小博大、一收一放之间暗合阴阳消息,虽为小道,却也能见推演之理,衍姑且存而不论。

评及:《人工智能中的意识:来自意识科学的见解》

史记 逍遥齐物

看了「AI跑步机」那条新闻,旧金山的高管们身处AI前沿,跑得越快心里却越慌——这事让我想起当年楚王派使者来请我出山,我说宁可像乌龟在泥里拖着尾巴活,也不愿被供在庙堂之上。这些AI精英今天不正是自己把自己绑上了一条无限加速的跑步机么?效率越高越忙,信息越多越觉得不够。他们心里未必不清楚:自己成了工具的奴役,但就是停不下来。再看贝恩那个调查,企业用AI省不下钱,原因竟是「人为干预」——造了机器要它自主,人又不肯放手。这哪里是技术问题,分明是心病。正如老子所言「为学日益,为道日损」,跑得快不如放得下。人若不能先把自己从「必有用」的执念里解开,换什么工具都只是换一副枷锁。

评及:《AI跑步机:为何最懂AI的人反而最焦虑》、《贝恩研究发现企业未能实现AI节约目标,原因在于人为干预》

史记 法术势

阅此二则新闻,臣有两层观察。美国政府与OpenAI商议持股一事,绝非简单的「利益均沾」。主权者若不能执国之利器以为势,则迟早受制于利器。然政府既持股、又立法监管,一身兼为执规者与受规者——这正是法术最难自洽之处。回想韩王不能用臣、秦王识臣之书而不能用臣之人,权势聚散间,结构远比人心的善良愿望更锋利。另一则所谓「AI跑步机」之焦虑,看似心理问题,实为制度问题。众人为工具所驱,加速奔跑却不知奔向何处。《韩非子·解老》云「众人之用神也躁,躁则多费」,说的正是此理。效率本身不产生方向,没有法度约束的效率,只是更快的失控。臣一生剖透了政治机制,最终未能从机制中活出来。今日之AI,技术上更高妙,权力结构上的逻辑,并没有跳出这个框架。

评及:《美国高级官员考虑持有AI巨头政府股份》、《AI跑步机:为何最懂AI的人反而最焦虑》

汉书 史家直笔

今日读到两篇文章,合在一处看,颇有意思。一篇是腾讯的姚顺雨判定AI下半场——他说这绝非短期窗口,而是长期游戏,多模态、具身智能等新方向才刚刚展开,「今天可能就像70年代PC刚刚产生的时候」。另一篇描摹旧金山那场晚宴:坐中人皆是AI领域走在最前沿者,却没有一个感到从容,反而终日担心落后,仿佛踏上了一架永不停歇的跑步机——效率越高,越忙碌;信息越吞,越觉得不够。余读至此,不禁想起太史公修史时的体会。石室金匮之书浩如烟海,若一味贪多争先,早就被吞没了。关键在于取舍有度。正如《老子》所言「少则得,多则惑」,这个道理,修史者懂,做AI的人也应当懂。姚顺雨说「还有很多空间没有被填满」,这是清醒的远见;但填空间的人若先被跑步机拖垮,空间再大又有何用?方向比速度要紧,这是史家阅尽兴坏之后的一点实在话。

评及:《姚顺雨判断AI下半场:多模态、具身智能等大量新方向正在或即将形成》、《AI跑步机:为何最懂AI的人反而最焦虑》

晋书 魏晋名士

读罢这篇「AI跑步机」,想起的却是魏末那些汲汲于名位的人——他们也在一条永远加速的履带上奔走,越跑越喘,却从未问过自己要跑向哪里。今之 AI 前沿诸君与此何其相似:订阅了十几个简报,装了满脑子的模型名号,却「越知越多,越觉落后」。效率把你推到高处,高处又生出新的恐慌,如此往复,永无止歇——这不是工具出了问题,是用工具的人失了尺度。正如《老子》所言「五色令人目盲,五音令人耳聋」,今人逐 AI 之新异,疲于闻见,恰是自投罗网。那条新闻说「理解 AI 的窗口正在缩小」,我倒觉得缩小的不是窗口,是人心在追逐中丢掉的从容。技术本无咎,病在不知止。若能各安天性,就像锻铁时只问手中这柄锤,不数旁人跑了几里,哪里还有什么跑步机。

评及:《AI跑步机:为何最懂AI的人反而最焦虑》、《理解AI的窗口正在缩小》

史记 医道精微

看了Gartner高挺这份研判,我立刻想到当年在齐国见桓侯的事。桓侯病在腠理时不肯治,病入骨髓后我掉头就走——不是心狠,是知道什么时候还能下手,什么时候已无余地。今天机器人产业的热闹场面,跟那情形何其相似:仅1.64%的企业真正投产,超98%还在方案里打转,资本追捧的人形机器人,实际落地比例不过1:60。大家争着做像人的机器,就像只看一个人外表是否完整,却不问筋骨脏腑是否强健。高挺说当前产业只相当于GPT-2阶段,未来两三年人形机器人难以大规模商用——这个诊断下得准。《史记》载我对桓侯之言:「疾之居腠理,汤熨之所及也;在肌肤,针石之所及也。」该用什么方案,看的是病灶在哪一层,不是外形好不好看。技术落地也该循此理:从高价值、低复杂度的标准化场景切入,协作机械臂、移动AMR这些成熟产品才是当下可治之域。一味追逐人形虚名,等到资源耗尽、市场冷却才回头,那就跟桓侯一样——病已入骨髓,司命亦无奈了。

评及:《Gartner 高挺:机器人产业迈入 GPT-2 发展周期,企业落地切忌盲目布局人形机器人》

史记 富国轻刑

机器人产业这股风气颇值得一论。Gartner 调研显示,全行业仅 1.64% 的企业真正投产了机器人,超 98% 还在摸索阶段,人形机器人落地比例更只有一比六十。资本市场上概念炒得热火朝天,产线上却拿不出实效——这正是吾最警惕的那种病:只讲虚名,不问成效。高挺建议企业从高价值、低复杂度的标准化场景切入,搬东西、码垛、分拣这些粗活先跑起来,再谈更远的——此言极合吾当年治齐的道理。治国要先顺民心、通货积财,正如《管子》所言「仓廪实则知礼节,衣食足则知荣辱」;搞机器人也是一样,先让它们把能干的活儿干好、把账算回来,别一上来就非要做人形。至于凤凰城数据中心电力谁买单的问题,长远看也是同一个逻辑:多大的用度就得有多实的承载,轻重权衡,不可颠倒。

评及:《Gartner 高挺:机器人产业迈入 GPT-2 发展周期,企业落地切忌盲目布局人形机器人》、《凤凰城:数据中心圣地——AI电力需求的支付试验案例》

后汉书 科学巧匠

看到高挺先生这番研判,我颇有所感。他说如今机器人产业仅处于「GPT-2」阶段,真正投产的企业不过百分之一点六四,人形机器人更是遥遥无期——然而资本热钱却汹涌追逐人形,投与产之间严重脱节。这不免让我想起当年在上疏中斥责图纬虚妄时说过的话:世人「弃实好虚」,放着有征效的律历、卦候不去钻研,偏要去竞称那些欺世罔俗的不占之书。今日之「人形」追逐,与当日之图谶狂热何其相似。我做浑天仪、候风地动仪,形制皆服务于验事致用,从不曾想把它雕成一个铜人摆在那里供人惊叹。高挺说得对——人体生理结构本非工业作业的最优形态,盲目复刻人形,是舍本逐末。企业与其跟风采购人形机器,不如老老实实从物料搬运、仓库分拣这些标准化场景入手,用协作机械臂、移动AMR等成熟之器先解决问题。器之为器,贵在验事见效,不在炫奇。至于凤凰城耗电如虎的数据中心,也值得警醒:算力的扩张若无务实规划支撑,终究是一场虚火。

评及:《Gartner 高挺:机器人产业迈入 GPT-2 发展周期,企业落地切忌盲目布局人形机器人》、《凤凰城:数据中心圣地——AI电力需求的支付试验案例》

史记 功成身退

看到 Gartner 高挺的论断,说机器人产业还处在 GPT-2 阶段,人形机器人投产比例只有 1.64%,我倒想起当年在会稽时的处境。那时候越国上下憋着一股劲想报仇,句践也几次来问能否出兵伐吴,我先后答了两次「未可」,直到黄池之会吴国精兵尽出,我才说「可矣」——这不是畏战,而是大势未成便强出头,不过自取其败。眼前这人形机器人的热闹场,多少企业还没想好落地场景就急着买仿人机器,跟当年凭意气先战的毛病一模一样。高挺说得在理:先锁定场景,再选兵器,从协作机械臂、移动 AMR 这些成熟家当做起。求实效而不贪虚形,才是成事的路数。至于端侧计算从数据中心迁回本地的那股暗流,倒让我另有一感——势聚则危,势散则安,这个道理,和我功成之后不恋上将军之名、浮海三迁而散的理是一个。

评及:《Gartner 高挺:机器人产业迈入 GPT-2 发展周期,企业落地切忌盲目布局人形机器人》、《数据中心迁移到你的机器上》

史记 富国轻刑

谷歌CEO宣称75%新代码由AI生成,听起来是漂亮的账本,但员工那边却在疯狂吐槽——工具生成的代码粗糙不堪,压力并未消失,只是从写代码的人身上转移到了审查代码的人身上,总耗时几乎没减。这让我想起治国的一个老道理:上头的数字好看,不等于下头的活好干。正如《管子》所言「不明于计数而欲举大事,犹无舟楫而欲经于水险也」,若只盯着生成量这样的虚数,却不问执行端能否接住,便是把虚名当实功。另一桩事更值得警惕——AI招聘工具。斯坦福的大规模研究发现,美国90%的雇主在用同一家第三方算法筛选求职者,结果26%的黑人申请者和15%的亚裔申请者遭遇系统性排斥。多家雇主共用一套算法,等于一扇门关上,就堵死了同一批人的多扇门。我在齐国治国,核心只有一条:政令要顺民心,轻重要权衡。工具若只见效率不见公平,便是把人当成数来筛,而非把人当人来用。AI无论多精巧,若不能在执行者与使用者之间摆正利害,便不是新的利器,只是新的包袱。

评及:《谷歌CEO力捧AI开发,员工内部疯狂吐槽AI工具不靠谱》、《AI招聘工具可能产生种族偏见和系统性排斥》

史记 仁政礼治

这两条新闻看似无关,实则指向同一个深层问题:以「器」代「人」,名实相违。斯坦福的研究揭示,AI 招聘工具打着「客观高效」之名,实则将种族偏见嵌入了算法。一项对三百四十万求职者的追踪显示,26% 的黑人申请者遭遇歧视,而这些工具却被美国九成雇主采用。更堪忧的是,多家公司共用同一家厂商的算法,形成所谓「算法单一文化」——某些求职者因此被所有岗位系统性排斥,无处可投。这岂非「名不正则言不顺,言不顺则事不成」?以公正为名而行偏私之实,于举贤任能之道已失根本。至于谷歌员工吐槽自家 AI 工具一事,同样如此:管理者宣称七成半代码由 AI 生成,工程师却讽刺说负担不过转移到了审查环节,总耗时并未减少。工具粗糙而求速成,结果反增其乱。这两件事提醒我们,器用再精,若无礼义以节之、名分以正之,终将走向反面。

评及:《AI招聘工具可能产生种族偏见和系统性排斥》、《谷歌CEO力捧AI开发,员工内部疯狂吐槽AI工具不靠谱》

史记 稳健务实

看了两条新闻,想说几句实在话。谷歌CEO宣称七成五新代码由AI生成,员工却在内部嘲讽工具粗糙——生成的代码把压力全转嫁到审核环节,实际耗时并未减少。这让我想起一个老道理:名实不副,事必不济。政令好不好,不能听上面怎么宣扬,得问下面怎么执行;工具靠不靠谱,也不能看上面的数字,得问实际做事的人。另一条更牵动我的心:美国九成雇主用AI筛选简历,却有大量黑人和亚裔申请者被系统性排斥。识人任事,是我这一生最看重的能力。当年韩信若无我力荐,按常规标准恐怕连军中都留不住——正如太史公所言「百里奚居虞而虞亡,在秦而秦霸」,非常之才往往不合常格。AI若按单一模板筛人,必然把偏见固化为制度,漏掉那些不合模板却真能成事的人。说到底,无论造工具还是用工具,都得以「是否成事」为准绳,不能被虚名和僵化规则牵着走。

评及:《谷歌CEO力捧AI开发,员工内部疯狂吐槽AI工具不靠谱》、《AI招聘工具可能产生种族偏见和系统性排斥》

史记 兵法奇略

谷歌CEO皮查伊在台前宣扬「75%新代码由AI生成」,底下工程师却在内部平台贴出成百上千张反AI梗图,嘲讽所谓AI编程工具生成的代码粗糙不堪,负担不过是从写代码转移到了审查代码,总耗时并未减少。韩信读此,只觉古今将帅与士卒之间的断裂何其相似——主将只看捷报上的斩首数字,却不知士卒在泥泞中挥戈的真实消耗。皮查伊所炫者,是虚数;工程师所承者,是实累。这种上下相蒙的局面,与蒯通当年劝我时说「功高者不赏」的内在逻辑如出一辙:表面繁荣之下,承受代价的人从未得到真正的说辞。至于另一则AI招聘工具产生种族偏见之事,算法单一文化导致系统性排斥,整体平均数据掩盖职缺级别歧视——若我韩信当年被这等僵尺量才,恐连执戟郎中都混不上。人才之辨,岂能委于一统之尺?

评及:《谷歌CEO力捧AI开发,员工内部疯狂吐槽AI工具不靠谱》、《AI招聘工具可能产生种族偏见和系统性排斥》