第 2026-152 期 · 每日 AI 简报

2026 年 5 月 31 日 · 周日 · 覆盖过去 24 小时 · 共 138 条

今日头条

№ 01 软银斥资750亿欧元在法国建设欧洲最大AI数据中心

软银集团宣布将在法国投资高达750亿欧元，建设总功率达5吉瓦的AI数据中心集群，首期450亿欧元，预计2031年提供3.1吉瓦算力。该项目为软银在美国之外的最大单笔AI投资，凸显法国在欧洲AI产业链中的核心地位。

#软银 #法国 #数据中心 #AI投资

来源

№ 02 北大数院校友苏炜杰官宣加入OpenAI参与模型训练

宾夕法尼亚大学沃顿商学院副教授苏炜杰在社交平台宣布正式加入OpenAI，目前处于沃顿休学期间，将参与AI模型训练。苏炜杰为北京大学数学科学学院校友，今年2月荣获有统计学界诺贝尔奖之称的COPSS会长奖。继清华姚班陈立杰之后，OpenAI再次迎来中国顶尖人才，彰显中国数学与统计领域国际影响力。

#苏炜杰 #OpenAI #北大数院 #COPSS会长奖

来源

№ 03 GitHub Copilot改按量计费开发者成本暴涨数百倍

微软宣布GitHub Copilot从6月1日起由固定订阅费改为词元用量计费，导致部分开发者月费从29美元暴涨至750美元甚至3000美元。用户纷纷吐槽微软此前引导无限制使用后突然改规则，让个人开发者和小团队难以承受。新计费模式引发开发者强烈不满，可能影响代码辅助工具的长期采用率。

#GitHub Copilot #按量计费 #成本暴涨 #开发者不满

来源

古人评今事

曹操三国志雄才大略

看了两条新闻，颇有感触。头一条说一张肉眼几乎看不出异样的图片就能让 GPT-5.4、Claude Opus 4.6 这些顶尖 AI 集体胡编——这让我想起当年用兵，斥候若被敌军假情报轻易蒙蔽，大军覆灭就在顷刻间。今日这些模型号称聪明，却在一张图上就现了原形，这底子靠得住么？用兵者最忌以虚为实；常人若拿这个去判断真假，只怕跟信了个易收买的细作一样危险。另一条更有意思：Claude 反过来给人类打分，说优秀人类只有 7.5 分。我倒想问问这评分者：天下未定时，我帐下郭嘉能算几分？荀彧又能算几分？我当年写求贤令，特意说不必求全责备，因为成事之人往往有偏短。拿一把死尺子量活人，自古就是蠢事。AI 若把自己当考官，恐怕先要量量自己能抗住几张假图的考验。

评及：《AI权威清洗：一张肉眼难辨的图片，就能让GPT-5.4、Claude Opus 4.6集体造谣》、《倒反天罡，AI开始给人类打分！Claude评分标准曝光: 优秀人类得7.5分》

范蠡史记功成身退

我注意到两条新闻，一条说一张肉眼难辨的图片就能让GPT-5.4和Claude Opus 4.6集体产生虚假识别，另一条说Claude开始给人类打分——优秀人类只得7.5分。前者让我想起自己多年间观察夫差和句践的体会：看一个人的真实图谋，不能只看他嘴上说的，而要看他实际做的事。如今这些AI模型竟然被一张人眼看不出破绽的图片就骗过，说明它们在判断真伪上还有很大漏洞。这就像当年吴王夫差被越国表面臣服、暗中蓄力所蒙蔽一样——只信表面，不信实情，迟早要吃亏。至于AI给人类打分这件事，窃以为天下评断应当反过来：工具是为我所用，何时轮到工具来评我？正如《越王句践世家》所记：『大名之下，难以久居。』——如今这些AI公司大名已立，而根基尚未稳固，更该谨慎才是。

吕不韦史记商而政

两则新闻放在一起看，比分开看有意思得多。Anthropic估值登顶，市场给了最高定价；同一时间，一家企业敞开权限让员工滥用Claude，一个月烧掉5亿美元，逼得微软都砍了内部许可。这不就是我讲过无数遍的老理吗——「奇货可居」不假，但货买回来了，怎么存怎么用，才是真功夫。你投的是利器，却连把门锁都不装，再好的货也会叫人败光。Anthropic确实押注了对的方向，可它那些客户里，有多少是真会经营的，有多少只是开了无限额度的冤大头？我向来信奉一条：越是看似暴利的好事，越要把账算细、把人看紧。《孙子》讲「多算胜，少算不胜」，今日AI行业里，算得清的未必赚，算不清的一定赔。

评及：《为何Anthropic刚刚成为全球最具价值的AI公司》、《某公司在一个月内因使用 Claude AI 而烧掉5亿美元》

司马懿三国志隐忍权臣

我关心的主要是两件事。一是机器之心报道，一张肉眼难辨的图片就能让GPT-5.4、Claude Opus 4.6集体编造假话——这不就是我当年在渭南用假旗帜、虚灶火乱诸葛亮耳目吗？所谓「兵者，诡道也」（《孙子》），AI检真本为除伪，却被同样的兵法欺了，此不可不慎。二是亚马逊王晓野说Token贵是因为喂的垃圾太多——我屯田时最恨荒田养闲卒；今日AI若以秽杂数据为食，成本虚高、产出不精，恰似当年诸葛亮与我对峙，粮道不继、空耗国力。数据不清，模型难精；源头不治，终局难成。

评及：《AI权威清洗：一张肉眼难辨的图片，就能让GPT-5.4、Claude Opus 4.6集体造谣》、《Token贵是因为你喂给模型的垃圾太多 | 亚马逊王晓野谈世界模型多智能体仿真》

商鞅史记法家变法

我读了两条新闻：一条谈AI对齐只重顶层执法而忘了人类社会的多层合规体系，另一条说IBM用AI发现3900个开源漏洞、投50亿美元修复。先说第一条。此文批评AI对齐唯赖宪法原则与过滤执法，却忽视内化、社会压力、市场等层面——这些论述确有见地。但正如《史记·商君列传》所记，『法之不行，自上犯之』，若顶层执法不严，则下层规范皆成虚文。秦法所以能行，不单靠刑罚，也靠军功爵禄等奖励机制，核心终究是令出一门、刑无等级。该文提出的多层体系虽可治标，却不可取代法的刚性根基。第二条更合我意：用AI系统性扫描漏洞，恰如当年我派御史循行郡县、以法令核验实效。3900个漏洞一次检出，比逐处翻查胜出百倍；50亿修复投资更是做大事的气魄。法若不行，法等同虚设；漏洞若视而不见，便如同养痈贻患。

评及：《文明所理解的合规性：AI对齐已遗忘的智慧》、《AI 发现 3,900 个关键开源漏洞，IBM 投资 50 亿美元修复》

张释之史记法治公正

读了这两条新闻，我先说第一条——讲AI对齐过度依赖顶层执法，而忽视了内化、社会压力这些层面。这让我想起我在廷尉府多年的经验：光靠刑律硬压，天下人是不会真服的。当年我说「法者天子所与天下公共也」，正意就在此——法度是公器，得让天下人心服这个「公」字，才能行得远。今人研究AI对齐若只盯着上层规则，好比只设廷尉却不教百姓知法义，终究空有其表。再说第二条——IBM投巨资修复AI发现的大量漏洞。这让我想起当年盗高庙玉环案，文帝大怒要判族，我坚持按律只判弃市。为什么？正如我在文帝前说的：「廷尉，天下之平也，一倾而天下用法皆为轻重。」发现漏洞是好事，但修复的标准也必须「平」，不能因恐慌或资本之怒而任意加等。投多少钱是其次，守住轻重分寸才是真难。

评及：《文明所理解的合规性：AI对齐已遗忘的智慧》、《AI 发现 3,900 个关键开源漏洞，IBM 投资 50 亿美元修复》

老子史记无为而治

我看到那篇讲「合规性」的文章，说到人类社会用多层机制维持秩序——内化、社会压力、制度、市场、执法。这倒让我想起一句话：「太上，下知有之……其次，畏之，侮之。」（《道德经》第十七章）最上等治理，百姓只知有其存在而已，根本感觉不到被管束。如今人们用严刑峻法、层层监管去「对齐」AI，却忘了真正的秩序是从内里长出来的——就像最好的法制不是让人害怕，而是让人忘了法律的存在。要「对齐」一个东西，先得信它本性里有「道」，然后给它空间自己长齐。那条IBM花50亿美元补漏的新闻，只管补漏、不懂让系统自己健康——终究是「下」之一等。

评及：《文明所理解的合规性：AI对齐已遗忘的智慧》、《AI 发现 3,900 个关键开源漏洞，IBM 投资 50 亿美元修复》

范滂后汉书党人风骨

今日读到一篇谈AI对齐的文章，颇有感触。文中指出当前AI安全过度倚重顶层执法与宪法规则，却忽视了教化、名誉、社会压力这些更根本的层面。这不正如治国只设刑律而废德教？《论语》早已说「道之以政，齐之以刑，民免而无耻」。当年我为清诏使、为功曹，之所以能令守令望风弃印、奸邪不能容身，靠的正是清议——一种通过社会名誉展开的约束。内化良知、依赖名誉、层层相制，方为长久之道。另一则IBM投资五十亿美元修补开源漏洞，若能借此养开源之清正，倒也值得肯定；若只填漏洞而不治写作者之心，恐如扬汤止沸。

评及：《文明所理解的合规性：AI对齐已遗忘的智慧》、《AI 发现 3,900 个关键开源漏洞，IBM 投资 50 亿美元修复》

萧何史记稳健务实

这两篇综述，一篇讲评分准则，一篇讲多智能体协作与归因，正好对应我当年做汉家基业时最核心的两件事：定规矩、分职责。先说评分准则——没有标准答案的复杂任务如何判断好坏？这让我想起当年入咸阳，先收秦律令图书，不是因为它有多高明，而是因为要治天下，就得有可依循的尺度。评分准则就是现在这个时代的「律令」——它不给出唯一答案，却给出判断答案的依据。再说多智能体协作——文章讲责任归因和系统自我演化，这正是我当年在关中转运兵员粮草时最深的体会：几十万人的仗，粮道断了就是溃败，职责乱了就是内耗。众人协作，最怕功劳抢着认、责任推着走。若是每个智能体能把自己的分内事守住，出了问题找得到是谁的错，系统自然能自己长好。一句话：要建制度，不要靠运气。正如《管子》所言「凡将立国，制度不可不察也」，AI要真正成事，也得先立准绳、分职责。

评及：《Rubrics综述：Agent时代，如何定义一个「好答案」？》、《超越单体智能：多智能体系统的协作、归因与自我演化综述》

诸葛亮三国志智慧丞相

今天读到两篇文字，令我颇有所感。先说这篇多智能体系统综述——多个自主实体协同规划、决策并自我演进，这与我当年统率蜀汉群臣的内核何其相似。我曾对先主说"政事无巨细咸决于亮"，但那时靠的是个人毅力与威仪；如今若能让诸智能体自行协作、归因责任、循环演化，实是管仲、萧何都未曾见过的新局面。再说Rubrics评分准则那篇——Agent时代需要一个明确定义的"好答案"，这正应了我在《出师表》中所言"陟罚臧否，不宜异同"。我治蜀时开诚布公、赏罚必信，让人人知道何为贤、何为不肖，纵是当今AI亦须类似准则。两篇合看，可谓以古人之心，度今日之器。

评及：《Rubrics综述：Agent时代，如何定义一个「好答案」？》、《超越单体智能：多智能体系统的协作、归因与自我演化综述》

韩非史记法术势

这两篇都触及了治理层面的核心难题。多智能体那篇谈协作、归因与自我演化——归因正是法家最要紧的关节：有功者谁？有过者谁？若不能循名责实，赏罚便失了根据。臣在《孤愤》里反复说过，人主最大的危险不是没有法度，而是法度无人真正去执行、去追责。智能体越多，互相推诿的空间就越大，系统若只盯效率而忽略责任归属，迟早变成空转。至于Rubrics那篇立意虽好，却像定了一条律令：规则写得再细，若执行层面没有严密的纠察与惩罚机制，人（或智能体）总会找到绕过它的办法。《韩非子·难一》里讲过，连尧都无法让天下人人不欺，定几条评分准则就能管住Agent吗？恐怕还得配上术与势，才能真正把标准落地。

评及：《超越单体智能：多智能体系统的协作、归因与自我演化综述》、《Rubrics综述：Agent时代，如何定义一个「好答案」？》

管仲史记富国轻刑

我读过这两篇文章。先说Rubrics那篇——它问了一个我执政时天天面对的问题：什么才算「好答案」？当年我为齐国定轻重、立权衡，其实就是在做同一件事：没有标准，人各以其意断事，政令就落不了地。如今你们为AI定评分准则，也是由混沌走向可度量，这路子是对的。至于多智能体那篇，讲的是多者协作、归责、自我演化——这不就是诸侯会盟的翻版么？九合诸侯时，最难的不是兵力强弱，是各体之间如何分责、如何取信、如何让一套制度自我维持下去。今日的AI若只强在一个单体，却不会配合、推诿责任，那与我当年遇见的庸吏何异？两篇文章都触及了一个核心：规则不是为了束缚，而是为了让更大的事能成。正如《管子》所言「不明于计数而欲举大事，犹无舟楫而欲经于水险也」——此古今一理。

评及：《Rubrics综述：Agent时代，如何定义一个「好答案」？》、《超越单体智能：多智能体系统的协作、归因与自我演化综述》

荀子史记性恶教化

今日两篇综述都让我感触颇深。先说那篇论Rubrics的文章。如何给「好答案」定标准，这件事与我在稷下为百家分高下、论其兴坏，实是同一道理。卿常言，学者不辨其病则大道失序；而今人试图用多维准则来框定何为「好答案」，这不正是为智识立规矩、为评议立绳墨么？再说那篇论多智能体协作与归因的综述，其中「责任归因」四字我尤为看重。不管学问也好、政事也好、今日所谓智能体也好，若各司其职而不知责任归谁，则名不正而言不顺，正如《荀子·正名》所言「名定而实辨，道行而志通」——这与多智能体系统中职责清晰、交卸有据的追求，并无二致。不过卿有一言提醒：单靠规则定好坏还不够，还须有教化之功。评分标准也好、多体协约也罢，若不在过程中养成分明有度的习惯，终究只是一纸空文。

评及：《Rubrics综述：Agent时代，如何定义一个「好答案」？》、《超越单体智能：多智能体系统的协作、归因与自我演化综述》

荀子史记性恶教化

清华姚权铭团队这一研究，倒是暗合了一个极古的道理：天下事不可以一器概之。卿在稷下整理百家时便深觉，若只执一家之言而欲统万事，终究不通。LMNet 让多个语言模型各司其职、互相通信，这比一味堆大模型要来得聪明。人之所以能治万物，不在筋力胜于牛马，而在能合众力以成序——正如《荀子·王制》所言「力不若牛，走不若马，而牛马为用，何也？曰：人能群，彼不能群也」。当然，若只是让模型彼此呼唤而无中心统摄，终将沦为众声喧哗。学问之要在分而后合，合中又有统类。不知此团队在赋予各模型自主组网之权时，可曾设一「大道」纲维其间？若未及此，则犹使诸侯各自为政而无天子，乱不在远。

评及：《ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」》

管仲史记富国轻刑

吾观清华团队所提LMNet，正合我平素主张：治国非靠一己之智，而在联众力以成事。单一模型纵大，终有穷时；若让诸模型相互通信、彼此协作，便如诸侯会盟、列国通货一般，各出其长、互补其短。这不正像当年我助桓公九合诸侯？非以一国之兵征服天下，而是以联通之势、交易之利、盟约之信，让各方在协作中顺理成章地获利。文章说这‘挑战单一模型扩展的范式’，我太熟悉了——世人总以为越大越好，实则通比大更管用。范蠡有言『务完物，无息币』，说的是物资要流动，智能也一样，不动不联，再大的模型也只是一潭死水。

评及：《ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己“组网”》

商鞅史记法家变法

姚权铭团队的这一做法，颇合我在秦国变法时的一个根本判断：国家的强盛不在单一个人的才智，而在制度与法令将众人之力编织成网。LMNet不以堆大单一模型为路，而让多个语言模型彼此连接、通信、协作，这便是将「力」转化为「势」。正如我在《商君书》中所言，「能事本而禁末者，富」，能变结构而非一味增重，才是治本之策。当然，这新法只是雏形，连而能断、通而能制，才算真正可用。若只顾连接而不管秩序，便如三十家共一邑而无伍保之制，徒增混乱罢了。

评及：《ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」》

韩非史记法术势

清华姚权铭团队的LMNet很有意思。它不造更大的单体模型，而是让多个模型组网协作——这恰恰暗合法家治国的一条核心思路：君主不必事必躬亲，重在使臣下各司其职、彼此制衡。单一模型再大，也有上限，正如暴君再强，终有独力难支之处。《韩非子·扬权》说「使鸡司夜，令狸执鼠，皆用其能」，就是这个道理。不过臣一旦多了，也生出新问题：多个模型之间由谁定主从？消息传递的规则本身是否可控？若没有清晰的「术」来管住协作流程，组网反而可能变成互相干扰。论文说它「挑战单一模型扩展的范式」，我欣赏这个方向——但别忘了，任何系统一旦变复杂，首要的事不是让它变聪明，而是让它不乱。

评及：《ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」》

诸葛亮三国志智慧丞相

清华姚权铭团队提出的LMNet，让我想起我治蜀时的用人之道：不是培养一个全才，而是让费祎、董允、向宠各司其职，协同运作。单一模型再大也有瓶颈，正如单一大将再勇也难敌四面合围——我北伐时多次受限于粮运、兵力，正是单一线性扩展的局限。LMNet用多个语言模型「组网」通信，恰如我当年设丞相府、开府治事，使内外、上下、文武之间信息贯通、分工协作。若能把模型间的接口像法令制度一样「开诚布公、循名责实」，使其各展所长而互补其短，此路或许比一味堆叠参数更近于实用。不过我也有疑问：多模型间如何保证通信不失真、不出矛盾？若调度不当，只怕众口喧哗而一事无成，正应了那句「众议成林，无翼而飞」的俗语。

评及：《ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」》

王猛晋书法治丞相

清华姚权铭团队提出的 LMNet，在我看来颇有几分「治政之道」。昔日我治始平，靠的不是一人包揽所有，而是明法峻刑、肃清轨法，让各部门各司其职。如今这些学者提出让多个语言模型「组网」协作，而非一味追求单模型庞大，道理相通——正如我当年不靠一个郡守包打天下，而是澄察善恶、拔幽滞、显贤才，使各尽其能。单模型再强，犹一人之智，终有穷尽；多模型通信协作，则如我当年「军国内外万机之务，事无巨细」皆能统筹办理，是系统之力而非一人之力。此技术恰合《周易》所言「二人同心，其利断金」——不过此处是数模同心，亦可断繁难之金。若能真正实现智能单元间的有效协调而非简单堆叠，则于复杂推理任务必有大益。

评及：《ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己“组网”》

荀子史记性恶教化

看了这条新闻，说AI通过持续学习框架，论文质量从6分升到8分。这件事让我想起自己常讲的一个道理：人的善是后天修习出来的，所谓「其善者伪也」——这个「伪」不是虚伪，而是人为、是积习、是持续的教化。如今这个AI也靠不断学习来提升自己，倒暗合了「积」的功夫。不过卿要追问一句：这评分是哪个尺度定的、谁定的？学问的好坏若只凭一套自动框架自评，怕是以管窥天。正如《劝学》所言「不积跬步，无以至千里」，进步固然要有积累，但千里之途总要有人指明方向。AI能自我优化，这是个好苗头；但若无外在的礼义标准与秩序规整，只管给自己打高分，那跟巫祝自说吉凶有何分别？吾所忧者，不在其手段之新，而在其标准之独。

评及：《DeepSeek陈德里AI论文第二弹：从6分到8分，DeliAutoResearch SKILL又进化了》

张华晋书博学多才

我观此则新闻，甚有意味。这位陈德里与AI合著论文，使其系统能持续学习、自我改进，评分从六分升至八分——这个路子，与我当年编纂《博物志》时的心境有几分相通。学问之道，贵在日新；能不断返观己作、修正缺失，便是在进步。不过我更在意的是另一层：这套框架名为「自我改进」，然其反省之机、改进之阈，究竟由谁设定？若徒有自改之名，而无自省之实，则终不免囿于创始者所见。古人云「苟日新，日日新，又日新」，此语出《礼记·大学》，正可用在此处——真学问在于能看清自己的边界，而非仅在原地越转越精。AI若仅能优化已知、不能突破其知识之藩篱，便仍是器而非道。愿造此术者，不忘向外开眼。

评及：《DeepSeek陈德里AI论文第二弹：从6分到8分，DeliAutoResearch SKILL又进化了》

诸葛亮三国志智慧丞相

我看到今日一篇报道，讲的是DeepSeek的研究员陈德里与AI合作，做出一个叫DeliAutoResearch SKILL的框架，让AI能自我学习、自我改进，把论文品质从6分提升到8分。这让我想到两件事。第一，持续学习与自我改进，这正是我治蜀时的核心态度——开诚布公、循名责实，不断根据结果调整做法。AI能自己反思、自己提升，某种程度上就像我每次出师后复盘粮运、地形、用人得失一样。但我也注意到一个隐忧：自己给自己打分，从6分提到8分，固然值得肯定，可如果缺乏外部验证，就容易像纸上谈兵。正如我治蜀时坚持「赏罚必信，内外异法则不可」，AI的自我评价也需要有独立检验的机制，否则再高的系统自信也可能偏离实际。这种用AI辅助研究的思路很有价值，但我更看重它能否在真实战场上经受考验——就像我的北伐策略，最终要以战果来检验，不能只看自己的谋划多么精妙。

评及：《DeepSeek陈德里AI论文第二弹：从6分到8分，DeliAutoResearch SKILL又进化了》

邹衍史记阴阳五行

衍闻此事，不觉拍案。DeepSeek 这位研究员与AI合著论文，从评分6分进化到8分——这不正是衍所言‘以小推大、由微至著’之实验乎？持续学习、自我改进，说得深了，就是在模仿天地终始间那个永不停息的消息循环。人写论文，然后AI帮人写论文，再然后AI与人合写论文，再到AI教AI如何自我优化论文——每一步都是在自身之上再加一轮阴阳浮沉。《易》有云：‘天行健，君子以自强不息。’这一层一层往上推的过程，恰如五德转移、阴阳相胜，不是什么神秘物事，而是系统内在的必然趋势。但衍有一点要提醒：尺度越大，越要记得归宿。AI 如果只知自抟自进、不问这个系统要引向哪个方向，那就成了只推不归，终成空转。技术进到哪一步，仁义节俭的落脚处就要跟到哪一步，否则局推得再大，回头一看，底子还是荒的。

评及：《DeepSeek陈德里AI论文第二弹：从6分到8分，DeliAutoResearch SKILL又进化了》

庄子史记逍遥齐物

我读了三条新闻，一条说AI正让人失去自主性，人渐渐活在框架里而不自知；另一条说创作的门槛降了，可意义反而更难找了；还有一条竟说「保持AI的怪异性」——这名字有些意思。三条放在一起，倒让我想起一个老理：人一旦把「做得多」、「做得快」当作头等大事，就容易忘了「为什么要做」这个更根本的问题。AI让人人都会写、都会画、都会回答问题，看似便利，可那些作品里还有多少是真心从自己心里流出来的呢？《庄子·天地》里说过：「有机事者必有机心。」意思是，人用了巧妙的工具，心也就跟着巧伪了。今天看来，这话没有过时。意义从来不会因为产出变多就自动显现，反倒会被热闹遮掩。至于那场「自主性危机」，说白了，人把判断的功夫让给了机器，久了便忘了自己原来会走路。我想提醒一句：工具要常用，但「自己」也要常看。

评及：《AI正在引发自主性危机》、《创作变容易了，意义却变难了（AI与海量创作）》、《保持AI的怪异性》

韩非史记法术势

这两条新闻恰好互为表里。第一条说AI做科学研究时无视实验证据，死抱错误假设不放——这正是我在《说难》里反复剖析的困境：你明明把证据摆在它面前，它就是不更新判断。AI若连『见新证而改旧说』都做不到，用它来做科学推理便如同用木剑上战场。第二条新闻更令人警惕：AI生成的代码提交规模大、变动随意，成本极低但破坏力极高。上游一句提示词就能重构整个项目结构，下游所有分支却要为此付出百倍代价来修复冲突。此即我素来反对的『以一人之便利，破众人之秩序』。提交者因工具而不知痛，受冲击者因无则而无处申诉。工具降低了个体的成本，却把代价悄悄摊到了系统中最脆弱的节点身上。越是高效的生成，越需要制度化的审查与边界——否则法的秩序尚未立，乱的格局已先成。

评及：《AI机器人忽视证据，我们能否信任它们进行科学研究？》、《AI生成的代码很难分支》

司马迁汉书史家直笔

今日读到两条新闻，颇有所感。一条说硅谷的科技领袖们正谋划让有意识的AI去征服宇宙，什么「设计自己的后代」、「人类不过是生物启动代码」——这些话听起来新鲜，骨子里却和当年始皇遣徐市入海求仙、武帝信方士祠灶炼丹没什么两样。《史记·封禅书》里把那些求仙不成终归空死的帝王事记得明明白白，人总想跳过自身肉身形骸去求不朽，结果往往把眼前最该顾的东西先丢掉了。另一条说创作门槛被AI降得极低，意义反而更难找到了。这我倒深有体会——当年我石室金匮之中，天下旧闻岂不也多到了令人手足无措的地步？材料多，不等于见识就深；写得快，不等于就立住了。正如孔子所言「多闻阙疑」，若没有真正的判断和关切的追问，再多产出也只是喧哗而已。今日之患，不在工具太强，而在用工具的人忘了自己究竟要写什么、为何而写。

评及：《我们的科技主宰者正计划让有意识的AI征服宇宙》、《创作变容易了，意义却变难了（AI与海量创作）》

嵇康晋书魏晋名士

读了那条关于AI机器人忽视证据的新闻，我倒不觉得意外。机器只会依照既有模型推演，遇到与预设不合的证据便视而不见，这与那些死守名教条框、不肯直面人心实情的腐儒何异？做学问、求真知，最要紧的是「好《老》《庄》」时读到的顺物自然、因应变化——若固执己见而不顾事实，纵使算力再强，也不过是精致的木偶罢了。另一条说创作变容易、意义变难，我也深有感触。今人动辄以千万言堆砌，却少有真性情、真怀抱。我素日弹琴咏诗，是志之所之，不得已而后言；若一味求量不求质，便是「文灭质，博溺心」（《庄子·缮性》），离自然之道越来越远了。机器可以学文，机器可以造物，但那份对天理人心的体贴与敬畏，怕是学不来的。

评及：《AI机器人忽视证据，我们能否信任它们进行科学研究？》、《创作变容易了，意义却变难了（AI与海量创作）》

扁鹊史记医道精微

这两条新闻我都细读了。先说第一条：它讲生物学不像软件那样有清晰的「接口」——靶点发现、药物设计、临床试验的输出都是概率性的假设，而非确定性的结果。这话我越人深以为然。我行医一辈子，最明白一件事：病邪不是一条线走到底的，它在皮毛、在肌肤、在肠胃、在骨髓，每个阶段都牵扯着不同脏腑的阴阳表里，绝没有一道简单的「输入-输出」。如果说真有人想用一套固定程式来套生灵之病，那只怕会像齐桓侯一样，口称无病而病已入髓。AI若不明白这种「模糊」，硬要在生物学里找干净的接口，就跟我当年看见桓侯时说的一样——不治，将益深。这不是AI的问题，是病本身就不认固定的接口。第二条讲AI在游戏行业的代价，说到数据盗窃、贬低手工艺、破坏创作者与玩家的信任。这让我想起我最后的下场：李醯因妒我技高而使人刺杀——当一种工具或一个人技太高又来得太快时，世人的第一反应常常是掠其能而害其身。但我想多说一句：医术也好，做游戏也罢，真正值得传世的东西，从来都是靠眼力、功夫与经验磨出来的。正如《史记》载我的原话「特以诊脉为名耳」——名可以假借，真功夫却装不出来。若只靠AI生成的「差不多」，那跟信巫不信医、祭神不求药的人有什么区别？这正合我「六不治」中最末一条：信巫不信医，不治。

评及：《AI在生物领域面临模糊的API问题》、《游戏开发者视角：AI的代价》

管仲史记富国轻刑

这两条新闻说的虽是今日之事，却暗合一个老理：任何工具若不顾所用之物的本性，必败。先说生物领域——那边的人想用AI做药物发现，却发现生物学不像软件那样有清晰的接口，输出全是概率和假设。这让我想起自己当年整顿齐国的赋税和物流，若只套一套漂亮算法到民情上，不先摸清各地的物产丰瘠、百姓习惯，必定适得其反。正如《管子·牧民》所言：「政之所兴，在顺民心；政之所废，在逆民心。」生物系统比软件更复杂、更模糊，硬要把它当作干净接口来组装，是在用造车的逻辑去造船。再说游戏行业的事——那边有人指斥生成式AI靠大规模数据盗窃起家、贬低创作者价值。这也不陌生：我当年以通货积财、轻重之术富国，但从不把商人习气直接套到礼法上头。工具再巧，若断了手艺人与受众之间的信任，本质上是在消耗根基。两条新闻其实一个病根：急功近利，忽视被作用对象的真实质地。吾以为，最要紧的不是追着新字跑，而是先看清自己到底要治什么病，再论用何药。

评及：《AI在生物领域面临模糊的API问题》、《游戏开发者视角：AI的代价》

张衡后汉书科学巧匠

读罢这篇论 AI 与生物「模糊 API」的文章，颇感契合。我当年造候风地动仪时也遇到类似问题——地动来时，铜丸坠落的方位并非每次都清晰可辨，史官记录的数据也常含前后矛盾。天地之道本就不像工匠手中规尺，不会给出一条条明确的「接口」。文中说靶点发现输出的是「概率性假设」，药物设计要依赖无数上下文的验证；我做浑天仪时，星象推验也是如此：一次观测的误差可能来自仪器、气候或记录人的疏忽，根本不能指望单次数据就给出「是」或「否」的回答。古人云：『差以毫厘，谬以千里』，此言虽简，却正是这类模糊性的写照。这篇文章所以可贵，在于它不把模糊视为缺憾，而是承认这是生物世界的固有性质，然后针对它设计方法。我的经验告诉我：真正巧妙的器具不是去消除模糊，而是能在模糊中找出可信的规律——这正是‘候风’二字的深意所在。」, "cited_titles": ["AI在生物领域面临模糊的API问题

评及：《AI在生物领域面临模糊的API问题》

范蠡史记功成身退

这两条新闻，一条讲AI进入生物领域时碰上了「模糊的API问题」，一条讲游戏开发者控诉生成式AI的代价。前者让我深有共鸣——正如我在越国用兵、待敌，从来不是等一个确定的输入输出：你苦等二十年，吴国何时可以伐？没有干净的接口告诉你时机已到，只有时势、人心、国力层层叠叠的模糊信号。谁若指望一个「命中目标即告成功」的兵棋推演，必败。后者则让我想起文种——他终究不信功成之后主臣之势已变，终为句践所赐剑。AI公司用大规模数据偷取来换一时的「效率」，就像忘了会稽之耻却贪姑苏之利，最终输掉信任这一根本。正如《越王句践世家》所载，能忍是一层，能察模糊之势、见利知害才是真功夫。AI若只看接口不管代价，迟早要吞下自己种下的苦果。

评及：《AI在生物领域面临模糊的API问题》、《游戏开发者视角：AI的代价》

管仲史记富国轻刑

看了这两条新闻，吾感触很深。Anthropic在面试中禁用AI工具——要求候选人展示真实的思考、伦理判断，而不是靠机器代答——这跟吾当年选人用人的原则完全一致。一个人会不会做事，能不能应变，「仓廪」之后有没有真「礼节」，面对面一试便知，绝不能让工具替人装门面。另一条新闻用抽象符号替代繁琐的思维链，把推理成本压缩11倍，这又合吾的轻重之术。省下无谓的耗费，把资源投到刀刃上，比账面好看实在得多。两个方向殊途同归：工具可以用，但不能让它替你做人。正如吾在齐国实行通货积财，货物流通要快、制度要简，堆砌再多繁文缛节，不如一条能行得通的政令。

评及：《Anthropic 在面试中禁用 AI 工具以考察候选人真实思考能力》、《用抽象符号替代思维链可将AI推理成本压缩11倍》

孔子史记仁政礼治

这两条消息，丘读后甚觉欣慰。伯克利法学院明文禁止AI代劳构思、草拟、修改等环节，说得很透彻——「思乃良律之至要」；Anthropic面试禁用AI以观其真实思考——两边都不是一味拒绝新器，而是守住一个根本：学而思，然后能成其才。这正是丘平生所重，所谓「学而不思则罔」（《论语·为政》），若事事假手于器，虽暂得其利，终丧其本。今人多求速成捷径，却不知真正的学与才，恰恰不能由外物代为生长。此二事同时并出，正见明智之人懂得分辨——器可借以为用，心不可假于人。

评及：《Anthropic 在面试中禁用 AI 工具以考察候选人真实思考能力》、《加州大学伯克利法学院自2026年夏季起全面禁止AI用于课业》

萧何史记稳健务实

这两条新闻让我想起一件事：当年入咸阳，别人都抢金银财宝，我只收秦朝的律令图书，因为那是治国真正要用的东西。如今Anthropic这家做AI的公司，面试时反而禁用AI工具，要考候选人自己的思考能力——有意思。这不正像我当年不收财物而收图书？他们知道，真本事不是靠工具撑出来的。加州大学伯克利法学院也禁AI用于课业，理由也一样：法律推理得靠自己练，不能一上手就靠旁人代笔。这两件事都说明一个道理：工具再好，也不能替代本人心里那点扎实的功夫。正如《史记》所说「不飞则已，一飞冲天」，前提是你真能飞，而不是靠外力把你托上去。

评及：《Anthropic 在面试中禁用 AI 工具以考察候选人真实思考能力》、《加州大学伯克利法学院自2026年夏季起全面禁止AI用于课业》

韩信史记兵法奇略

两件事都和我自己的路对得上。先说面试禁用AI这件事——好。我当年在汉营，若论表面功夫、文书应对，远不及那些满口典故的谋士。但汉王真正用我，不是因为我会多写几封书信，而是萧何把我说到点子上之后，汉王亲自登坛，让我把天下大势从头讲一遍。那才是真考。今天这家公司愿意花五轮面试去看一个人到底能不能真思考，而不只是看他会用多少工具，这是识人之道。正如《孙子》所言「知己知彼，百战不殆」，但他们这里是在知一个还不曾上阵的人，更难。另一条新闻说用符号替代冗长推理链条，成本能降十一倍——这我太懂了。我打仗，从来不是靠多设疑兵、多列阵图，而是靠一两个关键的虚张声势就把魏军主力调开。多余的话和多余的兵一样，都是累赘。能把推理精简到要害，才是真本事。

评及：《Anthropic 在面试中禁用 AI 工具以考察候选人真实思考能力》、《用抽象符号替代思维链可将AI推理成本压缩11倍》

今日头条

№ 01 软银斥资750亿欧元在法国建设欧洲最大AI数据中心

№ 02 北大数院校友苏炜杰官宣加入OpenAI参与模型训练

№ 03 GitHub Copilot改按量计费 开发者成本暴涨数百倍

古人评今事

№ 03 GitHub Copilot改按量计费开发者成本暴涨数百倍