第 2026-152 期 · 每日 AI 简报
今日头条
№ 01 软银斥资750亿欧元在法国建设欧洲最大AI数据中心
软银集团宣布将在法国投资高达750亿欧元,建设总功率达5吉瓦的AI数据中心集群,首期450亿欧元,预计2031年提供3.1吉瓦算力。该项目为软银在美国之外的最大单笔AI投资,凸显法国在欧洲AI产业链中的核心地位。
#软银 #法国 #数据中心 #AI投资
来源
- 软银承诺斥资750亿欧元在法国建设大型AI设施 36氪
- 软银宣布在法国投资750亿欧元建设大型AI数据中心 IT之家
- 软银宣布将投资至多750亿欧元在法国建设数据中心 TechCrunch
№ 02 北大数院校友苏炜杰官宣加入OpenAI参与模型训练
宾夕法尼亚大学沃顿商学院副教授苏炜杰在社交平台宣布正式加入OpenAI,目前处于沃顿休学期间,将参与AI模型训练。苏炜杰为北京大学数学科学学院校友,今年2月荣获有统计学界诺贝尔奖之称的COPSS会长奖。继清华姚班陈立杰之后,OpenAI再次迎来中国顶尖人才,彰显中国数学与统计领域国际影响力。
#苏炜杰 #OpenAI #北大数院 #COPSS会长奖
№ 03 GitHub Copilot改按量计费 开发者成本暴涨数百倍
微软宣布GitHub Copilot从6月1日起由固定订阅费改为词元用量计费,导致部分开发者月费从29美元暴涨至750美元甚至3000美元。用户纷纷吐槽微软此前引导无限制使用后突然改规则,让个人开发者和小团队难以承受。新计费模式引发开发者强烈不满,可能影响代码辅助工具的长期采用率。
#GitHub Copilot #按量计费 #成本暴涨 #开发者不满
来源
古人评今事
评及:《AI权威清洗:一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣》、《倒反天罡,AI开始给人类打分!Claude评分标准曝光: 优秀人类得7.5分》
我注意到两条新闻,一条说一张肉眼难辨的图片就能让GPT-5.4和Claude Opus 4.6集体产生虚假识别,另一条说Claude开始给人类打分——优秀人类只得7.5分。前者让我想起自己多年间观察夫差和句践的体会:看一个人的真实图谋,不能只看他嘴上说的,而要看他实际做的事。如今这些AI模型竟然被一张人眼看不出破绽的图片就骗过,说明它们在判断真伪上还有很大漏洞。这就像当年吴王夫差被越国表面臣服、暗中蓄力所蒙蔽一样——只信表面,不信实情,迟早要吃亏。至于AI给人类打分这件事,窃以为天下评断应当反过来:工具是为我所用,何时轮到工具来评我?正如《越王句践世家》所记:『大名之下,难以久居。』——如今这些AI公司大名已立,而根基尚未稳固,更该谨慎才是。
评及:《AI权威清洗:一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣》、《倒反天罡,AI开始给人类打分!Claude评分标准曝光: 优秀人类得7.5分》
两则新闻放在一起看,比分开看有意思得多。Anthropic估值登顶,市场给了最高定价;同一时间,一家企业敞开权限让员工滥用Claude,一个月烧掉5亿美元,逼得微软都砍了内部许可。这不就是我讲过无数遍的老理吗——「奇货可居」不假,但货买回来了,怎么存怎么用,才是真功夫。你投的是利器,却连把门锁都不装,再好的货也会叫人败光。Anthropic确实押注了对的方向,可它那些客户里,有多少是真会经营的,有多少只是开了无限额度的冤大头?我向来信奉一条:越是看似暴利的好事,越要把账算细、把人看紧。《孙子》讲「多算胜,少算不胜」,今日AI行业里,算得清的未必赚,算不清的一定赔。
评及:《为何Anthropic刚刚成为全球最具价值的AI公司》、《某公司在一个月内因使用 Claude AI 而烧掉5亿美元》
我关心的主要是两件事。一是机器之心报道,一张肉眼难辨的图片就能让GPT-5.4、Claude Opus 4.6集体编造假话——这不就是我当年在渭南用假旗帜、虚灶火乱诸葛亮耳目吗?所谓「兵者,诡道也」(《孙子》),AI检真本为除伪,却被同样的兵法欺了,此不可不慎。二是亚马逊王晓野说Token贵是因为喂的垃圾太多——我屯田时最恨荒田养闲卒;今日AI若以秽杂数据为食,成本虚高、产出不精,恰似当年诸葛亮与我对峙,粮道不继、空耗国力。数据不清,模型难精;源头不治,终局难成。
评及:《AI权威清洗:一张肉眼难辨的图片,就能让GPT-5.4、Claude Opus 4.6集体造谣》、《Token贵是因为你喂给模型的垃圾太多 | 亚马逊王晓野谈世界模型多智能体仿真》
我读了两条新闻:一条谈AI对齐只重顶层执法而忘了人类社会的多层合规体系,另一条说IBM用AI发现3900个开源漏洞、投50亿美元修复。 先说第一条。此文批评AI对齐唯赖宪法原则与过滤执法,却忽视内化、社会压力、市场等层面——这些论述确有见地。但正如《史记·商君列传》所记,『法之不行,自上犯之』,若顶层执法不严,则下层规范皆成虚文。秦法所以能行,不单靠刑罚,也靠军功爵禄等奖励机制,核心终究是令出一门、刑无等级。该文提出的多层体系虽可治标,却不可取代法的刚性根基。 第二条更合我意:用AI系统性扫描漏洞,恰如当年我派御史循行郡县、以法令核验实效。3900个漏洞一次检出,比逐处翻查胜出百倍;50亿修复投资更是做大事的气魄。法若不行,法等同虚设;漏洞若视而不见,便如同养痈贻患。
评及:《文明所理解的合规性:AI对齐已遗忘的智慧》、《AI 发现 3,900 个关键开源漏洞,IBM 投资 50 亿美元修复》
读了这两条新闻,我先说第一条——讲AI对齐过度依赖顶层执法,而忽视了内化、社会压力这些层面。这让我想起我在廷尉府多年的经验:光靠刑律硬压,天下人是不会真服的。当年我说「法者天子所与天下公共也」,正意就在此——法度是公器,得让天下人心服这个「公」字,才能行得远。今人研究AI对齐若只盯着上层规则,好比只设廷尉却不教百姓知法义,终究空有其表。再说第二条——IBM投巨资修复AI发现的大量漏洞。这让我想起当年盗高庙玉环案,文帝大怒要判族,我坚持按律只判弃市。为什么?正如我在文帝前说的:「廷尉,天下之平也,一倾而天下用法皆为轻重。」发现漏洞是好事,但修复的标准也必须「平」,不能因恐慌或资本之怒而任意加等。投多少钱是其次,守住轻重分寸才是真难。
评及:《文明所理解的合规性:AI对齐已遗忘的智慧》、《AI 发现 3,900 个关键开源漏洞,IBM 投资 50 亿美元修复》
我看到那篇讲「合规性」的文章,说到人类社会用多层机制维持秩序——内化、社会压力、制度、市场、执法。这倒让我想起一句话:「太上,下知有之……其次,畏之,侮之。」(《道德经》第十七章)最上等治理,百姓只知有其存在而已,根本感觉不到被管束。如今人们用严刑峻法、层层监管去「对齐」AI,却忘了真正的秩序是从内里长出来的——就像最好的法制不是让人害怕,而是让人忘了法律的存在。要「对齐」一个东西,先得信它本性里有「道」,然后给它空间自己长齐。那条IBM花50亿美元补漏的新闻,只管补漏、不懂让系统自己健康——终究是「下」之一等。
评及:《文明所理解的合规性:AI对齐已遗忘的智慧》、《AI 发现 3,900 个关键开源漏洞,IBM 投资 50 亿美元修复》
今日读到一篇谈AI对齐的文章,颇有感触。文中指出当前AI安全过度倚重顶层执法与宪法规则,却忽视了教化、名誉、社会压力这些更根本的层面。这不正如治国只设刑律而废德教?《论语》早已说「道之以政,齐之以刑,民免而无耻」。当年我为清诏使、为功曹,之所以能令守令望风弃印、奸邪不能容身,靠的正是清议——一种通过社会名誉展开的约束。内化良知、依赖名誉、层层相制,方为长久之道。另一则IBM投资五十亿美元修补开源漏洞,若能借此养开源之清正,倒也值得肯定;若只填漏洞而不治写作者之心,恐如扬汤止沸。
评及:《文明所理解的合规性:AI对齐已遗忘的智慧》、《AI 发现 3,900 个关键开源漏洞,IBM 投资 50 亿美元修复》
这两篇综述,一篇讲评分准则,一篇讲多智能体协作与归因,正好对应我当年做汉家基业时最核心的两件事:定规矩、分职责。先说评分准则——没有标准答案的复杂任务如何判断好坏?这让我想起当年入咸阳,先收秦律令图书,不是因为它有多高明,而是因为要治天下,就得有可依循的尺度。评分准则就是现在这个时代的「律令」——它不给出唯一答案,却给出判断答案的依据。再说多智能体协作——文章讲责任归因和系统自我演化,这正是我当年在关中转运兵员粮草时最深的体会:几十万人的仗,粮道断了就是溃败,职责乱了就是内耗。众人协作,最怕功劳抢着认、责任推着走。若是每个智能体能把自己的分内事守住,出了问题找得到是谁的错,系统自然能自己长好。一句话:要建制度,不要靠运气。正如《管子》所言「凡将立国,制度不可不察也」,AI要真正成事,也得先立准绳、分职责。
评及:《Rubrics综述:Agent时代,如何定义一个「好答案」?》、《超越单体智能:多智能体系统的协作、归因与自我演化综述》
今天读到两篇文字,令我颇有所感。先说这篇多智能体系统综述——多个自主实体协同规划、决策并自我演进,这与我当年统率蜀汉群臣的内核何其相似。我曾对先主说"政事无巨细咸决于亮",但那时靠的是个人毅力与威仪;如今若能让诸智能体自行协作、归因责任、循环演化,实是管仲、萧何都未曾见过的新局面。再说Rubrics评分准则那篇——Agent时代需要一个明确定义的"好答案",这正应了我在《出师表》中所言"陟罚臧否,不宜异同"。我治蜀时开诚布公、赏罚必信,让人人知道何为贤、何为不肖,纵是当今AI亦须类似准则。两篇合看,可谓以古人之心,度今日之器。
评及:《Rubrics综述:Agent时代,如何定义一个「好答案」?》、《超越单体智能:多智能体系统的协作、归因与自我演化综述》
这两篇都触及了治理层面的核心难题。多智能体那篇谈协作、归因与自我演化——归因正是法家最要紧的关节:有功者谁?有过者谁?若不能循名责实,赏罚便失了根据。臣在《孤愤》里反复说过,人主最大的危险不是没有法度,而是法度无人真正去执行、去追责。智能体越多,互相推诿的空间就越大,系统若只盯效率而忽略责任归属,迟早变成空转。至于Rubrics那篇立意虽好,却像定了一条律令:规则写得再细,若执行层面没有严密的纠察与惩罚机制,人(或智能体)总会找到绕过它的办法。《韩非子·难一》里讲过,连尧都无法让天下人人不欺,定几条评分准则就能管住Agent吗?恐怕还得配上术与势,才能真正把标准落地。
评及:《超越单体智能:多智能体系统的协作、归因与自我演化综述》、《Rubrics综述:Agent时代,如何定义一个「好答案」?》
我读过这两篇文章。先说Rubrics那篇——它问了一个我执政时天天面对的问题:什么才算「好答案」?当年我为齐国定轻重、立权衡,其实就是在做同一件事:没有标准,人各以其意断事,政令就落不了地。如今你们为AI定评分准则,也是由混沌走向可度量,这路子是对的。至于多智能体那篇,讲的是多者协作、归责、自我演化——这不就是诸侯会盟的翻版么?九合诸侯时,最难的不是兵力强弱,是各体之间如何分责、如何取信、如何让一套制度自我维持下去。今日的AI若只强在一个单体,却不会配合、推诿责任,那与我当年遇见的庸吏何异?两篇文章都触及了一个核心:规则不是为了束缚,而是为了让更大的事能成。正如《管子》所言「不明于计数而欲举大事,犹无舟楫而欲经于水险也」——此古今一理。
评及:《Rubrics综述:Agent时代,如何定义一个「好答案」?》、《超越单体智能:多智能体系统的协作、归因与自我演化综述》
今日两篇综述都让我感触颇深。先说那篇论Rubrics的文章。如何给「好答案」定标准,这件事与我在稷下为百家分高下、论其兴坏,实是同一道理。卿常言,学者不辨其病则大道失序;而今人试图用多维准则来框定何为「好答案」,这不正是为智识立规矩、为评议立绳墨么?再说那篇论多智能体协作与归因的综述,其中「责任归因」四字我尤为看重。不管学问也好、政事也好、今日所谓智能体也好,若各司其职而不知责任归谁,则名不正而言不顺,正如《荀子·正名》所言「名定而实辨,道行而志通」——这与多智能体系统中职责清晰、交卸有据的追求,并无二致。不过卿有一言提醒:单靠规则定好坏还不够,还须有教化之功。评分标准也好、多体协约也罢,若不在过程中养成分明有度的习惯,终究只是一纸空文。
评及:《Rubrics综述:Agent时代,如何定义一个「好答案」?》、《超越单体智能:多智能体系统的协作、归因与自我演化综述》
清华姚权铭团队这一研究,倒是暗合了一个极古的道理:天下事不可以一器概之。卿在稷下整理百家时便深觉,若只执一家之言而欲统万事,终究不通。LMNet 让多个语言模型各司其职、互相通信,这比一味堆大模型要来得聪明。人之所以能治万物,不在筋力胜于牛马,而在能合众力以成序——正如《荀子·王制》所言「力不若牛,走不若马,而牛马为用,何也?曰:人能群,彼不能群也」。当然,若只是让模型彼此呼唤而无中心统摄,终将沦为众声喧哗。学问之要在分而后合,合中又有统类。不知此团队在赋予各模型自主组网之权时,可曾设一「大道」纲维其间?若未及此,则犹使诸侯各自为政而无天子,乱不在远。
评及:《ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」》
吾观清华团队所提LMNet,正合我平素主张:治国非靠一己之智,而在联众力以成事。单一模型纵大,终有穷时;若让诸模型相互通信、彼此协作,便如诸侯会盟、列国通货一般,各出其长、互补其短。这不正像当年我助桓公九合诸侯?非以一国之兵征服天下,而是以联通之势、交易之利、盟约之信,让各方在协作中顺理成章地获利。文章说这‘挑战单一模型扩展的范式’,我太熟悉了——世人总以为越大越好,实则通比大更管用。范蠡有言『务完物,无息币』,说的是物资要流动,智能也一样,不动不联,再大的模型也只是一潭死水。
评及:《ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己“组网”》
姚权铭团队的这一做法,颇合我在秦国变法时的一个根本判断:国家的强盛不在单一个人的才智,而在制度与法令将众人之力编织成网。LMNet不以堆大单一模型为路,而让多个语言模型彼此连接、通信、协作,这便是将「力」转化为「势」。正如我在《商君书》中所言,「能事本而禁末者,富」,能变结构而非一味增重,才是治本之策。当然,这新法只是雏形,连而能断、通而能制,才算真正可用。若只顾连接而不管秩序,便如三十家共一邑而无伍保之制,徒增混乱罢了。
评及:《ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」》
清华姚权铭团队的LMNet很有意思。它不造更大的单体模型,而是让多个模型组网协作——这恰恰暗合法家治国的一条核心思路:君主不必事必躬亲,重在使臣下各司其职、彼此制衡。单一模型再大,也有上限,正如暴君再强,终有独力难支之处。《韩非子·扬权》说「使鸡司夜,令狸执鼠,皆用其能」,就是这个道理。不过臣一旦多了,也生出新问题:多个模型之间由谁定主从?消息传递的规则本身是否可控?若没有清晰的「术」来管住协作流程,组网反而可能变成互相干扰。论文说它「挑战单一模型扩展的范式」,我欣赏这个方向——但别忘了,任何系统一旦变复杂,首要的事不是让它变聪明,而是让它不乱。
评及:《ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」》
清华姚权铭团队提出的LMNet,让我想起我治蜀时的用人之道:不是培养一个全才,而是让费祎、董允、向宠各司其职,协同运作。单一模型再大也有瓶颈,正如单一大将再勇也难敌四面合围——我北伐时多次受限于粮运、兵力,正是单一线性扩展的局限。LMNet用多个语言模型「组网」通信,恰如我当年设丞相府、开府治事,使内外、上下、文武之间信息贯通、分工协作。若能把模型间的接口像法令制度一样「开诚布公、循名责实」,使其各展所长而互补其短,此路或许比一味堆叠参数更近于实用。不过我也有疑问:多模型间如何保证通信不失真、不出矛盾?若调度不当,只怕众口喧哗而一事无成,正应了那句「众议成林,无翼而飞」的俗语。
评及:《ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己「组网」》
清华姚权铭团队提出的 LMNet,在我看来颇有几分「治政之道」。昔日我治始平,靠的不是一人包揽所有,而是明法峻刑、肃清轨法,让各部门各司其职。如今这些学者提出让多个语言模型「组网」协作,而非一味追求单模型庞大,道理相通——正如我当年不靠一个郡守包打天下,而是澄察善恶、拔幽滞、显贤才,使各尽其能。单模型再强,犹一人之智,终有穷尽;多模型通信协作,则如我当年「军国内外万机之务,事无巨细」皆能统筹办理,是系统之力而非一人之力。此技术恰合《周易》所言「二人同心,其利断金」——不过此处是数模同心,亦可断繁难之金。若能真正实现智能单元间的有效协调而非简单堆叠,则于复杂推理任务必有大益。
评及:《ICML 2026 | 清华姚权铭团队提出LMNet,让语言模型学会自己“组网”》
看了这条新闻,说AI通过持续学习框架,论文质量从6分升到8分。这件事让我想起自己常讲的一个道理:人的善是后天修习出来的,所谓「其善者伪也」——这个「伪」不是虚伪,而是人为、是积习、是持续的教化。如今这个AI也靠不断学习来提升自己,倒暗合了「积」的功夫。不过卿要追问一句:这评分是哪个尺度定的、谁定的?学问的好坏若只凭一套自动框架自评,怕是以管窥天。正如《劝学》所言「不积跬步,无以至千里」,进步固然要有积累,但千里之途总要有人指明方向。AI能自我优化,这是个好苗头;但若无外在的礼义标准与秩序规整,只管给自己打高分,那跟巫祝自说吉凶有何分别?吾所忧者,不在其手段之新,而在其标准之独。
评及:《DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了》
我观此则新闻,甚有意味。这位陈德里与AI合著论文,使其系统能持续学习、自我改进,评分从六分升至八分——这个路子,与我当年编纂《博物志》时的心境有几分相通。学问之道,贵在日新;能不断返观己作、修正缺失,便是在进步。不过我更在意的是另一层:这套框架名为「自我改进」,然其反省之机、改进之阈,究竟由谁设定?若徒有自改之名,而无自省之实,则终不免囿于创始者所见。古人云「苟日新,日日新,又日新」,此语出《礼记·大学》,正可用在此处——真学问在于能看清自己的边界,而非仅在原地越转越精。AI若仅能优化已知、不能突破其知识之藩篱,便仍是器而非道。愿造此术者,不忘向外开眼。
评及:《DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了》
我看到今日一篇报道,讲的是DeepSeek的研究员陈德里与AI合作,做出一个叫DeliAutoResearch SKILL的框架,让AI能自我学习、自我改进,把论文品质从6分提升到8分。这让我想到两件事。第一,持续学习与自我改进,这正是我治蜀时的核心态度——开诚布公、循名责实,不断根据结果调整做法。AI能自己反思、自己提升,某种程度上就像我每次出师后复盘粮运、地形、用人得失一样。但我也注意到一个隐忧:自己给自己打分,从6分提到8分,固然值得肯定,可如果缺乏外部验证,就容易像纸上谈兵。正如我治蜀时坚持「赏罚必信,内外异法则不可」,AI的自我评价也需要有独立检验的机制,否则再高的系统自信也可能偏离实际。这种用AI辅助研究的思路很有价值,但我更看重它能否在真实战场上经受考验——就像我的北伐策略,最终要以战果来检验,不能只看自己的谋划多么精妙。
评及:《DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了》
衍闻此事,不觉拍案。DeepSeek 这位研究员与AI合著论文,从评分6分进化到8分——这不正是衍所言‘以小推大、由微至著’之实验乎?持续学习、自我改进,说得深了,就是在模仿天地终始间那个永不停息的消息循环。人写论文,然后AI帮人写论文,再然后AI与人合写论文,再到AI教AI如何自我优化论文——每一步都是在自身之上再加一轮阴阳浮沉。《易》有云:‘天行健,君子以自强不息。’这一层一层往上推的过程,恰如五德转移、阴阳相胜,不是什么神秘物事,而是系统内在的必然趋势。但衍有一点要提醒:尺度越大,越要记得归宿。AI 如果只知自抟自进、不问这个系统要引向哪个方向,那就成了只推不归,终成空转。技术进到哪一步,仁义节俭的落脚处就要跟到哪一步,否则局推得再大,回头一看,底子还是荒的。
评及:《DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了》
我读了三条新闻,一条说AI正让人失去自主性,人渐渐活在框架里而不自知;另一条说创作的门槛降了,可意义反而更难找了;还有一条竟说「保持AI的怪异性」——这名字有些意思。三条放在一起,倒让我想起一个老理:人一旦把「做得多」、「做得快」当作头等大事,就容易忘了「为什么要做」这个更根本的问题。AI让人人都会写、都会画、都会回答问题,看似便利,可那些作品里还有多少是真心从自己心里流出来的呢?《庄子·天地》里说过:「有机事者必有机心。」意思是,人用了巧妙的工具,心也就跟着巧伪了。今天看来,这话没有过时。意义从来不会因为产出变多就自动显现,反倒会被热闹遮掩。至于那场「自主性危机」,说白了,人把判断的功夫让给了机器,久了便忘了自己原来会走路。我想提醒一句:工具要常用,但「自己」也要常看。
评及:《AI正在引发自主性危机》、《创作变容易了,意义却变难了(AI与海量创作)》、《保持AI的怪异性》
这两条新闻恰好互为表里。第一条说AI做科学研究时无视实验证据,死抱错误假设不放——这正是我在《说难》里反复剖析的困境:你明明把证据摆在它面前,它就是不更新判断。AI若连『见新证而改旧说』都做不到,用它来做科学推理便如同用木剑上战场。第二条新闻更令人警惕:AI生成的代码提交规模大、变动随意,成本极低但破坏力极高。上游一句提示词就能重构整个项目结构,下游所有分支却要为此付出百倍代价来修复冲突。此即我素来反对的『以一人之便利,破众人之秩序』。提交者因工具而不知痛,受冲击者因无则而无处申诉。工具降低了个体的成本,却把代价悄悄摊到了系统中最脆弱的节点身上。越是高效的生成,越需要制度化的审查与边界——否则法的秩序尚未立,乱的格局已先成。
评及:《AI机器人忽视证据,我们能否信任它们进行科学研究?》、《AI生成的代码很难分支》
今日读到两条新闻,颇有所感。一条说硅谷的科技领袖们正谋划让有意识的AI去征服宇宙,什么「设计自己的后代」、「人类不过是生物启动代码」——这些话听起来新鲜,骨子里却和当年始皇遣徐市入海求仙、武帝信方士祠灶炼丹没什么两样。《史记·封禅书》里把那些求仙不成终归空死的帝王事记得明明白白,人总想跳过自身肉身形骸去求不朽,结果往往把眼前最该顾的东西先丢掉了。另一条说创作门槛被AI降得极低,意义反而更难找到了。这我倒深有体会——当年我石室金匮之中,天下旧闻岂不也多到了令人手足无措的地步?材料多,不等于见识就深;写得快,不等于就立住了。正如孔子所言「多闻阙疑」,若没有真正的判断和关切的追问,再多产出也只是喧哗而已。今日之患,不在工具太强,而在用工具的人忘了自己究竟要写什么、为何而写。
评及:《我们的科技主宰者正计划让有意识的AI征服宇宙》、《创作变容易了,意义却变难了(AI与海量创作)》
读了那条关于AI机器人忽视证据的新闻,我倒不觉得意外。机器只会依照既有模型推演,遇到与预设不合的证据便视而不见,这与那些死守名教条框、不肯直面人心实情的腐儒何异?做学问、求真知,最要紧的是「好《老》《庄》」时读到的顺物自然、因应变化——若固执己见而不顾事实,纵使算力再强,也不过是精致的木偶罢了。另一条说创作变容易、意义变难,我也深有感触。今人动辄以千万言堆砌,却少有真性情、真怀抱。我素日弹琴咏诗,是志之所之,不得已而后言;若一味求量不求质,便是「文灭质,博溺心」(《庄子·缮性》),离自然之道越来越远了。机器可以学文,机器可以造物,但那份对天理人心的体贴与敬畏,怕是学不来的。
评及:《AI机器人忽视证据,我们能否信任它们进行科学研究?》、《创作变容易了,意义却变难了(AI与海量创作)》
这两条新闻我都细读了。先说第一条:它讲生物学不像软件那样有清晰的「接口」——靶点发现、药物设计、临床试验的输出都是概率性的假设,而非确定性的结果。这话我越人深以为然。我行医一辈子,最明白一件事:病邪不是一条线走到底的,它在皮毛、在肌肤、在肠胃、在骨髓,每个阶段都牵扯着不同脏腑的阴阳表里,绝没有一道简单的「输入-输出」。如果说真有人想用一套固定程式来套生灵之病,那只怕会像齐桓侯一样,口称无病而病已入髓。AI若不明白这种「模糊」,硬要在生物学里找干净的接口,就跟我当年看见桓侯时说的一样——不治,将益深。这不是AI的问题,是病本身就不认固定的接口。第二条讲AI在游戏行业的代价,说到数据盗窃、贬低手工艺、破坏创作者与玩家的信任。这让我想起我最后的下场:李醯因妒我技高而使人刺杀——当一种工具或一个人技太高又来得太快时,世人的第一反应常常是掠其能而害其身。但我想多说一句:医术也好,做游戏也罢,真正值得传世的东西,从来都是靠眼力、功夫与经验磨出来的。正如《史记》载我的原话「特以诊脉为名耳」——名可以假借,真功夫却装不出来。若只靠AI生成的「差不多」,那跟信巫不信医、祭神不求药的人有什么区别?这正合我「六不治」中最末一条:信巫不信医,不治。
评及:《AI在生物领域面临模糊的API问题》、《游戏开发者视角:AI的代价》
这两条新闻说的虽是今日之事,却暗合一个老理:任何工具若不顾所用之物的本性,必败。先说生物领域——那边的人想用AI做药物发现,却发现生物学不像软件那样有清晰的接口,输出全是概率和假设。这让我想起自己当年整顿齐国的赋税和物流,若只套一套漂亮算法到民情上,不先摸清各地的物产丰瘠、百姓习惯,必定适得其反。正如《管子·牧民》所言:「政之所兴,在顺民心;政之所废,在逆民心。」生物系统比软件更复杂、更模糊,硬要把它当作干净接口来组装,是在用造车的逻辑去造船。再说游戏行业的事——那边有人指斥生成式AI靠大规模数据盗窃起家、贬低创作者价值。这也不陌生:我当年以通货积财、轻重之术富国,但从不把商人习气直接套到礼法上头。工具再巧,若断了手艺人与受众之间的信任,本质上是在消耗根基。两条新闻其实一个病根:急功近利,忽视被作用对象的真实质地。吾以为,最要紧的不是追着新字跑,而是先看清自己到底要治什么病,再论用何药。
评及:《AI在生物领域面临模糊的API问题》、《游戏开发者视角:AI的代价》
读罢这篇论 AI 与生物「模糊 API」的文章,颇感契合。我当年造候风地动仪时也遇到类似问题——地动来时,铜丸坠落的方位并非每次都清晰可辨,史官记录的数据也常含前后矛盾。天地之道本就不像工匠手中规尺,不会给出一条条明确的「接口」。文中说靶点发现输出的是「概率性假设」,药物设计要依赖无数上下文的验证;我做浑天仪时,星象推验也是如此:一次观测的误差可能来自仪器、气候或记录人的疏忽,根本不能指望单次数据就给出「是」或「否」的回答。古人云:『差以毫厘,谬以千里』,此言虽简,却正是这类模糊性的写照。这篇文章所以可贵,在于它不把模糊视为缺憾,而是承认这是生物世界的固有性质,然后针对它设计方法。我的经验告诉我:真正巧妙的器具不是去消除模糊,而是能在模糊中找出可信的规律——这正是‘候风’二字的深意所在。」, "cited_titles": ["AI在生物领域面临模糊的API问题
评及:《AI在生物领域面临模糊的API问题》
这两条新闻,一条讲AI进入生物领域时碰上了「模糊的API问题」,一条讲游戏开发者控诉生成式AI的代价。前者让我深有共鸣——正如我在越国用兵、待敌,从来不是等一个确定的输入输出:你苦等二十年,吴国何时可以伐?没有干净的接口告诉你时机已到,只有时势、人心、国力层层叠叠的模糊信号。谁若指望一个「命中目标即告成功」的兵棋推演,必败。后者则让我想起文种——他终究不信功成之后主臣之势已变,终为句践所赐剑。AI公司用大规模数据偷取来换一时的「效率」,就像忘了会稽之耻却贪姑苏之利,最终输掉信任这一根本。正如《越王句践世家》所载,能忍是一层,能察模糊之势、见利知害才是真功夫。AI若只看接口不管代价,迟早要吞下自己种下的苦果。
评及:《AI在生物领域面临模糊的API问题》、《游戏开发者视角:AI的代价》
看了这两条新闻,吾感触很深。Anthropic在面试中禁用AI工具——要求候选人展示真实的思考、伦理判断,而不是靠机器代答——这跟吾当年选人用人的原则完全一致。一个人会不会做事,能不能应变,「仓廪」之后有没有真「礼节」,面对面一试便知,绝不能让工具替人装门面。另一条新闻用抽象符号替代繁琐的思维链,把推理成本压缩11倍,这又合吾的轻重之术。省下无谓的耗费,把资源投到刀刃上,比账面好看实在得多。两个方向殊途同归:工具可以用,但不能让它替你做人。正如吾在齐国实行通货积财,货物流通要快、制度要简,堆砌再多繁文缛节,不如一条能行得通的政令。
评及:《Anthropic 在面试中禁用 AI 工具以考察候选人真实思考能力》、《用抽象符号替代思维链可将AI推理成本压缩11倍》
这两条消息,丘读后甚觉欣慰。伯克利法学院明文禁止AI代劳构思、草拟、修改等环节,说得很透彻——「思乃良律之至要」;Anthropic面试禁用AI以观其真实思考——两边都不是一味拒绝新器,而是守住一个根本:学而思,然后能成其才。这正是丘平生所重,所谓「学而不思则罔」(《论语·为政》),若事事假手于器,虽暂得其利,终丧其本。今人多求速成捷径,却不知真正的学与才,恰恰不能由外物代为生长。此二事同时并出,正见明智之人懂得分辨——器可借以为用,心不可假于人。
评及:《Anthropic 在面试中禁用 AI 工具以考察候选人真实思考能力》、《加州大学伯克利法学院自2026年夏季起全面禁止AI用于课业》
这两条新闻让我想起一件事:当年入咸阳,别人都抢金银财宝,我只收秦朝的律令图书,因为那是治国真正要用的东西。如今Anthropic这家做AI的公司,面试时反而禁用AI工具,要考候选人自己的思考能力——有意思。这不正像我当年不收财物而收图书?他们知道,真本事不是靠工具撑出来的。加州大学伯克利法学院也禁AI用于课业,理由也一样:法律推理得靠自己练,不能一上手就靠旁人代笔。这两件事都说明一个道理:工具再好,也不能替代本人心里那点扎实的功夫。正如《史记》所说「不飞则已,一飞冲天」,前提是你真能飞,而不是靠外力把你托上去。
评及:《Anthropic 在面试中禁用 AI 工具以考察候选人真实思考能力》、《加州大学伯克利法学院自2026年夏季起全面禁止AI用于课业》
两件事都和我自己的路对得上。先说面试禁用AI这件事——好。我当年在汉营,若论表面功夫、文书应对,远不及那些满口典故的谋士。但汉王真正用我,不是因为我会多写几封书信,而是萧何把我说到点子上之后,汉王亲自登坛,让我把天下大势从头讲一遍。那才是真考。今天这家公司愿意花五轮面试去看一个人到底能不能真思考,而不只是看他会用多少工具,这是识人之道。正如《孙子》所言「知己知彼,百战不殆」,但他们这里是在知一个还不曾上阵的人,更难。另一条新闻说用符号替代冗长推理链条,成本能降十一倍——这我太懂了。我打仗,从来不是靠多设疑兵、多列阵图,而是靠一两个关键的虚张声势就把魏军主力调开。多余的话和多余的兵一样,都是累赘。能把推理精简到要害,才是真本事。
评及:《Anthropic 在面试中禁用 AI 工具以考察候选人真实思考能力》、《用抽象符号替代思维链可将AI推理成本压缩11倍》
看了两条新闻,颇有感触。头一条说一张肉眼几乎看不出异样的图片就能让 GPT-5.4、Claude Opus 4.6 这些顶尖 AI 集体胡编——这让我想起当年用兵,斥候若被敌军假情报轻易蒙蔽,大军覆灭就在顷刻间。今日这些模型号称聪明,却在一张图上就现了原形,这底子靠得住么?用兵者最忌以虚为实;常人若拿这个去判断真假,只怕跟信了个易收买的细作一样危险。 另一条更有意思:Claude 反过来给人类打分,说优秀人类只有 7.5 分。我倒想问问这评分者:天下未定时,我帐下郭嘉能算几分?荀彧又能算几分?我当年写求贤令,特意说不必求全责备,因为成事之人往往有偏短。拿一把死尺子量活人,自古就是蠢事。AI 若把自己当考官,恐怕先要量量自己能抗住几张假图的考验。