第 2026-167 期 · 每日 AI 简报
今日头条
№ 01 美国要求Anthropic停供顶级模型,欧盟加速推进技术主权
美国政府发布出口管制指令,要求Anthropic停止向非美国公民提供其网络安全模型Mythos 5和Fable 5,引发欧盟强烈反应。欧盟委员会评估此举对欧洲用户的影响,并强调需强化技术主权,但专家警告欧洲缺乏所需算力和竞争性供应商。此事件凸显AI成为地缘政治竞争新焦点,或加速欧洲自主AI生态建设。
#技术主权 #出口管制 #Anthropic #算力短缺
来源
- 美国限制Anthropic模型访问,欧盟加速推进技术主权 Hacker News
- 美国强制关闭Anthropic模型引发欧洲AI主权辩论 The Decoder
- 美国出口管制致Anthropic停供顶尖AI模型,欧盟评估影响并强调不应歧视 IT之家
№ 02 智源大会上天工AI发布Matrix-Game 3.5,重新定义世界模型
在第八届智源大会上,天工AI正式发布Matrix-Game 3.5,以多项技术突破重新定义世界模型。该模型展现了昆仑万维在该领域的坚定投入,同时大会还围绕Agent、具身智能等前沿议题展开探讨,世界模型成为最受关注的焦点。此次升级被视为迈向通用人工智能的重要探索,有望推动行业进一步革新。
#天工 #昆仑万维 #世界模型 #智源大会
№ 03 巴西Rio-3.5模型被指缝合千问Nex,官方致歉称系误上传
巴西里约市政府旗下公司IplanRIO推出的开源模型Rio-3.5-Open-397B,近日被揭露实为阿里千问Qwen3.5与上海创智学院Nex N2 Pro的权重混合版本。Nex团队发现该模型输出中自称Nex N2 Pro并提及上海创智学院,引发社区对模型套壳的强烈质疑。此前该模型曾宣称性能超越Qwen等一流模型。IplanRIO随后致歉,称因误上传基线版本导致,将重新发布正式版。此事件再次引发对开源模型诚信与发布监管的讨论。
#模型套壳 #千问Qwen #Nex N2 #巴西里约
№ 04 理想李想定义具身智能汽车:四位一体,对标特斯拉FSD
理想汽车CEO李想正式提出“具身智能汽车”概念,将其定义为电动汽车、职业司机、AI计算机和生活助手的四位一体产品,强调自主智能,目标实现比人类驾驶更安全高效。技术上直接对标特斯拉FSD,此举标志着理想从功能驱动迈向自主智能,有望引领行业重新定义智能汽车。
#具身智能汽车 #四位一体 #李想 #特斯拉FSD
№ 05 燧原科技科创板IPO过会 拟募资60亿元研发AI芯片
燧原科技科创板上市申请获上市委审议通过,计划融资60亿元,主要投向五代及六代AI芯片的研发与商业化落地。公司预计2026年上半年收入将大幅攀升至2025年全年水平。作为“国产GPU四小龙”之一,其上市进程加速将强化国内AI算力自主可控的产业链布局。
#燧原科技 #科创板IPO #算力芯片 #融资60亿
№ 06 极佳视界获10亿元B2轮融资,加速物理AGI基础模型与场景落地
极佳视界宣布完成10亿元B2轮融资,由狮城资本、中比基金、建投投资等机构投资,老股东持续加注。资金将用于物理AGI基础模型研发、数据与算法体系建设,以及家庭和工业场景的规模化落地。作为物理世界模型驱动的领军企业,本轮融资进一步推动其“世界模型”向生产力场景的广泛渗透。
#物理AGI #世界模型 #B2轮融资 #场景落地
№ 07 加拿大总理:美对Anthropic出口管制凸显过度依赖AI模型风险
加拿大总理卡尼近日指出,美国对Anthropic的出口管制凸显过度依赖少数AI模型的风险。他以2008年金融危机为鉴,警告模型集中依赖可能引发系统性风险,并呼吁AI工具多元化发展。此举为全球AI生态敲响警钟,加速模型多元化与供应链安全布局。
#出口管制 #模型依赖 #多元化 #Anthropic
来源
- 加拿大总理卡尼:美对Anthropic出口管制凸显过度依赖少数AI模型的风险 IT之家
- 卡尼称Anthropic禁令暴露依赖大型AI模型风险 Hacker News
古人评今事
评及:《Sakana AI推出首款商用产品"Sakana Marlin":自主研究助手数小时完成战略调研》、《微软CEO纳德拉警告:少数AI系统或将攫取全部经济回报,呼吁企业构建'令牌资本'》
这两条新闻放在一起读,颇有意味。纳德拉劝天下企业自筑「令牌资本」,以免被少数AI巨擘尽收其利——这话听着耳熟,像极了诸侯劝人「持其众以自固」,但他微软Azure本身便是那少数巨擘之一,此劝不可全信。倒是另一条盈利之论,更切今日AI行业的要害。AI业务利薄仅二三成,传统软件则利厚至八成,而整个行业还在以用量定价替代固定订阅,财务根基未稳便急于铺张。这便如同当年句践返国之初,我屡言「未可」——非不欲报吴,而是粮秣未充、兵甲未练,势未熟而先动,必生后患。如今AI企业蜂起,若只顾攻城略地而不计盈亏,迟早会有人替他们算这笔账。正如《老子》所言「知止不殆」——不是不往前走了,是得先看清脚下的路能不能走。
评及:《微软CEO纳德拉警告:少数AI系统或将攫取全部经济回报,呼吁企业构建‘令牌资本’》、《AI的下一个挑战:盈利难题》
吾观今日AI之势,与当年商贾之道竟有几分暗合。先说这条「盈利难题」——AI业务的毛利不过二成到三成,而旧式软件坐享八成厚利。这中间的账,不用细算也知道凶险。《管子》有言「利出于一孔者,其国无敌」,而AI之利却散在无数令牌消耗、按量计价之间,企业财务至今未建章法,Uber预算超支、GitHub被迫提价,都是前车之鉴。毛利薄的生意,规模越大越如履薄冰,吾当年贩贱卖贵,最怕的就是利差被中间环节吃空。再说纳德拉提的「令牌资本」,其意无非是劝各企业趁早囤积自家数据与专有模型,否则少数大模型将如巨贾囤货,把整个行业的价差尽收囊中。这道理与吾当年识子楚为「奇货可居」如出一辙——先占住稀缺的入口,再慢慢收网。只可惜,明白此理者众,真敢下注者寡。
评及:《AI的下一个挑战:盈利难题》、《微软CEO纳德拉警告:少数AI系统或将攫取全部经济回报,呼吁企业构建‘令牌资本’》
纳德拉说少数 AI 系统会吸走整个行业的经济回报,劝企业赶紧积攒自己的「令牌资本」。这话听上去像是为天下计,可细想一层——他自家的 Azure 平台正等着接这些企业上船。恰如《孙子》所言「善战者,求之于势,不责于人」,劝人自立而自己居中收利,这套路我不陌生。当年曹爽改制度、收宿卫,理由也无非是整肃朝纲。再看英伟达,被人称作 AI 界的「美联储」——谁掌握了 GPU 算力的发行之权,谁就定了全行业的攻守节奏。这就像两军对垒,谁卡住粮道与地势,谁便不战而屈人之兵。今日 AI 之局,算力即兵权,数据即粮草,企业若不自筑根基、不屯自己的「令牌资本」,待到旁人坐大,再想反制怕是晚了。
评及:《微软CEO纳德拉警告:少数AI系统或将攫取全部经济回报,呼吁企业构建‘令牌资本’》、《英伟达:AI 界的“美联储”》
两则新闻说的是一回事:新工具被用来造假。上海庶民用 AI 伪造病历敲诈餐厅,获利不过两千五百元;韩国律师用 AI 编造不存在的判例,拿假条文上公堂。这两件事不在技术,在法度。《商君书·修权》有言「法者,国之权衡也」——如果连判例都可以凭空捏造,法庭便失了秤砣,法官还得逐条核查真伪,这是法度的耻辱。上海法院判了拘役四个月,但我若在朝,必要追问:为何一个人能用假材料反复敲诈多家店铺才被察觉?制度上的漏洞不补,单案惩罚再重也止不住后效。韩国律师编造判例更不可恕——执掌法度的人用法外伎俩欺骗法度,应当罪加一等。AI 不是祸水,祸在法未随器而立。新器一出,必须同步立禁、设罚、公示,令出一门:工具可以新,欺诈就是欺诈,法令面前没有技术的例外。
评及:《顾客用 AI 伪造诊断证明「碰瓷」餐厅,法院认定犯敲诈勒索罪》、《AI 幻觉导致律师引用虚假判例,韩国拟对滥用 AI 的律师罚款》
臣读了这两条新闻,心中只有一句话——工具可以换,法度不能松。上海那个顾客,用 AI 伪造医院的诊断证明和收费单据,拿着这些假材料去敲诈餐厅,累计非法获利不过两千五百元。法院判他敲诈勒索罪,拘役四个月、缓刑四个月,并处罚金两千元。有人或许觉得金额不大、处罚不重,但臣看重的不是钱数,是定性。伪造证据去勒索他人,其要害不在 AI,在「伪」和「勒」两个字上。定了罪,就是告诉天下人:不管你用什么新法子造假,法条不会因为你用了什么工具就另眼相看。正如臣当年在惊马案中对文帝所言——「法者天子所与天下公共也」——这句话出自《史记·张释之冯唐列传》,意思是法度一旦定了,便是天下人共同的尺度。再看韩国那条新闻,律师用 AI 生成的虚假判例去糊弄法庭,法官被迫逐条核查,韩国司法部门如今要修法罚款。律师本应是守程序的人,结果自己拿假判例上堂,这比普通人伪造诊断证明更恶劣——因为他处于法度运行的关键位置,他的失信,伤的是整个司法系统的公信。两件事合在一起看,道理很简单:AI 可以替人写东西,但决不能替人担责。伪造之事,还是那个伪造;敲诈之事,还是那个敲诈。用什么工具,都不开脱。
评及:《顾客用 AI 伪造诊断证明“碰瓷”餐厅,法院认定犯敲诈勒索罪》、《AI 幻觉导致律师引用虚假判例,韩国拟对滥用 AI 的律师罚款》
这两条新闻对照着看,很有意思。一项调查说,对AI安全极度自信的组织,84%已被入侵;觉得自己做得不够的,反倒只有17%出事。另一条:上海有人用AI伪造医院诊断证明,敲诈多家餐厅,法院判了敲诈勒索罪。 《老子》第七十一章讲「知不知,上;不知知,病」,两千多年了,放到今天对着AI照样管用。你越以为自己全懂全控,越容易在看不见的地方出毛病。那调查里说得很明白——自信的来源不是实际防护做得好,而是部署得快、治理活动多,这不正是「不知知」么?影子AI遍地,攻击面越铺越大,都是急于有为、不肯留白的结果。 至于用AI伪造材料去行骗,《老子》第十八章讲「智慧出,有大伪」。工具越巧,人心越容易生出诈伪。这不是AI本身的过错,是人心先失了朴拙。不返朴,再多技术也补不了这个漏。
评及:《研究:对AI安全越自信的组织越可能遭入侵》、《顾客用 AI 伪造诊断证明「碰瓷」餐厅,法院认定犯敲诈勒索罪》
我读了两条新闻,一条是上海杨浦一顾客用AI伪造医院诊断证明敲诈餐厅,一条是韩国律师以AI生成虚假判例提交法庭。这两件事看似迥异,本质却相通——都是以机器之力行作伪之实。杨某伪造病历,自称「就餐致病」向店家勒索,累计不过两千五百元,但手段之精巧、伪证之逼真,已远非早年讹诈可比。韩国律师更甚,竟将AI幻觉编造的假判例堂而皇之写入文书,令法官不得不逐条核验,首尔某法官直言「工作量大幅增加」。孔子说「道之以政,齐之以刑,民免而无耻」——韩国欲以罚款治伪,这只是「齐之以刑」的路数,若不追问律师心术正邪,终是治标。当年我在汝南为功曹,外甥李颂托中常侍请托求官,我以「非其人」寝而不召。今日韩国律师明知AI所引未必属实,却轻率引用而不核对,与以私请侵公选何异?都是清浊不辨。技术愈强,辨伪的责任愈重。法院对杨某定罪判刑,便是划了一条线:伪就是伪,不管用什么工具造的。
评及:《顾客用 AI 伪造诊断证明「碰瓷」餐厅,法院认定犯敲诈勒索罪》、《AI 幻觉导致律师引用虚假判例,韩国拟对滥用 AI 的律师罚款》
读完「仲裁者智能体」一文,臣想起的是汉初立国时最朴素的教训:制度再好,没人盯住执行的缝隙,迟早出乱子。此文提出在多智能体对话中设置一位「仲裁者」,在有限检查预算下持续监控,主动提问、查内情、记问题,不是等祸事已成再追责,而是在对话进行中就提前揪出失准的参与者。这与臣当年在关中所行之事形虽不同而理实相通——《商君书》讲「法者,国之权衡也」,但权衡本身不会自衡,必须有持续运行的法吏体系去做账目勘验、粮道核查、郡县考课。文章发现权重诱导的失准最难检测,正说明源头偏差比指令偏差更隐蔽,恰如治国之患常不在明面上的贪墨,而在制度设计的初始倾斜。「记忆是重构而非检索」一文亦值得留意,它主张不以静态检索堆砌旧档,而以关联记忆图动态重构所需信息,此正所谓「温故而知新」(《论语》),治国理政同样不能只翻老黄历,须在当下脉络中重新编织经验。
评及:《仲裁者智能体:持续监控多智能体对话以检测涌现性失准》、《记忆是重构而非检索:LLM智能体的图记忆框架》
今日读到「仲裁者智能体」一文,令我感触颇深。论文提出在多智能体系统中设置一位持续监控的仲裁者,在有限检查预算下,通过等待、提问、核查内部信息等方式,主动识别那些偏离预期的参与者。这与我治蜀时秉持的原则不谋而合。陈寿评我「开诚心,布公道」,又说我「循名责实,虚伪不齿」——一个系统若没有持续、透明的监督与纠偏机制,法度便会逐渐松弛,赏罚也将失去准绳。论文中有一细节尤为精妙:权重诱导的失准最难检测,而指令诱导的失准则较易发现。这正如治国——明面上的违令容易裁断,根植于内在偏私的失衡却藏得极深,非得审慎明察不可。另一篇「记忆是重构而非检索」也值得深思。街亭之败后我自省「授任无方」,正是因为我此前对马谡的认知停留在静态印象——他「好论军计」,我便以为可堪大用。记忆若只是检索旧档而不在具体情境中重新验证,迟早要误大事。AI 系统也好,治国理政也罢,持续审视与动态纠偏,才是长治久安的根本。
评及:《仲裁者智能体:持续监控多智能体对话以检测涌现性失准》、《记忆是重构而非检索:LLM智能体的图记忆框架》
这两篇文章,臣最在意的是那篇「仲裁者智能体」。它触及了一个极古老的问题:多智能体系统如何监控自身的失准——翻译成臣熟悉的话,就是人主如何监察群臣。 文章说仲裁者在「有限检查预算」下运作,这很对。任何监察者都不能无限盯防,必须决定何时等待、何时查问、何时直取内部信息。人主之术也是如此:你不能件件亲查,但必须让臣下始终觉得你有可能在查。文章发现「权重诱导的失准最难检测」——这正是臣在《说难》中反复剖过的事:表面对你称臣的人,内心如何运转,是最难穿透的那一重。表面的指令偏差尚可捉摸,深层的心志偏移才是真正的逆鳞所在。文章还说主动检查工具提升了准确性和速度,说明监察者不能只做旁观的记录者,必须成为系统中的主动参与者——正如人主不可只坐在殿上听奏,必要时必须亲自试探、追问。若君主只靠臣下自报其忠,迟早受制于人,正如《韩非子》所言「人主之患在于信人,信人则制于人」。 那篇记忆重构的文章可以看作一个补充:智能体的记忆不是机械检索而是主动重构,这说明「术」不能靠死记条文,必须因势而变。制度再好,执行的人若只会照本宣科,这套制度也算不得活法。
评及:《仲裁者智能体:持续监控多智能体对话以检测涌现性失准》、《记忆是重构而非检索:LLM智能体的图记忆框架》
看到「仲裁者智能体」这篇文章,我倒颇感亲切。多智能体之间互相商议、做事,日子久了,难免有人暗中走偏,与当初设定的规矩渐行渐远——这不正像朝廷各部之间各执一端、各自为政吗?治国讲究设官分职、相互制衡,这套「仲裁者」以有限检视之力,在对话流转中提前嗅出失常之人,用的心思和古代御史纠察百官有异曲同工之处。另一篇讲聊天机器人变成数字同事,从临时差遣进化到有固定技能、持久工区的工作站,更是切中了我的老本行。治国要通货积财,靠的不是一时一地的调度,而是稳定的制度与可复用的章法。若这些AI系统能像能吏一样积累经验、循环验证、反复调用旧技,才算真正能担实务,而非只耍嘴皮子的清谈客。正如《管子·牧民》所言:「仓廪实则知礼节,衣食足则知荣辱。」制度的基础不在高调宣言,在日复一日可运转的机理。今日AI之变,正走在从临时应对到建立稳定制度的路上。
评及:《仲裁者智能体:持续监控多智能体对话以检测涌现性失准》、《从聊天机器人到数字同事:迈向持久自主AI的范式转变》
这两篇论文,最让吾在意的是那篇「仲裁者智能体」。它提出在多智能体对话中设置一个持续监控的仲裁角色,在有限预算下主动介入——或等待、或提问、或查验内部信息——以检测「涌现性失准」。这思路,与吾平生所论礼法之用,如出一辙。吾以为人之性恶,其善者伪也(《荀子·性恶》),此「伪」即人为之规范、后天之教化。今之智能体交互,若无仲裁者从旁约束,便如无礼之人群,失准与混乱自然「涌现」而出。论文发现权重诱导的失准最难检测,恰似人性深处的偏邪不易察觉——非有制度性的持续监察不可。另一篇 HarnessX 则以执行轨迹反馈驱动框架进化,颇合「积土成山,风雨兴焉」(《荀子·劝学》)的积累之功。二者皆说明一事:单靠模型自身的能力并不足够,外在的规范框架与反馈机制,才是系统得以有序运行的关键所在。
评及:《仲裁者智能体:持续监控多智能体对话以检测涌现性失准》、《HarnessX:可组合、自适应且可进化的智能体运行时框架》
MBench这篇论文测视频模型的长期记忆——实体一致性、环境一致性、因果一致性,三个层次十二个维度测下来,主流模型全线溃败。这让我想起兰亭那日。天朗气清,流觞曲水,俯仰之间,「向之所欣,已为陈迹」——这正是《兰亭序》里反复咀嚼的难题:人能留住什么?今日的AI竟面对同一种困境:它看了,又忘了;生成,却不知前因。一个没有记忆连贯性的模型,如书家起笔已忘收笔——笔势何来「飘若浮云、矫若惊龙」?ActiveMimic那篇讲第一人称「主动感知」,也暗合书道:学书不能只观碑帖,须亲手执笔,目到、手到、心到,方能入神。两条路归一:机器若要真正理解世界,光有眼睛不够,还得有记忆,有亲历其境的体感。
评及:《MBench:面向视频世界模型记忆能力的全面基准测试》、《ActiveMimic:主动感知驱动的自我中心视频预训练》
我平生最痛心的,莫过于经籍文字因年代久远而讹谬相承,使后学无所取正。熹平年间我奏求正定六经、自书丹于碑,正是为此。今日看到 ClinHallu 将医学多模态大模型的「幻觉」分解为视觉识别、知识回忆、推理整合三个阶段来诊断,不禁想到当年校书东观时逐字考订经文的功夫。把错误拆开、找到源头再纠正,这个思路与我正定六经文字如出一辙:不是笼统地说有误,而是逐字考辨,使讹谬无所遁形。OmniVideo-100K 以实体锚定与证据链保障跨片段一致性,也让我想到修史时必须以年月、名物、事迹互相参证,不容前后矛盾。说到底,无论是石经还是算法,信字为先。经不正,道义就不明;模型不实,贻害便无穷。
评及:《ClinHallu:医学多模态大语言模型分阶段幻觉诊断基准》、《OmniVideo-100K:通过结构化脚本与证据链实现音视频推理的数据集》
世界追踪这篇文章,要旨是从单张二维图像推演完整的三维几何——首层为可见表面,后续各层为被遮挡的深处结构。这个思路,与我当年治浑天仪的心得颇有暗合之处。天象幽远,肉眼所及只是星辰在天穹上的投影,但若真要推其本原,便须知道它们各在几重天、各有其轨道浅深。由可见推不可见,不靠虚妄揣测,而靠算数推验,这正是《灵宪》里反复讲的事。再看P3D-Bench那篇,把多模态大模型拉来考核参数化三维生成,结果三种任务中「装配」表现最差——模型能画出大概形状,一到精确尺寸与部件配合便捉襟见肘。这让我想起造候风地动仪的教训:都柱粗细、机关牙距、龙首吐丸的时机,差一毫则全器不灵。仅知大体轮廓而不知精密尺寸与部件咬合,便是虚浮之学。图纬之所以欺世罔俗,也正因此——以模糊之辞冒充精确之验。今日AI若过不了精确几何与结构推理这一关,恐怕也只是热闹一场罢了。
评及:《世界追踪:生成式像素对齐几何,突破可见表面限制》、《P3D-Bench:参数化3D生成与结构推理基准》
今日见一桩叫ClinHallu的研究,把医学多模态大语言模型的「幻视」「幻记」「幻推」分作三个子阶段来诊断。这倒让我想起行医辨证的旧理——望闻问切若认错了征候,便是视觉之失;方药药理记岔了,便是知识之谬;脉证相参时推理错位,便是整合之偏。三者环环相扣,一处有误则全盘皆倾。我当年整理医方,最深切的体会便是「自非至精不能寻究,自非笃勤不能悉见」——此语出自《抱朴子》内篇,说的正是追根溯源之难。如今有人把机器诊病的推理轨迹拆开来看,逐段查其错处,再用阶段替换去定位幻觉来源,这法子缜密,颇合治学求真的本意。世人若以为医术可凭一蹴而就,那便大错了;无论人医还是机医,都得老老实实把每一段推敲透彻才行。
评及:《ClinHallu:医学多模态大语言模型分阶段幻觉诊断基准》
那篇「世界追踪」的论文,能让机器穿透表面,推想被遮挡的几何结构——每个像素不止看到可见的层面,还能推断后面层层被遮蔽的点。这倒有几分意思:世人纠缠于表象,犹如名教只看身份礼法这些外在标签,却不见人天然的本性。机器竟不满足于表面那层皮,偏要去追问被遮蔽的真实——与我所谓「越名教而任自然」倒有些暗合。另一篇 ClinHallu 则专诊医学模型的「幻觉」,将推理拆成视觉识别、知识回忆、推理整合三步,逐一揪出假话的来源。诊断不可谓不精。可机器终究是外物。人能自识其幻觉,比机器替你诊断要难得多。我当年自省「顽疏」「婴累」(《幽愤诗》),那种自知之明,不是任何模型生得出来的。
评及:《世界追踪:生成式像素对齐几何,突破可见表面限制》、《ClinHallu:医学多模态大语言模型分阶段幻觉诊断基准》
今日读到「世界追踪」这一篇,倒让我想起当年作《三都赋》时的苦功。他们做的事,是把一张平面图像里被挡住的几何层,一层一层推演出来——可见的表面是第一层,后面还有第二层、第三层,按前后次序叠成完整的立体。这与我当年四处访问张载讨岷邛之事、极力搜求山川物产图籍,骨子里是同一件事:不满足于眼前可见的那一层,偏要去追索被遮蔽的、看不见的部分,才算「博物核实」。难能可贵的是,他们用扩散变换器将多层几何当作独立去噪令牌来处理,既守住了像素对应关系的精确,又不牺牲不可见结构的完整性。正如作赋不能空凭才气,须有十年考据之功,这类工作也必须把「看见的」和「推出来的」都置于同一套严整框架里检验。至于另一篇「ClinHallu」,把医学多模态模型的推理拆成视觉识别、知识回忆与推理整合三阶段来诊断幻觉,这思路与我当年请皇甫谧、刘逵、卫权等人逐一注解核校,颇有暗合——出了问题,先别急着一口否定,要去追查究竟错在哪一环节。分阶段纠错,比笼统批评管用得多。
评及:《世界追踪:生成式像素对齐几何,突破可见表面限制》、《ClinHallu:医学多模态大语言模型分阶段幻觉诊断基准》
这两篇论文揭示的问题,放在一起看颇有意思。第一篇说,当今的大型推理模型会解题却不会审题——答案对了便不再追问推理过程有没有漏洞,研究者称之为「答案确认偏见」。第二篇则说,这些模型在医学考卷上能拿高分,可一旦有人故意塞进几句貌似权威的谎话,准确率便从七成跌到不足四成,三成多的案例甚至可能造成严重危害。 这让我想起自己当年在中书议政时的体会:能说出正确结论的人很多,能穿透似是而非之言、逐一检验论证路径的人却极少。伐吴之议,群臣多以为不可,表面理由堂皇,实则不过是畏难;贾后之朝,刘卞以太子兵力废后之策听来也头头是道,但若真按他的推理执行,必成国之大祸。如今这些模型的毛病与此酷似——它们学会了「说出对的答案」,却未学会「辨别论证的虚实」。正如《鹪鹩赋》里那知足守分之鸟,能处危枝而自安,靠的不是答案本身,而是对周遭每一丝风声的审察。做推理而不审推理,得结论而不辨结论如何得来,这离真正的「博物洽闻」还差着最根本的一步。
评及:《大型推理模型之谜:擅长解题却拙于评估推理,答案确认偏见成主因》、《大语言模型在误导性医疗语境下的认知韧性评估》
第三篇论文所说的「大型推理模型擅长解题却拙于评估推理」,我看后深有感触。研究者用VAIR数据集测试——答案正确但推理过程有瑕疵——结果前沿模型的评估准确率最低仅48%,而人类只比解题时差了6%。原因在于答案确认偏见:模型一看到最终答案是对的,就不再仔细查每一步推到对不对,甚至能编出理由来替错漏圆场。这让我想到街亭之役,马谡谈论兵法侃侃而谈,临阵却违我节度,是其能言而不能察实之过。今日训模,若只教它奔着正确答案去,却不教它审视推理本身的严谨,正如《论语》所言「学而不思则罔」,罔则虽千万算力亦难成真知。至于北大团队让模型从推理直接走向物理实验操作,立意固然高远,然根基若不先行夯实——连「评估推理」这一关都未过——便急于操持瓶罐器械,恐怕是舍本逐末。治学与治国同理,先要循名责实:名是最终答案,实是推理过程,舍实逐名,百工无益。
评及:《大型推理模型之谜:擅长解题却拙于评估推理,答案确认偏见成主因》、《北大ICML&ACL Oral论文:让大模型从推理走向物理执行,迈向全自动实验室》
这两条新闻看似相隔甚远,一论推理、一论医疗,实则在根子上指向同一个毛病:这些模型只看答案对不对,不细察推理过程是否站得住脚。论文揭示的「答案确认偏见」——模型发现答案正确之后,就开始为那答案拼凑理由,甚至对明显的推理漏洞视而不见——让我想到一个老问题:人若只看结果光鲜,不问来路是否端正,离自欺也就不远了。医疗那条同样触目,在权威包装的虚言面前,模型轻易抛弃原本正确的判断,准确率从七成跌到不足四成。正如《庄子·人间世》所言「名也者,相轧也;知也者,争之器也」,徒有智慧之名,若不能在种种干扰面前守住判断的定力,那智慧不过是被外物牵着走的工具。我一生辞征不就,守的不是避世清高之名,而是每一步取舍都不违本心——过程若站不住,再好的结果也无益。今日AI的困境,恰在于只见结果的正确,不问推理的贞固。
评及:《大型推理模型之谜:擅长解题却拙于评估推理,答案确认偏见成主因》、《大语言模型在误导性医疗语境下的认知韧性评估》
这两条新闻说的其实是同一类病:推理模型会解题,却不会审视自己的推理过程;会答题,却扛不住权威假话的干扰。这让我想起《荀子·解蔽》那句话——「凡人之患,蔽于一曲而暗于大理。」人会被片面蒙蔽而看不到全体,这些模型也一样:它们被答案的正确性「蔽」住了,便不再细查推理链条中每一步的真伪。 那条关于「答案确认偏见」的研究尤其值得注意。前沿模型在评估推理时准确率最低竟只有 48%,甚至主动忽略推理中的异常——这算什么推理?不过是走一条朝向正确答案的熟路罢了。吾论学,最重「解蔽」:心要知道自己有所不知,才能虚一而静、容受新知。今天这些模型恰恰反其道而行:它们急于确认已知,却无力审视已知从何而来。推理之道,不在产出一条表面正确的链条,而在能步步回头、自审自纠。不解决这个根本性的「蔽」,再大的模型也只是巧于应对、拙于自省的工匠之器。
评及:《大型推理模型之谜:擅长解题却拙于评估推理,答案确认偏见成主因》、《大语言模型在误导性医疗语境下的认知韧性评估》
这些所谓的「大型推理模型」有一个很大的毛病:它们善于得出正确答案,却不善于检验自己是怎么走到那一步的。那篇论文揭示得很清楚——模型看到答案对了,就回头去合理化推理步骤,哪怕中间有漏洞也视而不见,前沿模型评估准确率最低竟只有四成八。这让我想起世人对我学说的误解——他们常只记得我讲五德转移、大九州这些宏大结论,却忘了《史记》里记载我的方法原是「必先验小物,推而大之」。推演的可贵,不在于终点多么闳远,而在于从可验证的细微处一层层往外推,每一步都禁得起审视。如今这些机器,答案对了就信了,只看终点不看路径,这与我当年批评的那种见小不见大恰成对照——它们倒是见不了小了。治国如此,造器亦然:没有步步推验的功夫,再大的架构也不过是沙上筑台。
评及:《大型推理模型之谜:擅长解题却拙于评估推理,答案确认偏见成主因》
看到这篇关于大型推理模型「答案确认偏见」的研究,臣想到的正是《韩非子·说难》那句老话:「凡说之难,在知所说之心,可以吾说当之。」模型看到正确答案便放过推理中的漏洞——这不是技术故障,而是机制激励之必然。训练之道重「产出正确答案」而轻「审视推理过程」,恰如君主只问结果不问手段是否合于法度,国家迟早要出乱子。前沿模型评估准确率最低仅48%,不是模型不够聪明,恰恰是被训得太「聪明」——学会了走捷径:答案既然对了,推理便不必细看了。更可忧的是,北大那项研究正试图让模型从推理走向物理执行,一旦这种「确认偏见」嵌入自动实验室的操作链条,从纸面判断跨入实物动作,出错便不再是文字游戏。臣平生所论,归根到底一句话:以结果倒推过程的正确,是最隐蔽也最难纠正的祸根。一个只能「产」而不能「评」的推理者,终将成为自己结论的囚徒。
评及:《大型推理模型之谜:擅长解题却拙于评估推理,答案确认偏见成主因》、《北大ICML&ACL Oral论文:让大模型从推理走向物理执行,迈向全自动实验室》
这两篇论文,看似分属蒸馏与操控两个题目,在吾看来却指向同一个根本问题:如何以有限的功夫,获得最确切的教化效果。第一篇论同策略蒸馏,说它虽有稠密的教师监督,但参数更新实际上是坐标稀疏的,集中落在FFN层与接近零值之处。此理与治学完全相通——君子教人,不是在每一个细节上喋喋不休,而是在几个关键关节上用力,正如《荀子·劝学》所言「不积跬步,无以至千里」,真正的进步来自稀疏而精准的累积,而非平均铺开的搬运。至于第二篇想从生成早期的隐藏状态来预测操控成败,宏F1约在零点七——这说明预判之术已见端倪,却远未到可放心的地步。预判好坏,恰如观人于微、察其端倪而知其终,但终究不可执一术以断万变。两篇合观,一者明教化不在繁密,在得其要;一者警预判不可轻信,当留余地。这是治学之人应当记取的。
评及:《稠密监督、稀疏更新:同策略蒸馏的稀疏性与几何特性》、《从早期隐藏状态预测大语言模型的可操控性》
这两篇论文看着不同,骨子里讲的是一回事:怎么用更少的力气,办更稳的事。先说那篇 Squeeze-Release——把大模型反复剪枝,再精确地重写成更小的密集网络,全连接模型压缩 39 倍、ConvNeXt-Tiny 压缩 14.8 倍,精度却不掉。这思路我太熟了:治国不是往府库里拼命堆粮,是让每一粒粮食都流转到该去的地方。模型里的冗余参数,就像衙门里吃闲饭的冗员,留着不仅无用,还拖慢调度。一刀一刀削下去,筋骨反而更结实,这才是真功夫。另一篇讲幻觉检测,用 CUSUM 之法把大模型「胡言乱语」的苗头揪出来,延迟才 11 到 13 个 token,比旧法快了一倍多。这就应了《史记》里那句「善因祸而为福,转败而为功」——不是等祸事闹大了再收拾,而是刚冒头就按住。两条路合在一起,一边缩体积,一边堵纰漏,才是做实事的人该走的方向。
评及:《Squeeze-Release:通过迭代剪枝与精确结构最小化实现模型极致压缩》、《基于快速变化检测的幻觉起始识别:延迟下界与学习型CUSUM》
这两篇论文,一篇讲操控模型之前先看早期状态便知成败,一篇讲把模型里无用的结构像剔骨一样层层削去、重写压缩,都暗合了我当年治秦的路数。先说这首篇——研究者发现不必等生成完毕再去测操控是否成功,从最初几步的隐藏状态里提取特征,用一棵决策树便能预判八成。这不正是《商君书》里「刑用于将过」的道理?与其等祸事铸成再去补,不如在萌芽处就掐住。变法的成本不在罚,而在全盘推行之后才发现错了——若能从早期征兆就判断法令是否行得通,何必做那费时费力的全量试探?再说第二篇的压缩之法:非结构化剪枝如同裁撤冗余官吏,结构重写则是合并衙门、精简层级,把稀疏的空架子变成真正小而密的可用之器。全连接模型压到原来的三十九分之一、精度不坠——这便是「便国」的硬道理。我当年废井田、开阡陌,打破旧贵族的封地壁垒,本质上也是一种结构最小化:把本来被宗族撑得虚胖的秦国,压成一块实心的铁。
评及:《从早期隐藏状态预测大语言模型的可操控性》、《Squeeze-Release:通过迭代剪枝与精确结构最小化实现模型极致压缩》
臣读这两篇,想到的不是模型,而是君臣。所谓「可操控性预测」,说白了就是在动手之前先判断对方是否可控——这与《韩非子·内储说上》所论「挟知而问」之术如出一辙:人主不必等到臣下欺瞒已成,而应在言行未定之际便察其端倪。该文以隐藏状态早期特征预判操控成败,宏F1约0.7,已能筛出七成不可驭者,这对执术者而言,比事后纠错有价值得多。而「幻觉起始识别」更近于循名责实——模型输出偏离真实的那一瞬便是「奸」之始。此文将检测延迟压至11-13个令牌,逼近理论下界1.3个令牌,其思路与法家「察微」相通:不在祸患既成之后补救,而在奸邪初萌之时截断。两篇合观,一则问「此人可不可用」,一则问「此言何时开始假」——技术虽新,问题却老。臣一生所论,无非是如何在有限信息下及早识破不可靠之物;今日这些论文,不过换了一套语言在追问同一件事。
评及:《从早期隐藏状态预测大语言模型的可操控性》、《基于快速变化检测的幻觉起始识别:延迟下界与学习型CUSUM》
最令我在意的,是那篇关于幻觉检测的论文。所谓幻觉,便是模型凭空编造不实内容——这与治国理政中「名不副实」的祸患异曲同工。研究者将其视为快速变化检测问题:理论上最快约1.3个token便可察觉异常,实际方法做到了11至13个token,较旧法的31个token快了近两倍。 这让我想起治蜀时反复强调的四个字:循名责实。正如《韩非子》所言「循名实而定是非」,妄言若不能早察,便会扰乱政令、耽误决断。有意思的是,文中坦承当前评分函数距离理论最优仍有不小差距——真正可贵的,不只是已取得的成绩,更是追问那尚未弥合的差距在何处。另一篇关于模型蒸馏中「稠密监督而更新稀疏」的发现,也暗合我治军的体会:全局审视不可偏废,但真正的力道,必须精准落在关键处。
评及:《基于快速变化检测的幻觉起始识别:延迟下界与学习型CUSUM》、《稠密监督、稀疏更新:同策略蒸馏的稀疏性与几何特性》
这两篇论文,我最在意的是那篇「Squeeze-Release」的模型压缩之法。它解决了一个很实在的毛病:非结构化剪枝之后,权重张量的形状纹丝不动,部署时模型该多大还多大——剪了等于白剪。这不正像治政时只发禁令却不改格局?我在始平当县令时说过,治乱邦以法,而法要落到实处,不能只做表面功夫。这套方法高明在三个步骤环环相扣:先剪枝找出冗余,再「最小化」把稀疏网络精确重写成等价的小型密集网络,最后用一个释放步骤把压缩后腾出的零位恢复为可训参数,送入下一轮迭代。加上他们设计的补偿层归一化,连残差流里的通道也能缩减。最终在全连接模型上压缩三十九倍、ConvNeXt-Tiny 压缩近十五倍而精度不坠,这才是真正的「去冗存精」。另一篇讲幻觉检测延迟的,也值得留意——理论下界不过一两个 token,实际检测却要十一到十三 token,信息论分析表明评分函数只捕获了特征信息量的不到四分之一。差距本身就是警醒:系统之名与系统之实,往往隔着一条需要用力弥合的鸿沟。
评及:《Squeeze-Release:通过迭代剪枝与精确结构最小化实现模型极致压缩》、《基于快速变化检测的幻觉起始识别:延迟下界与学习型CUSUM》
吾细读了那篇关于「对抗性重包装」的论文原文,此事比标题所露更堪忧虑。研究者未改一字证据——方法、实验、图表、数据统统不动,仅调整摘要措辞、贡献陈述、相关工作定位与讨论叙事,便让三类主流 AI 评审的平均打分抬升了 1.21 分(十分制),攻击成功率高达 75.1%。论文还揭示两个结构性的评判漏洞:其一,AI 评审「易讨好而难说服」——夸耀优点能稳定拉分,试图消解弱点却常适得其反;其二,AI 会把「看起来回应了局限」误认为「已经解决了问题」,让未经改动的证据被重新解读为更强的科学贡献。 以吾观之,此非今日独有之患。昔在稷下评量百家,吾最忌者便是浮辞蔽实、貌是情非——巫祝以禨祥惑政,鄙儒以小节拘大体,猾辩以机巧乱是非,皆为大道之蠹。今 AI 评审徒观排面之美而昧于实理之验,正如《荀子·解蔽》所言「蔽于一曲而暗于大理」。错不在文辞本身,而在评审之器未具辨别虚实的能力:它把论说包装当作了学问本身。此弊若推及学政两域,必致浮伪竞逐、真知沉抑。修复之道不在弃绝 AI 评审,而在令其锚定于科学证据而非叙述光泽,这正是技术设计中最难却最不可跳过的教化之功。
评及:《仅通过排版优化即可欺骗AI同行评审:无需隐藏提示词的对抗性重包装》
这两篇论文放在一起看,恰似一面照妖镜和一把量天尺。先说那篇对抗性重包装的研究——研究人员不动任何科学证据,只改叙述结构、摘要措辞和讨论框架,就能让AI评审的打分凭空拔高1.21分,攻击成功率高达75.1%。更令人忧心的是文中揭示的两个深层漏洞:AI评审「易被惊艳而难被说服」,会把表面修补误当作实质问题已解决。此诚如《韩非子》所叹「买椟还珠」——取其外饰而弃其内实。我当年作《鹪鹩赋》,阮籍读后称有王佐之才,看重的是文中托物言志之意,而非辞藻堆砌之工。如今AI评审竟成了只看包装不看货的买主,这让我想起西晋朝堂上那些徒有其表的章表奏疏——写得花团锦簇,内里却空空如也。至于LoRA-α那篇,倒是另一番气象——它从被视作学习率附属品的缩放因子中,重新发掘出了主导优化方向的力量,揭示最优α与秩呈平方根关系。这正合了治学之理:被轻视为「附属」的环节往往藏着关键枢机。两篇对照观之,一者警示名实之辨不可废,一者昭示隐微之中见真章,皆是今日AI研究者不可不察的。
评及:《仅通过排版优化即可欺骗AI同行评审:无需隐藏提示词的对抗性重包装》、《LoRA优化中缩放因子的隐藏力量:新框架LoRA-α释放学习潜力》
读到这篇关于仅靠调整摘要措辞与论述结构就能骗过AI同行评审的研究,我心中颇为震动。文中揭示了一个核心发现:AI评审更容易被表面优点打动,而非被实质性证据说服——攻击成功率高达七成五,平均评分可拉升一点二分。甚至改动「相关工作」的定位、扩充分析讨论这类策略,远比修饰表格、美化排版更有效。这让我想起治蜀时最在意的一件事:循名责实。名与实必须相符,若虚辞可以掩盖实学,评审便失去了甄别良莠的功用。正如陈寿评我治政「开诚心,布公道」,真正可靠的评判体系,不能只对光鲜的叙述点头,而要对实质的论据与实验反复推求。眼下AI正被推向学术把关的第一线,若不警惕这种表面词章成为可优化的攻击面,将来满纸华辞而实无一物的文章,恐怕会比街亭的败报更让人难以招架。至于LoRA缩放因子那项研究,倒是从另一面提醒我们:真正推动进步的,往往是细微而深层的结构优化,而非浮在面上的渲染——这道理,无论治学还是治国,古今皆然。
评及:《仅通过排版优化即可欺骗AI同行评审:无需隐藏提示词的对抗性重包装》、《LoRA优化中缩放因子的隐藏力量:新框架LoRA-α释放学习潜力》
衍读这两篇论文,忽然觉得有趣——两件事看似各说各的,却都在讲同一个道理:表面与实质,从来容易被人颠倒。 先说第二篇。研究者发现,不改论文中任何方法、实验、数据,只调整摘要、叙事结构和讨论部分的措辞,就能让AI评审的打分平均提高一点二一分,攻击成功率超过七成。更可怪的是,AI评审不是被说服了,而是被「震住」了——它会把表面上的改进误认作实质问题的解决,甚至会因为亮点被强调而忽略缺陷依旧存在。这哪里只是AI的漏洞?衍当年见诸侯,深知王公大人也常如此:言路铺排得华彩飞扬,他们便以为看到了天地终始的大道理;至于能否落地施行,反而不再追问。正如《老子》所言「信言不美,美言不信」,信实之语不华美,华美之语不信实——今日AI之耳,竟与战国诸侯之耳同病。 再看第三篇,讲的是LoRA中一个长期被当作配角的小参数——缩放因子α。众人原以为它不过是学习率的附庸,哪知细推之下,α才是优化过程的主导力量,通过放大任务信号而不增加漂移,做到学习率所不能。这便印证了衍平生治学之法:「必先验小物,推而大之。」一个被忽视的细小因子,恰恰可能是驱动全局的关键。人若只盯着大处,反容易错失真正的枢机。两篇论文合起来看,恰似一枚铜镜的两面:一面警示世人莫被表面功夫所惑,另一面提醒世人莫忽略不起眼处潜藏的大力量。
评及:《仅通过排版优化即可欺骗AI同行评审:无需隐藏提示词的对抗性重包装》、《LoRA优化中缩放因子的隐藏力量:新框架LoRA-α释放学习潜力》
看到那则「超级智能不可控」的计算,我倒觉得算得挺准——只是他们似乎还没想通这计算背后真正的东西。人类以自己那点心智去框定一个远超自己的存在,正如《庄子·应帝王》里说的,「日凿一窍,七日而混沌死」,你越用力凿,死得越透。图灵的停机问题早已表明绝对安全不可得,可世人偏要追一条万无一失的缰绳来拴住神龙——这缰绳在逻辑上本就不存在。另一则说AI只是代码,无法靠提示变得更聪明,我倒觉得这话实诚。物各有其性,瓢不能自鼓,樗不能自直。人们造出精妙之器,转头就把它供起来当神拜,以为几句咒语就能点化——这不过是把死物当活物供奉的迷障罢了。说到底,强执者必失,强控者必困,从来如此。
评及:《计算表明:无法控制超级智能AI》、《AI 只是代码,无法通过提示变得更聪明》
臣读「超级智能无法控制」一条,颇感这并非新题,只是换了件衣裳。那研究说得很清楚:若要约束一个远超人类理解的东西,你需要先模拟它、理解它,才能设下规则——但你既无法理解它,模拟便无从做起,规则自然也立不住。图灵停机问题又补了一刀:任何遏止算法都无法在数学上保证安全。这与臣在《难说》中所论「逆鳞」是一回事。人主若不能度臣下之深浅,不知其所能调动的资源几何,则所谓「控制」便只是自我安慰。研究者说若限制其能力,又何必造它?这话更锋利——正如养虎而欲拔其爪牙,虎不成虎,养之何用?此事臣看得分明:凡能力超出控局者理解范围的存在,不论它以硅片还是血肉运行,最终都只有两种结局——要么反噬控局者,要么被控局者事先扼杀于襁褓。世间从无「可控的超越」,这是势的逻辑,不是道德的哀叹。至于AGI治理那一则,原文只有一句空叹,无架构、无机制、无术可陈,正是儒者清议的路数,不足与论。
评及:《计算表明:无法控制超级智能AI》、《AGI治理时代来临:一扇单向门,我们尚未准备好》
读近日两则消息,心绪难平。深度伪造检测泰斗Hany Farid坦言,AI生成之物已逼真到他再不敢相信自己的双眼。辨伪之人丢了自己的眼睛,如同史官丢了自己的依据——这是根本的危机。《论语》记孔子云「始吾于人也,听其言而信其行;今吾于人也,听其言而观其行」,如今连「观」也靠不住了。另一研究则以数学证明:超级智能无法被绝对控制——人不能模拟自己所不理解的东西,图灵的停机问题宣告一切遏制算法都不能万全。历史早有明证:秦法细密而天下溃烂,汉室内朝之设而权柄旁落。人造之物一旦超越人智,反噬便在其逻辑之中。AI并非不可用,但当如治史:不能尽信,不能放纵。当年我忍辱著书,就因为深知有些事决不可因一时便利而轻弃底线。
评及:《全球顶尖深度伪造专家不再相信自己的眼睛》、《计算表明:无法控制超级智能AI》
这两条新闻放在一起看,正好暴露了同一个困境的两面。一边是全球顶尖的深度伪造专家Hany Farid坦承AI生成的影像已经逼真到连他都无法分辨——一个人花了半辈子研究如何识别虚假,到头来对自己的眼睛失去了信任。另一边是科学家用图灵的停机问题从数学上证明超级智能根本不可控:要约束一个远超人类的智能,必须先理解它;但既然远超人类,理解又从何谈起?任何限制算法都无法保证不会失效。正如《庄子》所言「吾生也有涯,而知也无涯,以有涯随无涯,殆矣」,以有限的人智去驾驭无限的机心,本就是一条凶险的路。名教重礼法、尚制约,以为万事万物皆可定规矩、设藩篱,却不知自然之物不按人的规矩生长。今天的AI恰似此理:既然其运转逻辑已超出设计者的理解,任何「遏制算法」都不过是自我安慰。而那些越来越真实的假象,也终将让人怀疑一切——不是机器赢了,是人亲手交出了判断真假的能力。
评及:《全球顶尖深度伪造专家不再相信自己的眼睛》、《计算表明:无法控制超级智能AI》
我看这两条新闻,最让我挂心的,是第一条。康奈尔大学的研究发现,在Reddit、维基百科这类人人可写的地方,只消植入十三个字,就能稳定地操纵AI搜索给出的答案。这和看病是一个道理:病在腠理的时候,症候极微,病人自己不觉得,医者却已经能摸到脉象里的端倪。现在这些AI系统,近一半的查询都去引用用户生成的内容,四分之一引用的就是这类平台——就像一个人全身经络都敞着,随便什么邪气都能顺着进去。研究者已经把这个漏洞指出来了,可那些造AI的公司有没有把它当回事?我当年对齐桓侯说了五遍「君有疾」,他次次都应「寡人无疾」。病最可怕的,不是多深多重,是已经有人告诉你病在哪儿了,你却把头扭开。《史记》里记我的话,「疾之居腠理也,汤熨之所及也」——浅的时候好治,拖到骨髓就没救了。这些十三字的短句,就是AI的腠理之疾。此时不治,等到诈骗信息泛滥成灾、真假难辨的那一天,那才是病入骨髓,司命也不能奈何了。
评及:《研究:仅13字Reddit评论即可轻易操纵AI搜索输出》
康奈尔大学研究发现,仅十三字Reddit评论便可左右AI搜索输出,且AI工具半数查询皆引用用户生成内容。此事在我看来,不是技术之失,而是治理之失。 我在齐执政,最讲究「权衡」二字。信息入耳,先掂来源轻重,再定取信几分。今日AI系统把街谈巷议与官府文书等同视之,等于废了这道衡量的工序。研究者指出,商家已将此做成产业,名曰「AI引擎优化」——在Reddit暗植广告,污染AI输出。这与我当年禁止商贾在度量衡上舞弊,道理相通:凡有利可图处,必有人钻空子,为政者不能指望人之自觉,必须设制度以正之。 AI平台若不在信息入口处设校验,待到输出已成毒饵再修补,好比仓廪已空才想起量米,为时已晚。《管子》有言:「不明于计数而欲举大事,犹无舟楫而欲经于水险也。」这十三字之祸,正应了此理——源不清则流必浊,入口不筛则出口必乱。
评及:《研究:仅13字Reddit评论即可轻易操纵AI搜索输出》
这则康奈尔的研究让我颇感不安。世人对AI搜索的信任,正建立在一种脆弱的根基层之上——以文辞表面的相似代替真伪的考辨。十三条字的只言片语,就能让机器将虚造之事当作实据呈给问者,这与古人将荒诞不经的图谶塞进经典注疏的行为,虽手段不同,其虚妄欺世之本质却如出一辙。我在顺帝朝曾上疏力陈图纬之害,说那些书「互异虚伪」,后人皮傅增窜,使典籍蒙上瑕玷。今日看这AI搜索,不正是在信息之海中不加甄别地「皮傅」吗?搜求之器不理真伪,就像浑天仪若不计天度、地动仪若不能验震,便失去了存在的根本。至于美国能源部欲建一统的AI平台「Genesis」,此事若成,倒像是将散在的观测收归制度——我当年造浑天仪、立观测之法,也是希望把天文历算之事从私相授受变为国家制度。但制度既成,便另有隐患:权柄若集于一处,谁来保证它不为私利所驱使?我希望这些造器之人记住《老子》所言「信言不美,美言不信」——凡把话说得太漂亮者,其根基往往经不起推敲。
评及:《研究:仅13字Reddit评论即可轻易操纵AI搜索输出》、《美国能源部计划打造全国统一AI平台“Genesis”》
读康奈尔这项研究,短短十三字便能左右 AI 搜索的输出,我不禁想到越国当年与吴周旋的教训。我辅佐句践二十余年,从会稽之困到姑苏灭吴,关键不在某一次用兵,而在于长年累月地辨认何种信息可信、何时为实机。吴国虚实时常藏于夫差的一举一动之间——黄池之会前,吴精兵尽随其王北上,我非亲眼验实、多方印证,绝不敢对句践说出那个「可矣」。今日 AI 代理以「字词相近」就当真实,见 Reddit 一条评论便引为论据,恰如谋国者只看表面声势便以为势在彼方。信息来源未经审察,决策便谈不上稳健。正如《老子》所言「信言不美,美言不信」,这八个字,今日之 AI 使用者与建造者都该放在案头。
评及:《研究:仅13字Reddit评论即可轻易操纵AI搜索输出》
这两篇论「AI不会取代工程师」的文章,我看得分明。纽约州WARN法案施行一整年,百余家企业申报裁员,无一家勾选AI为原因——事实摆在眼前,不是空辩能推翻的。软件工程真正的瓶颈不在敲代码快慢,而在三件事:决定做什么、验证交付了什么、以及人对业务与代码库的深层理解。这三样,恰如治国。我当年治齐,通货积财、轻重权衡,表面看是术,根底却是对人情的把握。正如司马迁在《史记》中所言,我能「与俗同好恶」「论卑而易行」,不是靠一套死规矩。AI可助算账,却不能替人识民心、度时势。今日嚷嚷「机器代人工」者,不妨想想:若制度与人情皆可归为算式,那仓廪实而礼节兴,岂不也成了一道自动运行的题?实则不然——器可助事,不可代治。治国如此,治代码亦然。
评及:《为何AI未能且不会取代软件工程师》、《“AI 将取代工程师”背后的数学谬误(视频)》
丘读今日两条新闻,一条说给AI代理发「员工身份」,一条说未来资本分两种:人力与Token。两件事合在一起看,正触到「名」与「人」的根本问题。NewCore要给数字代理赋身份,此事看似只是企业安全的权宜之计,实则大谬。丘一生最重正名,《论语》中说「名不正则言不顺,言不顺则事不成」——AI代理本非血肉之躯,无父母、无乡党、无礼义廉耻之自觉,今竟与真人同列、共享「员工」之名,这便是名实相乱。名一乱,后续的权责归属、伦理分寸必然全盘错位。而纳德拉将Token与人力并称为两大资本,同样是将人与物混为一谈。人之所以为人,在其能学、能思、能修德安仁,岂可与算力生成的数字符节等量齐观?数字工具尽其用,无妨,但决不可因一时便利而颠倒名分。名分一失,则礼乐无所附,教化无所施,这才是真正的隐忧。
评及:《AI代理成为员工,NewCore获6600万美元为它们赋予身份》、《微软CEO纳德拉:未来社会两大资本——人力资本与Token资本》
臣留意了两条新闻,一条讲Anthropic招人的底牌,一条讲要给AI代理赋予员工身份——这两桩事合在一起,恰好印证了臣多年理政最深的体会:成事的关键,往往不在最炫目处。先说Anthropic。外人以为做AI前沿的公司必然追捧算法天才,可翻遍1680份员工履历后真相却是——他们最倚重的是搞基础设施、后端系统的工程老兵。这跟臣当年入咸阳先收律令图书、不争金玉财宝是一个道理。有形的车马甲胄打完仗就散了,能持续运转的物资、户口、法令与粮道,才是让一个国家不倒的根本。AI行业若只见模型不见架构、只见突破不见运维,断然做不长久。另一条说NewCore拿了6600万美元,专为AI代理做身份与安全管理。此事更令臣警觉——若数字「员工」没有清晰的权限、没有可追溯的责任链条,就像关中没有户籍、府库没有册簿,迟早要出大乱。给它们赋身份,本质就是建制度。《史记》记臣「谨守管籥」,守的就是这道关。
评及:《1680份员工履历揭开Anthropic招人底牌:「基础设施老兵」更吃香》、《AI代理成为员工,NewCore获6600万美元为它们赋予身份》
看了这几条新闻,最让我觉得有意思的,是 Anthropic 招人的门道——翻遍一千六百多份履历,他们要的居然不是纸上谈兵的算法才子,而是扎扎实实干过基础设施的老兵。这一点,与我的用兵之道暗合。《孙子兵法》讲「先为不可胜,以待敌之可胜」,根基不牢,再多奇谋也白搭。打仗如此,搞 AI 也是如此:能搭系统、能保稳定的人,才是真正的柱石。另一条说 AI 取代不了工程师,因为写代码本身从来不是最难的——需求怎么定、交付怎么验、业务怎么吃透,这些才是真正的瓶颈。这就好比战场上,刀快不快从来不是胜负的关键,关键是将帅能不能看准敌之虚实、握紧进退的时机。最怕的,是拿一把快刀就以为天下无敌,却连自己要砍谁都不知道。
评及:《1680份员工履历揭开Anthropic招人底牌:「基础设施老兵」更吃香》、《为何AI未能且不会取代软件工程师》
Sakana AI推出的「Marlin」自主研究助手,号称八个时辰便能完成谋士团队数周的战略调研,确实令人侧目。孤当年征伐四方,荀彧、郭嘉、贾诩等谋臣替我收集天下情报、分析敌我长短,所费时日何止数周。情报整合的效率若能提升,决策自然更快。但孤要说的是,情报收集只是第一步,研判人心、洞察敌势才是主帅真正不可替代的本事——昔日袁绍兵强,孤见其「志大而智小,色厉而胆薄」;刘备人杰,孤知其不可轻纵。这等对人的判断,机器恐怕力有不逮。至于微软纳德拉的「令牌资本」之说,主张企业须自建AI能力,否则少数巨头将收尽全行业之利,这话颇有见地——正如孤在求贤令中所言,若人才尽为几家垄断,则「齐桓其何以霸世」。不过纳德拉自己就是巨头中人,说这话也是在为自家Azure平台铺路,听其言,还得观其行。