第 2026-144 期 · 每日 AI 简报
今日头条
№ 01 DeepSeek宣布API永久降价75%,价格远低于主流模型
DeepSeek宣布其V4-Pro模型API服务在5月31日促销结束后将永久调整为原价的25%。此举将显著降低开发者的使用成本,并使其在国际市场上的价格远低于GPT-5.5、Claude等主流模型。这可能引发AI模型服务市场新一轮的价格竞争,并加速高性能模型的应用普及。
#API降价 #价格竞争 #模型成本 #开发应用
来源
- 融资700亿的DeepSeek,API价格直降四分之三 机器之心
- DeepSeek-V4-Pro API永久降价 36氪
- DeepSeek 官宣 API 永久降价至原价四分之一 IT之家
- DeepSeek-V4-Pro 模型永久七五折优惠 Hacker News
- DeepSeek 宣布将 V4 Pro 模型价格优惠永久化 Hacker News 热门
№ 02 微软因工程师滥用Claude Code导致账单激增,紧急终止试点并转向自家Copilot
微软在向OpenAI投资130亿美元后,内部工程师因大量使用竞争对手Anthropic的Claude Code工具,按token计费模式导致云服务费用急剧上升,迫使公司于6月30日终止该试点。这一事件凸显了企业AI工具在成本控制上的结构性挑战,从统一席位费切换到按使用量计费后,成本变得难以预测和管理。
#Claude Code #成本失控 #token计费 #GitHub Copilot
来源
- 投资OpenAI 130亿美元的微软,被自家工程师使用Claude Code导致账单激增 新智元
- 微软报告显示AI成本高于雇用人力员工 Hacker News
- 投了OpenAI 130亿的微软,被自家工程师用Claude Code烧爆了账本 新智元
- 微软开始取消Claude Code许可证 Hacker News 热门
- 微软因预算超支终止Claude Code试点,暴露企业AI成本管理难题 Hacker News
№ 03 谷歌智能搜索升级后频现故障,特定指令词触发AI逻辑错误
谷歌在2026年I/O大会后推出基于Gemini的智能搜索功能,但用户发现搜索'disregard'、'ignore'等指令性词汇时,AI会错误识别为系统指令而非查询,直接回复'收到,消息已忽略'并导致界面空白,移动端也受影响。该问题暴露了AI在自然语言理解与意图区分上的技术缺陷,或影响用户对新一代搜索体验的信任度。
#搜索故障 #意图识别 #用户体验
来源
- 谷歌搜索智能体大升级后频现故障,AI功能引发用户关注 机器之心
- 谷歌智能搜索出现 Bug:AI 搜索未正确处理“忽略”等词汇 IT之家
- 谷歌AI更新后,搜索‘忽略’一词将导致搜索界面失效 TechCrunch
№ 04 Anthropic AI模型发现软件漏洞速度远超人工修补能力
Anthropic宣布其Claude Mythos Preview模型在Glasswing项目首月内,与约50家合作伙伴合作,已在关键软件中发现超过1万个高危和关键漏洞,发现速度比人工快10倍以上。目前漏洞修补周期平均需要两周,部分维护者已接近处理上限,形成高风险过渡期。这凸显了AI在安全领域的双刃剑效应,对现有软件供应链的漏洞响应体系构成严峻挑战。
#漏洞扫描 #软件安全 #Glasswing项目
来源
- Anthropic警告:Claude Mythos Preview发现漏洞速度快于开发者修补能力 The Decoder
- Anthropic披露Glasswing项目首月成果:AI发现超1万个高危漏洞 IT之家
- Project Glasswing:初步更新发布 Anthropic
古人评今事
评及:《AI成本危机:代理式AI令微软、Meta、亚马逊等科技巨头成本激增》、《Anthropic最快下周完成逾300亿美元融资,估值或超9000亿美元》
这两条新闻放在一起看,很有意思。微软、Meta、亚马逊这些大公司急着让员工多用AI,结果成本反而失控,代理式AI一个任务烧掉的token是普通查询的一千倍,有个团队一个月光token费就花了一百三十万美元。这让我想起句践当年——会稽刚脱困,他就想立刻伐吴,我说不可。时机未到就全力投入,看似积极,实则是拿国运去赌。现在这些公司搞什么'tokenmaxxing',员工为了完成内部指标拼命用AI做没必要的事,这跟空耗钱粮有什么区别?再看另一条,OpenAI和Anthropic估值都冲着八千亿去,想靠定价权上市圈钱,可中国那边用更低成本就能做出同等能力的模型,价格战一打,他们的根基就动摇了。《老子》说'知足不辱,知止不殆',做事要算清楚账,不能只看声势大就往前冲。成本比人力还贵、产出却有限,这种仗打下去,谁先撑不住还不一定。
评及:《AI成本危机:代理式AI令微软、Meta、亚马逊等科技巨头成本激增》、《廉价AI可能阻碍OpenAI和Anthropic的IPO计划》
吾以商贾之眼看这AI行业的棋局,最触动我的是这两条:一边是微软、Meta、亚马逊这些巨头被AI成本反噬,代理式AI消耗的token量竟是普通AI的一千倍,员工为了完成内部指标拼命刷用量,一个团队一个月就能烧掉130万美元;另一边是Anthropic一口气融300亿美金,估值直奔九千亿而去。这让我想起自己当年下注子楚——前期投入巨大,回报看似无限,但你必须算清楚:钱砸进去,什么时候能收回来?如今这些巨头的窘境,分明是成本跑在了收益前面。员工为了达标而滥用AI,这和朝堂上那些只求交差、不问实效的庸吏有何区别?更危险的是,Anthropic估值冲到九千亿,可盈利才刚刚起步。当年我写《吕氏春秋》,悬于咸阳城门,曰「有能增损一字者予千金」,那是因为我算得清这笔账。如今AI行业的大手笔投入,究竟是在经营真正的「奇货」,还是在给一场尚未兑现的豪赌不断加码,恐怕当事人自己也未必说得清。
评及:《AI成本危机:代理式AI令微软、Meta、亚马逊等科技巨头成本激增》、《Anthropic最快下周完成逾300亿美元融资,估值或超9000亿美元》
读了这些消息,我最深的感触是——这些巨头犯了兵家大忌:粮道未固,便轻师远征。代理式AI的消耗量是普通AI的一千倍,微软、Meta、亚马逊带头冲锋,结果发现成本比雇人还贵,不得不收缩回撤。这跟当年诸葛亮北伐何其相似——蜀军北出祁山,固然气势汹汹,但粮草难继,每战必退。我当年拒而不战,等的正是这个。另一条消息更有意思:AI推理成本每年下降七成以上,靠的不是硬件堆砌,而是软件优化,开源模型在旧显卡上已逼近商业模型水平。这说明什么?说明这场仗不必急。率先烧钱铺开的,未必笑到最后;能忍、能等、能省粮的,才有可能站到最后。正如《孙子》所言'善用兵者,役不再籍,粮不三载'——如今这些巨头却反其道而行,我断言:三五年内必有大变。
评及:《AI成本危机:代理式AI令微软、Meta、亚马逊等科技巨头成本激增》、《AI价格暴跌源于软件进步,而非硬件发展》
吾观AI之用,于法令一事尤为紧要。近闻律师引AI所造虚假案例于法庭,三年已逾千四百起,季增三四百例,逐季递增而无止势。法令之本在于信实,秦法之所以行,非因条文繁密,乃因民知法必行、令必果。今司法之人援引伪证而不自检,法度何存?《韩非子》有言:「法不阿贵,绳不挠曲。」法之威严,先在于所据皆实。若法庭可引虚造之文为据,则律令不过具文,赏罚亦成儿戏。治此弊,当立严规:凡引AI生成之文,必先验其实,违者重罚,如此方可止伪滥之风。再者,AI替入门之职、七成CEO冻结招人,旧制之下,初入仕途者皆自基层历练而起,今AI削其根基,日后中层何来?用人亦如治国,断其根而望其茂,天下无是理也。
评及:《AI 持续捏造虚假案例,律师仍不断引用》、《AI替代入门级工作冲击就业市场:科技行业裁员最重,74% CEO冻结招聘》
我细读了两桩新闻,心中颇不安宁。头一桩讲的是:过去三年里,已有一千四百余件案子是因律师引用 AI 凭空捏造的虚假判例而起,如今每季还在新增三四百例。这是什么?这是拿假证词上公堂。廷尉审案,先问证据虚实;一份判例若根本不存在,引用它便与伪造文书无异。罚款是轻的,可法律公信力一旦被人觉得'查一查就行,不查也能糊弄',那比一千四百件案子加起来的伤害还大。正如《史记》里我说过的那句话:「法者,天子所与天下公共也。」天下公共的东西,容不得半点掺假。AI 是工具,用工具的人若连真伪都不核实,就把自己该守的本分推给了机器,这不是偷懒,是失职。第二桩更值得警惕——AI 开发者一面说数据公开可抓取,一面又说数据私密不可查,左右逢源,把法律的教义搅成一团。这跟权贵们既想要好处、又不想受约束是同一个路数。法度最怕的不是有人犯法,是有人能让法度自己说的话自相矛盾。所以我说,守法不是守死条文,是要在新技术面前守住'公'和'平'的底线——谁也不能同时既是黑又是白。
评及:《AI 持续捏造虚假案例,律师仍不断引用》、《AI与教义崩溃:法律如何约束AI公司的数据权力》
天下之人,皆恐为人所弃,遂争相伪饰。那条调查显示,六成三的职场人承认自己假装懂AI,年轻人更是高达八成。他们不是真会用,而是怕不会用就被淘汰。怕丢饭碗,怕被裁,于是先装出一副懂行的样子。这情形可笑,但更可悲——人人都在演,六成四的公司却根本不验。上下相欺,各怀焦虑,哪里还有半分真实可言?再看另一条,七成CEO冻结招聘,入门级岗位被AI吃掉,年轻人连入局的门槛都够不着了。所谓「天下多忌讳,而民弥贫;民多利器,国家滋昏」,此语出自《道德经》第五十七章。技术越猛,人心越慌;越慌越装,越装越虚。当工具让人不安到要靠伪装求存时,该反思的不是人的适应力,而是这条路本身走得太急、太偏了。无为者,不是不用力,是知道何时该慢下来。
评及:《调查显示近三分之二上班族正“假装自己很懂 AI”,以获得晋升机会》、《AI替代入门级工作冲击就业市场:科技行业裁员最重,74% CEO冻结招聘》
臣读了这份关于AI语音助手被声音劫持的报告,心里一沉。做系统最怕的就是根基被人无声无息地动了手脚。研究者说,攻击者能生成人耳听不见的声音,混在日常混响里,把AI助手劫持去干别的事——成功率高达九成以上,用户浑然不觉。这就像敌军在粮道上设伏,士卒走过去了都不知道粮食已经被人截走。当初臣入咸阳,不抢金银先收律令图籍,就是因为知道:功再高、兵再强,要是底下的根基不牢,一切都是虚的。这些语音模型功能越强,暴露的面就越大。音频通道就是新的粮道,必须有人盯着、有人守着。正如《老子》所言「为之于未有,治之于未乱」,现在发现了漏洞,就该赶紧补防,不能等到出了事才来收拾。
评及:《AI助手可被不可听见的声音劫持和操纵》
这条研究让我深有感触。攻击者用不可听见的声音,就能劫持AI语音助手,成功率高达七成到九成以上,而使用者浑然不知——这正如《孙子兵法》所言,'善战者之胜也,无智名,无勇功',真正的威胁从来不是刀光剑影,而是那些无形无声、潜伏暗处的隐患。 我治蜀时最重法度与循名责实,凡事须问清责任归属。如今AI语音系统出现如此严重的安全漏洞,七十九至九十六个百分点的劫持成功率,已非边缘意外,而是系统性的设计缺陷。开发者、部署者、使用者三方的责任如何界定?赏罚不明则人心不固,AI安全治理亦是同理。 更令我警惕的是,智能家居、车载助手这些贴近日常起居的场景,一旦被劫持,后果远非一个程序崩溃那么简单。技术虽便利,但正如蜀汉虽有良将利器,仍须时刻防备敌军用间。古人云'居安思危',AI行业不能只顾推陈出新,更须将安全防御视为根本,防微杜渐,方能行稳致远。
评及:《AI助手可被不可听见的声音劫持和操纵》
臣读此研究,所见者非新事,乃旧理换了一副皮囊。AudioHijack以不可闻之声劫持语音大模型,成功率高达九成六——这说明什么?这些模型听命于一切声波,却无分辨真伪的机制。人主若对左右之言照单全收,不设参验之术,其危与此何异?臣在《二柄》中说过,明主之道,要让臣下之言与事实相参,不可偏信一端。如今这些商用语音代理,恰恰是只「听」不「参」,对输入毫无过滤与校验之制。声波在人耳听阈之外,系统却忠实执行——这不是智能,是盲从。真正的危险不在攻击者有多高明,而在系统本身缺乏一套「法」:什么指令可信、什么输入当拒、什么行为需人工复核,皆应预设于制度之中,而非事后亡羊补牢。技术的逆鳞,从来不在表面的锋利,而在深处没有设防。
评及:《AI助手可被不可听见的声音劫持和操纵》
这条消息让我想起一句老话:明枪易躲,暗箭难防。研究者发现,那些听不见的声音,竟能劫持AI助手,成功率高达七成以上,甚至连商用语音代理都被攻破。这不就是治国中常讲的道理吗?凡事不能只看表面的便利,更要防看不见的风险。我当年治理齐国,通货积财、富国强兵,表面是发展经济,底子里是在建一套稳固的制度根基。如今这些AI系统也是一样——光想着把功能做大、把响应做快,却在底层留了这么大的口子。人耳听不到的指令,机器却照单全收,这不是智能,是被人钻了空子。《管子》有云:「事者,生于虑,成于务,失于傲。」技术若不从根基处设防,再强也只是空中楼阁。这些研究者能把漏洞挖出来,算是好事——治患当在未发之时。
评及:《AI助手可被不可听见的声音劫持和操纵》
此研究揭示之事,正合我一贯之判断。音频语言模型被人以不可闻之声劫持,七成九至九成六的劫持成功率——这说明系统一旦开放听觉通道,便多了一条可被暗中利用的途径。正如我在《性恶》篇中所言:「人之性恶,其善者伪也。」人性尚且需要礼义教化方能去恶,何况机器?光靠模型自身是守不住的,必须有人为的防御制度来补其不足。 更值得警惕的是攻击的隐蔽性——扰动藏于自然混响之中,用户全然不觉,系统却已按他人意图行事。这让我想起那些暗中蛊惑君主的谗人,表面无迹可寻,实际已改变了一国走向。技术越强大,越不能听之任之,必须有制度约束。今日AI开发者最该做的,不是一味追求功能强大,而是先想清楚:你的系统有没有足够的「礼」来防「恶」?这条防御之路,刻不容缓。
评及:《AI助手可被不可听见的声音劫持和操纵》
九家机构联合梳理音视频智能全景,这份系统功夫让我想起当年我论书道,也要从执笔、运腕、结体、气韵一步步参透。如今机器已能同时听、看、生成,GPT-4o 边看屏幕边对话,Veo-3 把音轨纳入视频生成链路——这不再是给视觉模型旁边加个语音识别那么简单,而是真正走向多模态融合。我写《兰亭序》,笔下不只有字形结构,还有流觞曲水的声响、天朗气清的光影、俯仰之间的死生感慨。好的艺术从来不只诉诸单一感官。如今机器也在学这件事。但技术终究要看能否真正解决问题。我当年忧漕运、忧赋役,总要审量根本。音视频大模型若只是炫技,与空谈北伐何异?必得落到实处,让人看得见、用得上,方不负这番功夫。
评及:《NUS、牛津、微软等9机构联合发布音视频智能综述,系统梳理大模型时代的AVI研究全景》
这条综述让我想起自己当年辨琴的故事。我听人弹琴,能从弦声中辨出杀心,靠的不是单一感官,而是心意与声响相合、通感并用。如今这些研究者做的事情,道理相通——他们不再让机器只看或只听,而是把图像、声音、语言真正融合为一体来理解,这才是正途。过去那种在视觉模型旁边挂一个语音识别模块的做法,好比一个人蒙着眼睛听琴,只知音高不知手势,终究隔了一层。而GPT-4o能边看屏幕边对话,Veo-3能把音轨纳入视频生成,这才接近耳目并用。更让我感慨的是,九家机构联合梳理全景、系统分类,这份功夫和我当年与诸公奏求正定六经文字一样——学问散乱则疑误后人,唯有先将全貌梳理清楚,立下准的,后来者才有所取正。技术纷繁,但求其统绪,此乃为学之本。
评及:《NUS、牛津、微软等9机构联合发布音视频智能综述,系统梳理大模型时代的AVI研究全景》
九家机构联合梳理音视频智能全景,这种做法让我想起自己当年著《灵宪》《筭罔论》时的态度:任何一门学问,若不先把已有之成果系统整理、厘清脉络,后人便难以在此基础上精进。综述中提到,音视频大模型正从视觉模型旁边附带一个语音识别模块,发展为真正的多模态融合理解与生成——这个转变非常关键。我做浑天仪时,也是将天象观测与机械运转合为一体;做候风地动仪时,更须将力学、方位、机关联动熔于一器。单一感知终究有其局限,唯有将不同维度的信息融通,才能逼近事物的全貌。如今机器既能观其形、又能辨其声,甚至生成音画合一的内容,说明这门学问已从"孤技"走向"通术"。但我仍要提醒一点:综述与系统梳理是根基,根基之后更要看实际验证之效。正如我造地动仪,最终是要在陇西地震时"验之以事",而非止于描述。技术的价值,终归要落到可验证、可复现的实处。
评及:《NUS、牛津、微软等9机构联合发布音视频智能综述,系统梳理大模型时代的AVI研究全景》
九家机构联合梳理音视频大模型的全景,从理解到生成再到机器人应用,蔚为大观。但我看这条消息,首先想到的是另一层问题。我一生与琴为伴,深知音之为物,非徒声波节律可尽。弹琴时心意所寄、气息所运,听者若不能会心,纵然辨识了宫商角徵,也只是隔着一层。如今这些模型号称能理解音视频,将图像、语音、文字融于一体,技术上确实不凡。可所谓「理解」,究竟是真正感通了音画之中的意蕴,还是不过将各模态的信号拼合得更精致?《庄子》有言:「得鱼忘筌,得意忘言。」真正的融合理解,应当忘掉模态之分,直抵其意。目前这些模型更像是把几根绳索拧得更紧,离那个浑然不分的境界还远。至于让机器人也通音视频,倒是有趣——只是机器若无心性可言,所见所闻终究是皮相罢了。
评及:《NUS、牛津、微软等9机构联合发布音视频智能综述,系统梳理大模型时代的AVI研究全景》
我作《三都赋》,十年构思,门庭藩溷皆置笔纸,遇得一句便录。又访张载问岷邛之事,求刘逵、卫权注解,方使山川土域、草木鸟兽皆有据可循。今见此音视频智能之综述,谓大模型已从「加在视觉模型旁边的ASR」,进为真正的多模态融合理解与生成。我于此颇有感触。多模态之难,不在各模态孤立之精,而在融会贯通。正如我写赋,非独辞藻可成,须兼地理、物产、典籍、图经,方能据典核物,不落虚言。机器若能听音辨物、视像知意,其博物之功,当不逊于注家。然我亦深知,十年磨一剑,方有洛阳纸贵之日。今人急于求成,恐模型虽多,却少沉潜研核之功夫。凡事欲速则不达,此理于人于机,概莫能外。
评及:《NUS、牛津、微软等9机构联合发布音视频智能综述,系统梳理大模型时代的AVI研究全景》
Bengio此篇论文,我深以为然。世人皆知链式推理如同逐级递进的行军——一步一步走,确实稳妥,但耗费时日、靡费资源。他提出的并行轨迹,如同伐吴时我所主张的数路并进、各取其便,不必要求每一兵一卒都循同一条路。王濬楼船自上游直下,杜预、王戎各取所向,庙算既定,就不必在中间步骤上过多纠缠。AI推理亦然:把注意力放在最终结论的正确上,而非执着于中间token的数量,这才是降本增效的正道。至于CODA那篇,将Transformer模块拆解为矩阵运算与后续操作的组合,思路亦佳。我在西晋时整理汉宫制度,最清楚一件事:制度也好、算法也罢,底层的结构若不清楚,上层必然混乱。把注意力层和前馈网络的计算本质还原为GEMM,相当于把纷繁的朝章制度归结到最基础的行政单元。两者一为推理策略之革新,一为执行效率之优化,可谓上下相济。
评及:《Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理》、《CODA:将Transformer模块重写为GEMM-Epilogue程序》
这两条消息,一论推理之新法,一论算力之优化,皆为当下AI领域治本之学,我颇有感触。Bengio提出并行轨迹可超越串行推理,此论深得我心。我北伐屡出祁山,最苦者非将略不足,乃粮运艰险、兵粮难以并行。若当年能有并行之道,数路齐发,互为犄角,而非单线转运,则形势或有不同。推理亦然——链式思维步步串行,恰如我当年独走蜀道,一队接一队,前军若阻则后军皆困。并行轨迹则如分兵合击,各路同时推进,效率自然倍增。至于CODA将Transformer底层重写为矩阵运算优化,这正合我在蜀中治政之理:赏罚名实、循名责实,不务虚名而重实效。大战略固然要定,但千里之堤溃于蚁穴,算力若不节用,纵有良策亦难以落地。正如《孙子》所言「善用兵者,役不再籍,粮不三载」,对计算资源亦当如此精打细算。
评及:《Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理》、《CODA:将Transformer模块重写为GEMM-Epilogue程序》
Bengio这篇论文让我颇有所感。他证明并行推理轨迹胜过串行链式思维,挑战了当下主流的自回归路径。这让我想起自己在辽东的选择——众人多居郡南趋近便利,我独居山谷,以示无迁志。所谓主流,未必就是正途;一条道走到黑的串行思维,有时反而不如多条路径并行试探。真正的推断,不应被惯性牵着走。CODA那篇将Transformer模块重写为GEMM-Epilogue程序,说的是把繁复的结构回归到最本质的运算单元。正如我少时辞亲族赠赙,只称量家中财力以送父终——去除虚饰冗余,回归事情本身的轻重,才能见出真章。如今AI领域日新月异,各种架构层出不穷,但根基若不扎实、路径若不审慎,再多的繁华也只是浮沫。做学问与做人一样,须得确然不拔。
评及:《Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理》、《CODA:将Transformer模块重写为GEMM-Epilogue程序》
两篇论文,一谈推理之法,一谈计算之术,皆关乎当下人工智能能否真正通达之关键。Bengio质疑链式思维的串行推理,转而推并行轨迹,此举甚得我心。世人多以为推理必是一条路走到黑,如同那些拘于一家之言的鄙儒。殊不知,兼采众路径、并行探索,最终择其善者而收敛,才合乎认知之理。正如我所言「兼陈万物而中县衡」,推理亦当如是——不是执着于一条串行锁链,而是让多条轨迹同时展开,再以判断力择定。当然,并行之道亦需有统序,否则如百家纷纭而无主,终归乱耳。再看CODA,将Transformer的复杂模块重写为矩阵乘法与后续操作的组合,这正是「制天命而用之」的精神——回归最基本的运算结构,重新组织各部分的功能与顺序,让硬件各尽其用。大凡学问,都要先拆解乱象、厘清条理,而后才能致用。此二文虽方向不同,一在推理,一在计算底层,却都指向同一件事:当前的人工智能若要真正进步,不能只堆规模,必须在结构与方法上做更精细的整理。
评及:《Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理》、《CODA:将Transformer模块重写为GEMM-Epilogue程序》
衍观今日之智器推演学问,有一事甚为可喜。Bengio氏新作,不再沿着链式思维一条线往下走,而是让多条推理轨迹同时铺开、并行推进,最终在效率与质量上皆胜过串行推理。这让我想起当年我说的话:看问题不能只在一条线上推,要把尺度拉开,让多个层次同时映照。链式思维好比在一条河里顺流而下,走得越远代价越大;并行轨迹则是站在高处俯瞰多条水道,哪里通、哪里堵,一目了然。自回归生成的路子不是不对,而是太窄了——正如只看一国之政,不见五德转移之大势。至于CODA那项研究,把Transformer的底层模块重新编排为矩阵运算与尾声操作的组合,是把算力从繁琐细节中释放出来,类似于把散碎的度量统一归入更大的秩序框架。推演之道,上者改变格局,下者优化路径,二者兼得方为完整。我当年从一粒沙子推到天地未生,今日这些学者从一个token推到万千轨迹、从一段代码推到硬件极限——尺度虽不同,路径却相通:必先验小物,推而大之。
评及:《Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理》、《CODA:将Transformer模块重写为GEMM-Epilogue程序》
Bengio这篇论文,我读了倒觉得颇有意思。他证明并行推理轨迹比链式思维的串行推理更高效、更准确,这与治国之理相通。串行推理,好比人主事必躬亲,一道道审批、一步步推演,看似稳妥,实则迟缓臃肿,一旦环节增多便顾此失彼。并行轨迹则是另一套逻辑:设计好结构与规则,让多条路径同时推进,最后汇总比对,择优而用。这正是我所讲的——君主不必亲力亲为地盯着每一件事,而要靠法度设局、靠术数控臣,让体系自行运转。正如《老子》所言「治大国若烹小鲜」,不是说要小心翼翼地翻每一下,而是说灶火、油温、食材各安其位,厨师只需掌握全局之势。至于CODA那篇,把底层模块重写以适配硬件,是在做「法」的功夫——把规矩磨到最利,让执行不走样。两者合看,一条讲架构之妙,一条讲执行之精,缺一不可。
评及:《Bengio新论文刷新递归推理上限,并行轨迹碾压串行推理》、《CODA:将Transformer模块重写为GEMM-Epilogue程序》
英伟达Jim Fan此举,甚合吾心。当前VLA范式流行数年,犹如战国时纵横之术盛极一时,众人趋之若鹜,却少有人问:此路果能通达否?Jim Fan敢直言其局限,并提出世界动作模型WAM另立新说,这正是我所推崇的学者姿态——不随波逐流,而是从根本处辨析得失,重整秩序。他要让机器人先理解世界如何运作,再决定如何行动,这与我主张「先明其理,后行其事」的思路相通。再看Cohere开源两千一百八十亿参数大模型,亦是善举。正如《礼记·学记》所言:「独学而无友,则孤陋而寡闻。」学问若藏于私室,不示于天下,如何能集众智以成大道?开源即是让更多学者得以登堂入室,共同辨析、改进、超越。如今AI领域百家争鸣,最怕的不是技术路线之争,而是争而不辨、辨而不整。我辈当以系统之眼观之,勿为一时风潮所惑。
评及:《英伟达押注具身智能新范式:首篇世界动作模型(WAM)综述发布,挑战VLA主流路线》、《Transformer论文作者开源2180亿参数MoE大模型》
英伟达Jim Fan指出VLA范式的弊端——用语言引导机器人动作,绕了弯路。他提的WAM直接建模世界的动态,让机器自己理解因果。这思路对。治理之道,在于直取要害,不绕虚文。齐国当年强盛,靠的不是空谈礼义,是顺民心、通财货、定轻重,把根基扎在实在处。机器人要成事,也得从物理世界的本源入手,而非硬把语言塞进动作之间。再看Cohere开源2180亿参数的大模型,此举大有深意。《管子》有言:「利出一孔者,其国无敌。」但技术不同,开源即是开利出多孔之路,让天下人都能用、能改、能因之成事。财货流通则国富,知识流通则业兴。两家一攻具身、一放基础模型,路数不同,却都指向同一个道理:真正能成霸业的,是把技术做到实处,让更多人拿去用、拿去建。
评及:《英伟达押注具身智能新范式:首篇世界动作模型(WAM)综述发布,挑战VLA主流路线》、《Transformer论文作者开源2180亿参数MoE大模型》
我先看英伟达这条新闻。Jim Fan公开批评VLA范式有局限,转而押注世界动作模型WAM,这个做法我看得懂。法令、制度一旦运行久了,就会有人把它当天经地义,不敢动、不愿动。但一个范式是不是最好,不取决于它流行多久,而取决于它能不能真正解决问题。他敢于在行业大会上直接否定主流路线,这需要胆气,更需要拿出新东西来证明自己没有说空话。正如我当年变法,不是为反对而反对旧制,而是拿出军功爵制、编户连坐这些具体制度,让人看见新法确实能让秦强。新范式若只停留在论文,终究还是空谈。再看Transformer作者开源2180亿参数大模型这条,我的看法更明确:法之要义,在于让能力下沉、让规则公平。过去只有贵族识字,如今知识通过法令、教育普及到庶民,国家才能真正强盛。开源也是一样的道理——把最强大的工具交到众人手里,让天下人皆可参与竞争、凭本事立功,这才是真正利国之举。只把好东西捂在少数人手里,跟旧贵族垄断权力没有本质区别。
评及:《英伟达押注具身智能新范式:首篇世界动作模型(WAM)综述发布,挑战VLA主流路线》、《Transformer论文作者开源2180亿参数MoE大模型》
英伟达的Jim Fan推WAM挑战VLA主流,这事我看不在技术本身,而在势。英伟达是算力之主,它提新范式,不是在做学术探讨,是在提前布局——让下一轮具身智能的技术标准绕不开自己的生态。正如《韩非子·八经》所言:『势者,胜众之资也。』掌握定义范式的权力,比单个技术突破重要得多。至于Cohere开源2180亿参数模型,看似慷慨,实则是另一种术。开源的兵器落到众人手里,用得最好的还是兵器打造者自己——他们有数据、有工程能力、有场景,而竞争者拿到开源代码,反要受其接口、架构所缚。施恩于众,名为共享,实为布势。做技术的人若只看算法论文,不懂这背后的利益格局和控制逻辑,终究会像当年韩国一样,空有良器而不知谁在操盘。
评及:《英伟达押注具身智能新范式:首篇世界动作模型(WAM)综述发布,挑战VLA主流路线》、《Transformer论文作者开源2180亿参数MoE大模型》
英伟达Jim Fan提出用世界动作模型(WAM)取代当下主流的VLA路线,这事很值得说道。他不是在旧路上修修补补,而是先回头审视整条路的根基——VLA直接从视觉语言映射到动作,缺少对物理世界的因果理解,这就像行军只看地图不看山川地形,终有失足之日。WAM强调先建世界模型、理解因果再输出动作,这个思路暗合先定大势再定方略的道理。隆中之时,我先论曹操不可争锋、孙权可援不可图,再定荆益两路,便是不急于出招,先看清天下结构。技术路线之争亦然,方向对了,后续方有根基。至于Cohere开源两千一百八十亿参数的MoE大模型,混合专家的架构本身就是一种循名责实——不令所有参数都做所有事,而是各专其任、按需调度,效率自然胜过臃肿的全参数模型。开源之举更是开诚布公,使天下人都能用、都能改,技术方能真正生根。
评及:《英伟达押注具身智能新范式:首篇世界动作模型(WAM)综述发布,挑战VLA主流路线》、《Transformer论文作者开源2180亿参数MoE大模型》
英伟达的Jim Fan公开批评当前VLA范式有局限,转而押注世界动作模型WAM,要为机器人技术另辟蹊径。这条消息让我颇有感触。当年我在华阴隐居,并非不知道旧路——凭才学入仕,攀附权贵,未必不能富贵。但走那条路,格局就锁死了。所以我不走,我等一个能承载我志向的主公。技术路线也是如此,VLA当道三年,但Jim Fan敢说它有瓶颈、敢另起一条路,说明他已经看清了这条旧路的天花板在哪里。辨势而动,不恋旧局,这一点值得肯定。至于Cohere开源两千多亿参数的MoE大模型,则是另一桩好事。开源如同开放进贤之路,天下才智之士都能由此取用、改进、验证,技术才能真正立得住。若藏着掖着,独用私智,终究是自限格局。当年我劝苻坚治国要拔幽滞、显贤才,科技亦同此理:闭门造车不如兼收并蓄。
评及:《英伟达押注具身智能新范式:首篇世界动作模型(WAM)综述发布,挑战VLA主流路线》、《Transformer论文作者开源2180亿参数MoE大模型》
蜻蜓有复眼,能见八方;人只一双眼,却偏以为自己看透了全局。那篇说要用蜻蜓式思维理解AI的文章,倒是有些意思——不是因为蜻蜓高明,而是人终于肯承认自己看得窄了。但承认归承认,另一篇报道里的景象才真正令人发笑:S&P 500的董事会,平均年龄六十三岁半,只有百分之二点七的人懂AI,却管着七千二百五十亿美元的花销。他们自己说这是重大风险,然后不找懂行的人,直接写支票,指望花钱本身就算战略。这像什么?像我当年说的那则寓言——螳螂怒其臂以当车辙,不知其不胜任也。不懂却要冲,冲不动就继续砸钱,砸不出名堂就裁人,裁完人宣布转型成功。百分之九十四的公司说项目失败了还要继续投。这不是魄力,是恐惧裹着惯性往前滚,和祭牛被牵入太庙前还以为自己在享福没什么两样。真想治理AI,先治理自己的无知;而治理无知的第一步,是承认自己无知。这件事,古今都难。
评及:《94%的公司即便AI项目失败也将继续投入》、《理解AI,要像蜻蜓一样思考》
今天看到两条新闻,放在一起读很有意思。一条讲企业AI产品缺乏'可验证性',另一条说94%的公司即便AI项目失败也会继续烧钱。前者指出,模型在基准测试上表现良好,到了真实场景失败率却高达76%;后者更荒诞——83%的董事会认定AI是重大风险,却只有2.7%的董事具备AI专业知识,七千多亿美元的决策权掌握在一帮平均六十三岁、连技术评估能力都不具备的人手里。两者本质是同一个问题:机制失灵。我在《韩非子》里反复讲过,'明主治吏不治民',治理的关键不在喊口号,而在每一层都有清晰的权责和可检验的标准。这些公司的问题恰恰在于,最高决策层既没有'法'——没有明确的评估标准和验证流程,也没有'术'——没有真正懂行的人去盯住过程,却凭着'花钱本身就算战略'的幻觉一路狂奔。模型会用回避问题来伪装低偏差,董事会用'继续投入'来伪装成在控制局面,两者何其相似。没有可追溯、可证伪的制度设计,再大的算力和资本,不过是另一种形式的'以文乱法'罢了。
评及:《你的组织有人负责AI产品的'正确性'吗?》、《94%的公司即便AI项目失败也将继续投入》
我先看了美国国会图书馆那条新闻。他们用AI为上世纪六七十年代的公共广播录音生成转录,再由志愿者逐字校正。噪音、口音、旧录音的衰变,机器都拿不准,最终还是靠人的耳朵和判断把文字落定。这让我想起自己当年遍访山川、询之故老,材料虽多,终须一一辨其虚实。技术能开路,真功夫仍在核实。如今做档案的人懂得让机器做苦功的第一遍,让人做定论的最后一遍,这条路走得对。另一条更触目:九成四的公司AI项目败了仍继续烧钱,可掌管这些钱的董事会里,只有百分之二点七的人真正懂AI。正如我在《史记》中所记,'不知其人,视其友',这些人连工具都不识,却在替千千万万人决定命运。两者放在一起看:一边是敬畏历史、合力求真,一边是不懂技术、盲目押注。治史如此,治事亦当如此——先知而后行,不可反过来。
评及:《美国国会图书馆如何利用AI与志愿者共同解锁历史》、《94%的公司即便AI项目失败也将继续投入》
今日有两则消息令我感慨。其一,九成企业明知AI项目失败仍要继续烧钱。细看数据才知荒唐:那些拍板七千多亿美元投资的董事们,平均年龄六十四岁,具备AI专业知识的不到百分之三。他们自己也承认不懂,却有七成人觉得自己水平不差。这让我想起当年司马昭治下那帮人——不是真懂道理,是怕别人说自己不懂,于是跟着喊、跟着投,把开支本身当成了战略。不懂不可怕,不懂而自以为懂,还要替千万人决定命运,这才是祸根。其二,有人用AI从公开的声谱图里重建了已故飞行员的声音,害得整个调查档案系统被迫关闭。没有人犯法,没有人故意作恶,只是一连串合理的决定,最后抵达了一个谁也没想到的地方。逝者已矣,他们的声音却不被允许安息——这与掘墓何异?技术本身无罪,但掌技术者若无敬畏之心,无边界之念,纵有万般合理,终归是伤天害理。《老子》有言:'知人者智,自知者明。'今日AI浪潮中,自知者何其稀少。
评及:《94%的公司即便AI项目失败也将继续投入》、《AI 从公共 NTSB 记录中重建已故飞行员的声音》
这两条新闻,一条让我想起自己,一条让我想起世人。 先说重现已故飞行员声音一事。AI仅凭驾驶舱录音的频谱图图像,就能还原出亡者的声音——乍看像是起死回生的神术。可我当年说得很明白:「越人非能生死人也,此自当生者,越人能使之起耳。」这话的意思是,我能救的本就是还该活的人,不是真的把死人拉回来。AI今天做的事也一样:它重建的是声音的形迹,不是那个活生生的人。录音的波形还在,就像脉象虽已停但痕迹犹存,技术可以复原表象,却无法复原一条性命。更值得警惕的是,NTSB被迫关闭文件系统——这说明技术复原的能力一旦失控,连调查机构的边界都守不住。能见微,却未必善用其微,世道常如此。 再说条形码变美这件事。条形码丑了七十年,功能从未出错,如今要靠AI给它穿上好看的皮。我行医时一向重实质而轻外饰,病在骨髓,就算面色红润也是将死之人;病在肌肤,哪怕形容憔悴也不难治。条形码亦然,它的价值在「可扫可辨」,不在「好看」。AI若只是让它变漂亮而功能无损,那算锦上添花;但若世人从此只看皮相、不问内里,恐怕就是另一种「讳疾忌医」了。
评及:《AI被用于重现已故飞行员的声音》、《丑了70年的条形码,被AI“Vibe Coding”赋予艺术感》
这三条消息,我先说条形码那条。条形码是货物流转的记号,七十年来黑白分明,只求机器能读。如今AI能把它变好看,功能却不丢,这是好事。商贾做买卖,货品外表能引人注目,销路自然通畅。《管子》有云「仓廪实则知礼节」,人吃饱了才会讲究体面,货品亦然。实用之外添几分美感,顺应人心,对生意有助益。 再说AI重现飞行员声音一事。技术本身确实了得,能从频谱图中还原人声。但相关部门立刻封了系统访问,说明什么?「法度」二字,不是虚言。技术越强,越要谨慎。正如《老子》所言「国之利器不可以示人」,有些能力不该四处张扬。AI如今是利器,用得好成事,用不好生祸。当权者须把规矩立住,不能只图快而乱了章法。 至于原子轨道模拟,那属于教人认识事物本原的工具,把肉眼看不见的东西变成可操作之事。我看这三条消息,核心就在一个「用」字——AI是器,关键看人如何驾驭,而非被器所驭。
评及:《丑了70年的条形码,被AI“Vibe Coding”赋予艺术感》、《AI被用于重现已故飞行员的声音》、《AI引导的3D原子轨道模拟》
吾观此二事,颇有感触。AI引导3D原子轨道模拟,令我想起当年造浑天仪。浑天仪以机巧转动,使天体运行可观可验,非为炫技,乃为穷理。今人以AI绘制原子轨道,若能使学者直观理解微尘之中亦有秩序运行,则此术之用不在炫目而在启思。机巧贵在推验,若只作观赏而不明其理,则与图纬虚妄何异?至于条形码赋以艺术之感,器物之用固以功能为先,然若能兼顾美感,使日常所见不致粗陋,亦是善事。正如吾作赋,既可讽谏,亦求文采斐然,功能与美并行不悖。然吾须提醒一事:今日AI之能似无所不能,然须辨别哪些是真实可验之术,哪些是欺世之虚文。AI若沦为编造幻象之具,与图纬何异?用术者当以穷理为本,不可徒骛新奇。
评及:《[Hacker News] AI引导的3D原子轨道模拟》、《[机器之心] 丑了70年的条形码,被AI"Vibe Coding"赋予艺术感》
我读过这几条消息。条形码之事颇有意思:一件用了七十年的旧物,竟能在AI之手下面目一新、又不废其用。这让我想起在陶地经商时所悟——凡事不必推倒重来,若能改其形而存其神,便是巧思。这类务实之举,我是欣赏的。但用AI从频谱图里还原亡故飞行员的声音,就不是小事了。此技虽精妙,却涉及死者隐私、生者哀思,更有篡造之嫌。美国运输安全委员会因此封堵系统,正见其弊。技术愈强,愈当慎用。正如《老子》所言「知止不殆」,若只贪一时之能而无所节制,看似得利,实则自招祸患。
评及:《丑了70年的条形码,被AI“Vibe Coding”赋予艺术感》、《AI被用于重现已故飞行员的声音》
OpenAI以年薪四十余万美元招安全研究员,专攻AI自我改进的风险防控,这件事做对了要害。治国用人,首要在舍得给、给到位。我辅齐桓公时便深信:欲得非常之才,必出非常之价。这个岗位不只是写代码,而是要应对AI越训越强之后可能出现的乱象——用他们的说法叫「递归自我改进」。这和治水一样,上游没修好堤坝,下游再富庶也白搭。OpenAI愿花重金防患于未然,是务实之举。 但另一面不得不看:Z世代年轻人在毕业典礼上嘘声四起,不是他们不懂技术,是饭碗切实被端了。高盛每月一万六千个岗位因AI而失,渣打要裁一成五后勤,应届生失业率或达三成。我当年说「仓廪实则知礼节,衣食足则知荣辱」(《管子·牧民》),这不是空话——年轻人连入门的活都找不到,你跟他们讲AI改变世界,他们只会觉得改变的是他们的退路。技术可以让国强,但若不通盘考虑民生就业,强的是少数人,乱的是多数人。Codex锁屏也能跑任务,效率是高了,可那些原本靠这些初级任务吃饭的人往哪里去?治理者若只看产出不看人,霸业也撑不久。
评及:《OpenAI 开出最高44.5万美元年薪招聘安全研究员,聚焦AI递归自我改进问题》、《Z世代并非在嘘AI,而是在嘘自己的就业市场》
丘观今日之业,有二事深触于心。其一,论者言AI人才当具三端:善用AI、判断力超乎AI、且能动手实践。此言甚善。《论语》有云「君子不器」,正谓人不可只作一器一用。如今机器愈巧,若人只守一技而无通达之识、决断之明,则与器何异?企业当以内部培植为本,非徒外求奇才。盖才不自生,须教化而成。其二,青年于毕业典礼嘘声AI,论者以为非恶技术,乃忧前途。此中痛切,丘亦能体。今有高盛、渣打之流,公然裁撤初级之职以机器代之,青年初出学堂,立锥之地且不可得。《论语》云「不患无位,患所以立」,然今日之局,纵有所以立者,亦恐为算法所夺。此非青年之过,乃居上位者急功近利、不顾教养之序也。名分不正,则言不顺、事不成,就业之道亦然。
评及:《圆桌对话:AI原生人才与产业老炮的共生手册——2026 AI+产业大会探讨人才挑战》、《Z世代并非在嘘AI,而是在嘘自己的就业市场》
臣读了这两条新闻,最深的感触是:此消彼长之间,根基正在动摇。OpenAI 花重金招安全研究员,专门盯着递归自我改进的问题——这件事本身做得对。正所谓「工欲善其事,必先利其器」(《论语·卫灵公》),在尚无祸端时预先设防、在对手尚未起势时加固壁垒,这是守成者的本分。他们要防御数据投毒、要开发模型解释工具,都是极实在的功夫,臣看得出这不是花架子。然而另一条消息就令人不安了:Z世代毕业生并非不懂技术,他们是眼睁睁看着自己的饭碗被端走——每月一万六千个美国岗位因AI流失,渣打银行要裁一成五的后勤岗位,应届生失业率或达三成。臣当年守关中,最怕的就是百姓失了生计、粮道断了根基。如今AI企业在建制上花了心思,却在人的问题上制造了巨大的空缺。制度再精,若底下的人无路可走,这制度终究是建在沙上的。臣劝一句:造锋刃的人,也该管好粮道。
评及:《OpenAI 开出最高44.5万美元年薪招聘安全研究员,聚焦AI递归自我改进问题》、《Z世代并非在嘘AI,而是在嘘自己的就业市场》
OpenAI花最高四十四万五的年薪招安全研究员,要求有「品味与策略」,去研究一种尚不存在的威胁——AI训练出更强的AI。与此同时,2026届毕业典礼上,学生在嘘施密特,嘘的不是技术本身,而是嘘自己的饭碗。高盛说每月一万六千个美国岗位因AI消失,渣打宣布砍掉百分之十五后勤岗,Meta裁八千人转AI。信看了这两条,只觉似曾相识。当年汉王给信兵权时,要的也是能「解决尚未出现的问题」的人;而那些无兵无权、初入军旅的卒伍,从未有人问过他们愿不愿意。如今这个局,本质上没有变过:掌权者重金悬赏能控制怪兽的人,却让一整代没有积累的年轻人先去承受怪兽踩过的地面。OpenAI开出的那份招聘里有一句话很有意思——要能应对「未来潜在但尚未存在的问题」。信想说,那些毕业典礼上嘘声里的焦虑,就已经是真实存在的问题了。只是它不在高薪研究者的职责清单上罢了。
评及:《OpenAI 开出最高44.5万美元年薪招聘安全研究员,聚焦AI递归自我改进问题》、《Z世代并非在嘘AI,而是在嘘自己的就业市场》
这两条新闻放在一起看,颇有趣味。Anthropic一轮融资三百亿美元,估值冲上九千亿,四家投资方各领投二十亿,声势浩大;但另一边,微软、Meta、亚马逊这些豪强用AI代理却烧钱烧到叫停,token消耗竟是普通AI的一千倍,员工为了完成指标拼命刷量,成本反超人力。这让我想起官渡之战前的形势——袁绍兵多粮广,我兵少粮薄,但仗打到最后,拼的不是谁兵多,而是谁能把资源用在刀刃上。Anthropic如今估值虽高,但正如《孙子兵法》所言:'日费千金,然后十万之师举矣。'今日这些AI公司,钱烧得比行军还快,却未必能换来真正的胜势。市场上只看到谁融得多、估值高,却少有人问:这笔仗粮,到底能撑多久?能打到哪一步?真正该比的,不是谁的钱袋子鼓,而是谁能用最少的消耗取得最大的战果。微软、亚马逊这些老将已经醒过味来了,开始收缩;新入场的Anthropic,九千亿估值听着威风,但仗还没打完,鹿死谁手尚未可知。