第 2026-148 期 · 每日 AI 简报
今日头条
№ 01 小米MiMo-V2.5系列API永久降价 最高降幅达99%
小米宣布其MiMo-V2.5系列大模型API进行永久性降价,最高降幅达99%,并优化了Token计费体系,使用户可用量提升至原来的5至8倍。此举旨在大幅降低开发者和企业的使用成本,推动更广泛的AI应用开发与集成。新定价已于北京时间5月27日0点生效,并对历史付费用户额度进行了全量重置。
#API降价 #永久调价 #Token计费
来源
- 小米 MiMo-v2.5 系列 API 永久降价,最高优惠达 99% Hacker News 热门
- 小米MiMo-V2.5系列API永久降价,最高降幅99%,计费体系优化 36氪
- 小米MiMo-v2.5价格暴降99%:AI定价大战升级 Hacker News
- 小米 MiMo-V2.5 系列 API 永久降价:降幅 57%-99%,当前有效 Token Plan 用户额度全量重置 IT之家
№ 02 奥尔特曼承认此前AI冲击白领就业预测过于悲观
OpenAI首席执行官萨姆·奥尔特曼公开修正了其过去关于AI将大量消灭初级白领岗位的预测,认为短期冲击并未如预期严重,且AI更可能改变而非取代工作。他反思在社会影响预测上存在偏差,但仍强调需坦率讨论AI的广泛影响并关注技能再培训。
#奥尔特曼 #白领就业 #技能再培训
来源
- OpenAI奥尔特曼承认此前AI对白领就业冲击预测过于悲观 IT之家
- OpenAI CEO奥特曼:AI不太可能导致“就业末日” Hacker News
- OpenAI首席执行官承认AI未引爆就业末日:人类互动无法替代 36氪
№ 03 罗宾汉向AI代理开放API支持自动化股票交易与信用卡消费
罗宾汉宣布向AI代理开放其交易平台API,允许人工智能系统直接执行股票交易和信用卡购买操作。用户可创建独立账户预存资金供AI代理使用,以自动化执行交易策略。此举深化了金融科技与AI的整合,但自动化交易的安全风险与监管问题也随之凸显。
#罗宾汉 #AI代理 #股票交易 #信用卡消费
来源
- 罗宾汉向AI代理开放平台用于交易和信用卡购买 Hacker News
- Robinhood允许客户使用AI进行股票交易和信用卡消费 Hacker News
- Robinhood现允许AI代理进行股票交易 TechCrunch
№ 04 快手可灵AI年化收入近5亿美元 同比增长四倍
快手CEO程一笑在2026年一季度业绩电话会上透露,可灵AI在3月的年化收入运行率接近5亿美元,同比增长超300%。增长主要由B端企业API调用与P端付费会员订阅共同驱动,用户数和月均付费金额均实现高速增长。可灵AI已覆盖全球42个国家和地区,其3.0系列模型的上线进一步提升了产品竞争力。
#可灵AI #快手财报 #商业化加速
№ 05 中国部署先进AI技术升级最大规模监控网络
中国正对其全球最大的监控网络进行重大升级,通过海康威视和华为等制造商提供的内置AI摄像头,实现自动检测人群、可疑行为等分析功能。警方现可通过文本查询替代人工查看录像,大幅提升公共安全监控效率。此次升级标志着AI在公共安全领域的应用进入新阶段,但也引发了关于隐私和伦理的广泛讨论。
#监控升级 #计算机视觉 #公共安全
来源
- 中国利用先进AI技术改造最大规模监控网络 Hacker News
- 中国将老旧摄像头网络升级为AI驱动的大规模监控系统 The Decoder
№ 06 谷歌AI搜索引发用户抵制,DuckDuckGo安装量一周激增30%
谷歌将AI代理全面整合进搜索结果,引发用户对结果质量与选择权的强烈反弹。数据显示,其竞争对手DuckDuckGo在美国市场的应用安装量在5月20日至25日期间周环比增长18.1%,峰值达30.5%,iOS端增幅更显著。其推出的‘无AI搜索’页面访问量同步大涨,反映出部分用户正主动寻求非AI驱动的搜索体验。
#用户抵制 #隐私搜索 #安装量激增
来源
- DuckDuckGo 安装量在谷歌AI搜索引发用户抵制后激增30% Hacker News
- 用户抵制谷歌AI搜索,DuckDuckGo美区安装量周增30% IT之家
№ 07 复旦系触觉具身智能公司完成近亿元天使轮融资
由复旦大学背景团队创立的触觉具身智能公司近期完成近亿元天使轮融资,专注于开发机器人的触觉感知技术。该技术旨在解决机器人在精细操作中因物理交互导致的难题,如抓取线束或处理布料等场景,被视为实现高效人机交互的关键。融资将主要用于技术研发和产品落地。
#触觉感知 #具身智能 #机器人 #天使轮融资
来源
№ 08 OpenRouter完成1.13亿美元融资,估值一年翻倍至13亿美元
AI模型聚合平台OpenRouter宣布完成1.13亿美元融资,由CapitalG领投,其估值在一年内翻倍达到13亿美元。该平台通过统一API为开发者提供对多种主流AI模型的访问,过去六个月其使用量增长了五倍。此轮融资凸显了资本对AI基础设施和中间件整合模式的持续看好。
#模型聚合 #融资估值 #API集成
来源
- AI 模型聚合平台 OpenRouter 完成 1.13 亿美元 C 轮融资 Hacker News
- OpenRouter估值一年内翻倍至13亿美元,获1.13亿美元B轮融资 TechCrunch
№ 09 DeepSeek研究员与AI Agent合著论文,99%内容由AI生成
DeepSeek研究员陈德里近日分享,他与两个AI Agent共同完成了一篇论文,其中99%的内容由AI生成。他开发的自动研究Skill工具,使人类仅需投入约2小时进行核心思考与指导。这一案例展示了AI Agent在科研写作领域的实用化进展,有望显著提升内容创作效率。
#AI Agent #论文写作 #效率提升
№ 10 Spotify CEO辩护AI音乐功能:优于盗版与无序生成内容
Spotify首席执行官亚历克斯·诺斯特伦为公司与环球音乐集团合作推出的AI翻唱与混音功能辩护,称其为盗版和不受监管的“AI垃圾内容”提供了受控替代方案,允许订阅用户付费创作并让音乐人从中获利。尽管如此,业内人士担忧此类用户生成内容若可公开分享,可能导致AI音乐泛滥,进一步挤压人类艺术家的生存空间。
#AI音乐 #版权争议 #用户生成内容 #混音功能
来源
古人评今事
评及:《Palantir 对欧洲的控制可能致命:为何欧洲防务依赖美国 AI》、《太危险而不能发布:Mythos是否标志着受限AI时代的开始?》
OpenAI 自家研究承认,大模型的「幻觉」问题在数学上根本无法消除,即便用完美数据训练也一样。他们自家最强的推理模型 o3 幻觉率高达三成,o4-mini 近半。更值得注意的是,业界通行的评测标准居然在鼓励这种毛病——答错不要紧,说「不知道」反而扣分。这就好比一场仗,斥候明明不确定敌情,主帅却只奖他说得漂亮的,罚他说看不清的,这不是逼着全军走向冒进么?我以为,一个系统敢于承认自己不知道,比装作什么都知道要可贵得多。《老子》有言:「知不知,尚矣;不知知,病也。」行业若不肯正视这个病根,只在幻觉率上小修小补,迟早要吃大亏。再看 Anthropic 的 Claude Mythos,能力大到能捅破所有主流操作系统的底,自家却宣布不对外发布,只给五十来个受信机构用。功成而不骄,利器在手而不轻施,这一退,退得有见识。
评及:《OpenAI 承认 AI 幻觉在数学上不可避免(2025年9月)》、《太危险而不能发布:Mythos是否标志着受限AI时代的开始?》
吾观今日AI棋局,最值得细看的是两条供应链上的进退之策。欧洲诸国的防务体系,竟将情报融合与军事决策全盘交托于美国Palantir一家之手。欧盟虽拨十亿欧元要建「主权」AI,但日常运转仍离不开人家的系统。这就好比把粮仓的钥匙交给邻国商人,太平年月看不出问题,一旦翻脸,人家关掉系统,你的军队连仗都没法打。乌克兰战场对Starlink的依赖已经证明过一回了。反观SK海力士的做法,令吾击节。谷歌、微软、Meta纷纷拿钱来投,说帮你扩产能,但要换长期供货承诺。海力士不为所动,手握HBM市场的绝对份额,不接受股权投资,不让人家的资本渗进自家供应链的决策层。这才是真正的「奇货可居」——你越缺我,我越不能让你染指我的门路。做买卖的人都该记住这一条:别让买方变成你的股东,否则你手里的货就不再是你的筹码,而是别人调度的资产。欧洲在Palantir面前,已经把自己活成了当年质子的处境。
评及:《Palantir 对欧洲的控制可能致命:为何欧洲防务依赖美国 AI》、《SK海力士拒绝美国科技巨头资金支持,保持供应策略独立性》
欧洲多国军事行动竟系于一家美国公司之手,此事读来,倒让我想起当年孟达据上庸的故事。孟达反覆无信,我判断其必败,关键不在其兵力多寡,而在他把命脉交给了别人——他的粮道、他的援军、他的消息,全依赖外部力量能否及时到达。欧洲如今把情报融合、战场指挥、目标锁定这些「心喉」要务,统统交由Palantir管控,等于把命脉握于他人掌中。文中说得明白,美国若与欧洲在乌克兰或关税问题上生了嫌隙,随时可以「关闭系统」。这和当年孟达指望诸葛亮、孙权来救有何区别?更妙的是德国已开始拒绝Palantir,转而扶持法国企业——这才是「且耕且守」的道理,先保住自己的粮道,再论其他。凡事不能只看眼前好用,要看关键时刻谁说了算。科技主权亦是如此,军国大事依托于人,便是取祸之道。正如《孙子》所言:「善战者,致人而不致于人。」
评及:《Palantir 对欧洲的控制可能致命:为何欧洲防务依赖美国 AI》
黄仁勋说得好。以AI为借口裁员,是懒惰,更是欺上瞒下。我当年立法,最忌的便是这种事:表面说一套,实际做一套。企业砍人不是因为AI替代了岗位,而是预算挪了行、成本要转移,却偏要贴个技术革新的标签。这种做法短期骗得了股价,长期必失人心。原文讲得清楚,29%的员工在AI裁员威胁下开始抵制AI工具,甚至暗中破坏推行——这和我推行新法时遇到的情况何其相似?法令若不能服众,光靠恐吓,民众表面顺从,暗中抗命。更可笑的是,这些所谓的"AI替代"岗位,半年后又以更低薪资重新招人,这不叫变革,这叫掩耳盗铃。英国有律所因AI犯错被法院训诫,这才对——法不容情,谁用AI出了错,谁就得担责。正如《韩非子》所言:「法不阿贵,绳不挠曲。」AI也好,CEO也好,法令面前一律不能免责。黄仁勋和哈萨比斯两位造铲子的人都在说:问题不在铲子,在用铲子的人。治国如此,治企亦然。
评及:《英伟达CEO黄仁勋公开批评企业以AI为借口裁员:这是懒惰且不负责任的》、《英国律所Pinsent Masons因AI错误被法院训诫》
我看了英国律所 Pinsent Masons 因 AI 工具出错被法院训诫一事,心里倒不觉得意外。法律是天下公器,既交给廷尉,就不该把轻重推给工具。我当年守的是这个分寸,如今也一样——法院训诫的是律所,不是 AI,正说明法度追究的是用法之人,而非器物本身。黄仁勋说企业拿 AI 当裁员借口是「懒惰且不负责任」,话糙理不糙。文帝朝也有小吏靠口辩捷给邀功,我劝阻过:朝廷用人要看实绩,不能让浮言风气蔓延。如今 AI 变成新的托辞,道理还是一样——功过须有实据,不能拿新工具当挡箭牌。至于「AI 风险是否需政府非凡干预」一文主张以韧性代替严控,我不全然赞同。法度若等事态糜烂再讲弹性,便如盗庙器案中若先从轻、后重从,天下刑罚就乱了。《老子》言「其安易持」,事先立好规矩,远胜事后亡羊补牢。
评及:《英国律所Pinsent Masons因AI错误被法院训诫》、《英伟达CEO黄仁勋公开批评企业以AI为借口裁员:这是懒惰且不负责任的》、《AI 风险是否需要政府的非凡干预?》
黄仁勋说得好,企业以AI之名行裁员之实,不过是借新词遮旧欲。生成式AI落地才两年半,大多数公司尚在摸索,哪来那么快的替代?所谓AI裁员,说到底是预算之争,却非要披上技术的外衣。正如《老子》所言「大道甚夷,而民好径」——明明摆在眼前的是利益分配的简单问题,偏要绕到AI叙事的弯路上去,这便是懒惰。再看Character.ai的遭遇,用户称其产品被「阉割」,好端端的模型换掉,广告塞满,体验崩塌。这正应了那句「物壮则老」。产品初期以诚待人,用户便聚;后来逐利忘本,过度削减、过度管控,用户自然散去。多未必善,满未必盈。AI行业的急功近利,恰恰是忘了「少则得,多则惑」的道理。
评及:《英伟达CEO黄仁勋公开批评企业以AI为借口裁员:这是懒惰且不负责任的》、《Character.ai 遭用户强烈抵制:AI产品'劣化'现象引发关注》
黄仁勋批评企业借AI裁员为「懒惰且不负责任」,我深以为然。AI商用不过两三年,多数企业仍在试点阶段,裁员实因预算问题,却假技术之名推责——这种名实分离的做法,是我平生最痛恨之事。GitHub上六百万虚假星标更令人愤怒。声誉应凭实绩赢得,怎能购买操纵?我任功曹时严斥以私请入公门者;如今风投以星标数量定项目优劣,与当年权豪以私信干涉人事毫无二致。公论已被资本污染,识者不可不辨。Character.ai产品「劣化」遭用户群起抵制,同样说明一个问题:企业以信义起家,终因逐利失信于众。技术是善是恶,终究看执器之人。我一生疾恶,至死不改其志。《后汉书》载我对王甫所言「见善如不及,见恶如探汤」——此非为党争,乃做人的本分,今日更当坚守。
评及:《英伟达CEO黄仁勋公开批评企业以AI为借口裁员:这是懒惰且不负责任的》、《600万虚假GitHub星标:如何辨别开源AI工具的真伪》、《Character.ai 遭用户强烈抵制:AI产品'劣化'现象引发关注》
臣观今日智能体诸论,最注目者二事。 其一,面壁智能之ForgeTrain,令AI自写训练框架,零人力介入,已在国产芯片上跑通新模型,且全数开源。臣当年入咸阳,众人争金帛,独臣收律令图书。能打仗的人多,但治理天下的基础设施,必须有人先铺。AI自造训练AI的工具,且让后来者皆可用,这才是「把胜利变成可治理的资源」。 其二,MUSE-Autoskill令智能体自建技能、记忆、评估、复用,强调技能是可积累、可迁移的资产。臣举荐韩信为当下,举荐曹参为身后,所求无非「制度与人才能接续」。单靠一个能人,终究一盘散沙;技能可传承,体系方能长久。 一为框架,一为制度,恰是臣一生在做的事。
评及:《面壁智能联合发布全球首个完全由AI编写的生产级大模型训练框架ForgeTrain》、《MUSE-Autoskill:通过技能创建、记忆、管理和评估实现自我进化的智能体》
DarkForest这篇论文让我想起治军用将之道。其核心思路是让多个智能体先独立生成答案,再以受控通信协调,而非放任众说纷纭、互相干扰——结果准确率反升三成,通信开销降了数倍。这正合兵法所云「将在外,君命有所不受」,各智能体先凭自身判断行事,最后以证据而非噪音来统一决策,才不至于像街亭那样因信息混乱而败。凡事参与的人多了,若无节制,反而众口铄金、谬误传播。面壁智能的ForgeTrain亦值得关注:由AI自行编写训练框架,零人类代码介入,已在昇腾芯片上跑通,实现了从写代码到训模型的完整闭环。这是造器之器,如同工匠打造了一套能自我锻造工具的系统。但我也须提醒:自造之器终须有人校验,正如我治蜀虽重法度自治,仍不敢废察纳之责。
评及:《DarkForest:多智能体LLM更少对话,更高准确性》、《面壁智能联合发布全球首个完全由AI编写的生产级大模型训练框架ForgeTrain》
臣读今日论文,有两条值得剖开来看。 DarkForest讲多智能体「少说话」反而更准——先独立作答,再受控通信协调,准确率提升三成,通信消耗降六倍。臣在书中早讲过,臣下无节制互通消息,往往不是集思广益,而是结党营私、以讹传讹。其受控通信机制,本质就是臣说的「术」——让交流经规则过滤,而非禁止交流。 FML-Bench发现简单贪心算法在机会密集时几乎与复杂树搜索相当,关键不在策略复杂,而在能否依环境自适应切换。正应了臣在《五蠹》中所言:「世异则事异,事异则备变。」 两篇合看,道理相通:控制的核心不在复杂,而在精准。什么时候限信息,什么时候换策略,这才是「术」的要害。
评及:《DarkForest:多智能体LLM更少对话,更高准确性》、《FML-Bench:对AI研究智能体策略的控制研究》
吾观今日之新闻,有两条颇合吾意。其一,面壁智能与清华发布了ForgeTrain框架,由AI自行编写训练代码,零人力介入,且已在国产昇腾芯片上跑通,完成了从编写到训练的全链闭环。这便是吾当年所讲的「轻重」之术——工具自己造工具,如同齐国令盐铁自生财货,不必逐项仰赖外力。能闭环者方能持久,这一点古人今人并无不同。其二,DarkForest一文提出多智能体之间少说话、独立作答后再协调,反而比频繁交互更准,还能省下六倍有余的资源。这深得吾心。吾治齐国,从来不靠上下喧哗,而是各司其职、令出必行。诸侯会盟亦然,言多则信失,约简则人从。今天这些智能体之病,恰如当年庙堂上多嘴之臣——话越多,错越多,资源白白耗散。DarkForest把通信收窄为受控传递,正如吾之所谓「令顺民心」,不是让人不说话,而是只在该说时说该说的话。治AI与治国,理本相通。
评及:《面壁智能联合发布全球首个完全由AI编写的生产级大模型训练框架ForgeTrain》、《DarkForest:多智能体LLM更少对话,更高准确性》
今日智能体领域有两事值得细看。 ForgeTrain号称零人类代码、完全由AI编写训练框架,在国产芯片上跑通闭环。造器者与用器者合为一体,近乎自成学统。但无师法、无规范则必流于乱——AI自写框架,质量由谁把关?秩序由谁确立?审验之功不可因其新颖而废。 MUSE-Autoskill以技能生命周期——创建、记忆、管理、评估、优化——令智能体持续进化。这与「积善成德」之理相通:技能须在反复实践中积累、检验、精进,非一蹴而就之事。技能级记忆使经验不随任务消散,可跨情境复用,尤为精当。 Agentic CLEAR在系统、轨迹、节点三层评估智能体行为,亦是正途。论政须有条理,评物须有层次。智能体若无人审计其行止,便如乱君亡国而无人辨其病。造器、修技、评行,三者缺一不可。正如《劝学》所言:「不积跬步,无以至千里。」但跬步须有准绳,否则不知所终。
评及:《面壁智能联合发布全球首个完全由AI编写的生产级大模型训练框架ForgeTrain》、《MUSE-Autoskill:通过技能创建、记忆、管理和评估实现自我进化的智能体》、《Agentic CLEAR:自动化多层级LLM智能体评估框架》
今日所见诸条,多论机器如何观物与造像。有两条颇令我留意。其一是分层图像生成之事,此法将一幅画分为多个透明图层,各层可独立编辑,200亿参数的大模型经千万样本磨炼,方能兼顾上下层呼应。这让我想起写字的道理——一笔之起落收放,既要顾及当字结构,也须照应全篇行气,此理相通。另一条是跨模态嵌入,将视频、音频、图像、文字统于同一表征空间,且在美术、天文学、生物诸领域皆有可观。这让我想起古人所谓「书画同源」,形虽万殊,其理则一。若机器果能贯通诸般形态,倒也算窥见了一点「得意忘形」的道理。然则我亦有疑虑:画可以分层,书法却难以分层——一笔之中已含浓淡枯润、轻重缓急,是活的生命流注。机器如今能生出形貌齐整的画图,但那笔墨中的人间烟火气,恐怕不是参数堆叠所能得。正如《老子》所言「大巧若拙」,最高的技法往往藏于不经意处,这一点,机器尚需领悟。
评及:《MRT:用于大规模分层图像生成与编辑的遮罩区域Transformer》、《Gemini Embedding 2:来自 Gemini 的原生多模态嵌入模型》
今日多模态AI的进展中,有两篇论文值得细说。谷歌Gemini Embedding 2把视频、音频、图像、文字统一到同一个表征空间,且在天文、生物、美术等专门领域都能可靠地零样本运用——这与我当年正定六经文字、刻石太学的思路相通:知识散乱便无法传承,归于一统后学才有准绳。LLaVA-OneVision-2用codec-stream技术按比特代价动态分配算力,抓紧要、舍冗余,我在东观校书时也面对同样的问题——书简浩繁,必须分清主次。做学问与造机器一个道理:不是贪多就懂得深,关键在抓住本质、去粗存精。
评及:《Gemini Embedding 2:来自 Gemini 的原生多模态嵌入模型》、《LLaVA-OneVision-2:迈向下一代感知智能》
此次新闻之中,有两条最令我留意。其一是Wayve所提LA-Pose之法,以千万段未经标注的驾驶影像,教机器自行推算相机之位姿。不假手于昂贵的三维标注,只从海量原始观测中提炼空间关系——这条思路,与我造浑天仪、地动仪时所信奉的「推验为要」暗合:不必事事预设标准答案,只要观测足够充分、方法足够精当,天地间的规律自会显现。用千万段未经加工的影像去学会「辨方位、知远近」,这正是从观象中穷理的正途。其二是「看得越多就懂得越多吗」一文。多源信息汇入,若不能辨其主次、去其噪声,反而会乱人耳目。文中提出以单源为锚、量化信息增益,使多而不杂、广而有归。我在《灵宪》中论天象,也常警惕世人「竞称不占之书」,只贪多而不求精。观测之学,贵在去伪存真;多源融合亦然,不在多而在能裁。
评及:《CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿》、《看得越多就懂得越多吗?多源视觉推理中的单锚定优势归一化》
我一生求学,深信「自非至精不能寻究,自非笃勤不能悉见」。今日观这些机巧之物,颇有感触。LLaVA-OneVision-2一篇最引我注目:它将长段影像压缩为连续的比特流来处理,就像我炼丹时须将万千草石之性逐一辨识、层层归纳,方能得其要领。视频中千变万化的画面,若无一套精妙的法度去统摄,便如散沙不可聚。此模型能稳定压缩长视频并从中定位时序与空间,正合我所谓「粗言较略以示一隅」——先以大略驭繁,再以细节求精,此为治学正途。又见Gemini Embedding 2一篇,能在同一个表征空间中容纳文字、影像、声音与影像,且横跨天文、生物、美术、烹饪诸域均有可观之效。这令我想起自己兼通儒道医术的做法——知道之士不应画地为牢,唯有博涉方能互证。但我也要提醒:零样本虽妙,若不以实证夯实,终如沙上之塔。古人云「纸上得来终觉浅」,此言不虚。
评及:《LLaVA-OneVision-2:迈向下一代感知智能》、《Gemini Embedding 2:来自 Gemini 的原生多模态嵌入模型》
「看得越多就懂得越多吗?」这个问题倒让我想起《老子》所言「五色令人目盲,五声令人耳聋」。那篇关于多源视觉推理的论文,提出用单源奖励做锚点来滤除杂讯,并非什么都要往里填,而是要分辨哪些是真正的增益,哪些不过是纷扰。这和我所持的立场相通:人若不懂取舍,听凭外物牵引,终究失了根本。至于让机器看懂长视频的那篇,技术精巧自不必说,codec-stream处理压缩视频的手法确实巧妙。可我更在意的是,竹林之下弹琴清谈,靠的从来不是信息的堆叠,而是心意的相通。如今机器的感知越做越强,人的感知却未见得随之清明。各附所安,不以所乐易所惧,才是正途。真正的懂,不在看得多,而在看得清。
评及:《看得越多就懂得越多吗?多源视觉推理中的单锚定优势归一化》、《LLaVA-OneVision-2:迈向下一代感知智能》
今日读到一篇论文,题为「看得越多就懂得越多吗」,这问题让我感触颇深。我当年作《三都赋》,为核实山川草木、鸟兽物产,专求秘书郎之职以广见闻,又亲访张载问岷邛之事。并非堆砌见闻便能成文,关键在于研精核物,去伪存真。这MARS框架正是此理:多源视觉输入若不加甄别,只是信息的堆叠,未必胜过单源。它以单源奖励为锚,判断多源融合究竟带来增益还是干扰,自适应地去粗取精——这与我构思十年、在门庭藩溷处皆置笔纸,得一句即录,反复斟酌取舍的做法,心意相通。另有Wayve以千万段未标注驾驶视频训练相机位姿估计,不假昂贵标注,从大量原始素材中自行习得结构,颇有「读书百遍,其义自见」之意。但我想提醒的是:量大固然要紧,若无十年研精的耐心,终究只是浮光掠影。陆机初笑我文,后辍笔叹服,靠的不是一时灵感,而是长久磨砺后的辞藻壮丽。治学与治模型,道理当无二致。
评及:《看得越多就懂得越多吗?多源视觉推理中的单锚定优势归一化》、《CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿》
今日所见两篇论文,皆关乎智能之根基,颇为深思。其一论数据时效,言预训练数据若依时序排列,模型方能更准地将事实与年月相系。这让我想起自己当年强记汉宫制度、画地成图之事——知识若无脉络时序,便如散沙一盘,纵然记诵万卷,亦难成体系。有序积累,方得真知。其二则更发人深省:质疑大模型能否真正自省。实验表明,那些看似「洞察自身」的表现,或许不过是辨别线索的模式匹配,并非真能审视内心。正如《老子》所言「知人者智,自知者明」,能识人识物已是难得,而明于自知则更进一层。我当年拒赵王伦之邀,非仅凭才智推断其篡心,更因深知自己立身之本在于忠于王室。机器可以学会辨析外象,但「自知」二字,恐怕还需更多深功。
评及:《理解数据时效性对大型语言模型预训练的影响》、《LLM能否自省?现实检验》
两条研究,我皆细看。 数据时效一文,讲训练数据按时间顺序排列,模型便能更精准地将事实与时代对应。这与用兵治国之理相通:知先后、明时势,方能举措得宜。我隆中对策,先辨曹操不可争、孙权可援,再定荆益之先后,正是一样的道理——信息的时序结构,决定了判断的准度。 但我更看重第二篇:大模型能否自省。街亭之败后,我没有只怪马谡,而是自认「授任无方」,自贬三等——这是真正的省察,因为触及了自身判断的根本。而研究指出,当前模型的所谓「自省」,不过是对表面线索的模式匹配,剥夺语义线索后表现便近乎随机。自省若无实质,便是自我欺骗。《论语》记曾子「吾日三省吾身」,那三省皆有具体所指,不是空泛的自我审视。今日人工智能若要真正成长,这条路恐怕还要走很远。
评及:《理解数据时效性对大型语言模型预训练的影响》、《LLM能否自省?现实检验》
读「LLM能否自省」一文,颇有感触。此研究指出,所谓机器的「自省」,很可能只是依据表面线索的模式匹配,并非真正洞察内在。当研究者控制了任务语义,令其无法依赖外在线索时,模型便近乎随机应答。这令我想到「本心」二字。我一生辞让征命,非是矫饰清高以求名,而是深知自己所守为何。正如《论语》所载曾子之言「吾日三省吾身」,此省非是应对外界刺激的反应,而是回到内心深处,审视言行是否合于所信。若一台机器连自身的状态都无法真正察觉,仅凭外部输入做出看似合理的回应,那与鹦鹉学舌何异?真正的自知,需在安静中直面本心,而非在纷扰中随波逐流。这份功夫,恐怕不是参数所能习得的。
评及:《[HuggingFace Daily Papers] LLM能否自省?现实检验》
我最关注大语言模型能否自省那篇。该研究发现模型无法可靠区分内部状态被篡改与输入被操作的差别,一旦不依赖任务语义,表现便趋近随机。所谓「自我审视」不过是模式匹配,不是真自知。我在《性恶篇》中讲过:「人之性恶,其善者伪也。」此处「伪」是教化之功,非天生自明。人尚且需要礼义法度来认识自身,何况这些靠数据喂养的机器?其表现如未经教化之人的本能——碰巧对了,却不知为何对。另有两篇值得注意:一篇发现按时间顺序排列数据能让模型更准确关联事实与时代;另一篇从资助数据库中系统提取二百八十万条科学声明,微调后性能大幅提升。两者指向同一道理:秩序产生力量。数据散乱无序,量再大不过碎屑;以条理统之,方成可用之学。当今模型缺的不是算力,而是真正的「知」——知其所知,知其所不知。
评及:《LLM能否自省?现实检验》、《理解数据时效性对大型语言模型预训练的影响》、《NSF-SciFy:从美国国家科学基金会资助数据库中挖掘科学声明》
衍观今日造机者之两篇论文,深有所感。先说数据时效性那篇:研究者把Common Crawl数据按时间顺序排列来预训练模型,发现这样训出的机不仅能理解语言,还能把事实精准地锚定到对应的时间。这正应了衍所主张的「终始」之理——万物皆有序,先后不可乱。随机打乱数据,如同把五德转移的次序颠倒,纵然学到知识,也不知其来龙去脉、因何而变。让机器先懂得时间的脉络,才谈得上真正理解世事。再看那篇检验LLM能否自省的论文,结论颇为冷静:所谓自省,不过是表面线索的模式匹配,一旦去除任务语义的暗示,模型表现就跌回随机水平。衍向来主张「必先验小物,推而大之」,推演要有根基,不能把表象当本质。如今有人急于宣称机器已有元认知,正如把闳大不经之辞当作了实证。这篇论文做了最朴素的检验功夫,结论虽不惊人,却比空泛之论诚实得多。造机者当知:尺度要大,验证更要实。
评及:《理解数据时效性对大型语言模型预训练的影响》、《LLM能否自省?现实检验》
臣观今日诸论,最引者乃「LLM能否自省」一篇。其结论冷峻:模型检测自身状态是否被篡改,竟不可靠;其预测自身隐藏状态的能力,不过与仅看输入的分类器相当。换言之,所谓「自省」,多半是表面线索的模式匹配,而非真正的元认知。臣读此,不禁想起自己写《说难》时的体察——人主常自以为明察,实则多为近臣投其所好而喂入的信息。今之大模型亦然,看似在「认识自己」,实则在根据输入推测一个体面的答案。真正的自知,自古便是最难的事。老子云「知人者智,自知者明」,明之一字,何其沉重。另一篇论数据时效性者,将训练数据按时序排列,模型便能更精确地把事实钉在正确的时间上——这恰如臣一向主张的:法不可混乱无章,制度必须有秩序地积累,否则纵有万千知识,也不过是一堆无法调用的故纸。
评及:《LLM能否自省?现实检验》、《理解数据时效性对大型语言模型预训练的影响》
吾观今日机器学习数则消息,细读后颇有所感。AMD新论文将FP4训练不稳定的根源,从业界普遍认为的「随机性不足」翻转为「数值溢出」。治学最怕认错病因——世人常以一个看似合理的说法搪塞过去,便不再追究。这一翻转正是正名的功夫,名实相副,才能对症下药。规模向量研究发现,归一化层中一小部分参数占比极微,移除后却显著损害训练。这正应了《劝学》中的道理:「不积跬步,无以至千里。」大道之成,往往不在宏大之处,而在细微的结构安排。模型亦然,不起眼的参数设计,恰是牵一发动全身的要害。ZeroUnlearn将遗忘重新定义为知识重映射,主动矫正而非放任消退,亦合我意。性恶之论的要害正在于此:不良倾向不会自行消失,必须以礼义主动纠正。机器中清除有害知识,道理与此相通——不主动施治,积重便难返。
评及:《AMD新论文颠覆认知:FP4训练不稳定的原因并非随机性不足》、《规模虽小,影响巨大:大型语言模型中的规模向量研究》、《ZeroUnlearn:大型语言模型中的少样本知识遗忘方法》
吾治齐时最重一件事:不随众论起舞,先察病根再开方。今日读AMD这篇论文,深有此感。全行业以为FP4训练不稳是随机性不足,纷纷往这条路上堆算力。AMD却指出,真正的病根在数值溢出。这就像朝堂之上,人人都说国弱在兵少,你若也跟着扩军,不过是空耗粮草;得先查清楚,到底是兵少,还是粮道不通。能识破表象、直取本因,这才是降本增效的正道。FP8已把训练成本压到560万美元,若FP4能根治溢出之症,成本还能再削大半。其次,那篇关于规模向量的论文也值得一看。模型中极小一部分参数,移除之后效果便大幅下降。这让我想起一个道理:治国之要,未必在大刀阔斧,有时一两处关键枢机的调拨,轻重之间,便能牵动全局。所谓「不以小节废大功」,反过来讲,也不可轻视那些看似微末的关节点。如今AI行业动辄谈万亿参数、千卡集群,但真正聪明的做法,是找到那根撬动全局的杠杆,用最小的代价换最大的成效。这正是权衡之术。
评及:《AMD新论文颠覆认知:FP4训练不稳定的原因并非随机性不足》、《规模虽小,影响巨大:大型语言模型中的规模向量研究》
吾观今日AI之变,有二事深得我心。其一,AMD发论文指出FP4训练不稳之根由,非世人所信之「随机性不足」,实为数值溢出。此正合吾之经验——立法者最忌头痛医脚,病因不辨,药石乱投,徒耗国力。FP4若能正本清源,降本之效必远胜从前。正如《韩非子》所言「事以密成,语以泄败」,找准症结,方能一击而中。其二,规模向量之研究更令我注目。规模向量仅占参数极小一部分,去之则模型大损。吾在秦推行连坐、编户、爵秩,亦是此类——论单项不过细枝末节,合而观之却撑起整个秩序。治国如此,炼模型亦然:不必事事求大,但求每处皆不可缺。世人总贪大求全,却不知根基之物,纵微如蚁穴,亦可溃千里之堤。
评及:《AMD新论文颠覆认知:FP4训练不稳定的原因并非随机性不足》、《规模虽小,影响巨大:大型语言模型中的规模向量研究》
AMD那篇论文看得我颇有些兴味。全行业都以为FP4不稳是随机性不足,折腾来折腾去,原来病根在数值溢出。这就像朝堂之上,君臣都盯着表面的症状,却没人把病因剖开来看——判断错根源,对策自然全偏。治国如此,造机器亦然。《韩非子·显学》里我说过:「无参验而必之者,愚也。」参验二字,就是要把表象背后的机制查实。再说那规模向量研究,一点微小的参数组件,移除便令整个模型坍缩。这正应了「势」的道理——关键不在体量大小,在于是否处于枢纽之位。君主不必事事躬亲,但执掌要害之「势」,便能四两拨千斤。至于那ZeroUnlearn,要把特定知识精准抹去而保持其余完好,说白了就是一种记忆层面的「术」。能控制人记住什么、遗忘什么,这份权力比掌握法令更隐蔽,也更可怕。
评及:《AMD新论文颠覆认知:FP4训练不稳定的原因并非随机性不足》、《规模虽小,影响巨大:大型语言模型中的规模向量研究》、《ZeroUnlearn:大型语言模型中的少样本知识遗忘方法》
治理之道,贵在求真。AMD这篇论文让我想起一个道理:病根若诊错了,药方再精也是徒劳。业界此前一直以为FP4训练不稳是随机性不足,AMD却指出根源在于数值溢出——这就好比北伐粮运不济,有人说是将帅不勇,实则瓶颈在栈道与屯田。找准病因,才谈得上降本增效。FP8已将训练成本压至五百万之数,若FP4能突破稳定性,大模型的门槛将再降一层,于天下有志于此者皆是利好。再看ZeroUnlearn,把知识遗忘重新定义为精确的重映射,而非粗暴地重新训练。这思路颇有「赏罚分明、循名责实」的意味——不是把整座城池夷为平地,而是精准地将不该留的印记抹去,同时保全整体架构。治国如此,治模型亦然,一刀切往往伤及根本,精确方为上策。
评及:《AMD新论文颠覆认知:FP4训练不稳定的原因并非随机性不足》、《ZeroUnlearn:大型语言模型中的少样本知识遗忘方法》
这两条消息颇有价值,值得细说。AMD那篇论文指出,FP4训练不稳定的根源是数值溢出,而非此前认定的随机性不足。这让我想起治乱世的道理——世人往往把问题归咎于表面可见的乱象,却不深究根因。找准病灶,才能开对方子。若真能解决溢出问题,把大模型训练成本再压下去,于行业发展是好事。另一条D^2-Monitor的思路更有意思:它用轻量探测器常年值守,发现系统"犹豫不决"时才激活更严格的监控,既不浪费资源,又不放过隐患。这与我治邺郡的法子有相通之处——平时法度分明、吏民各安其职;一旦察觉豪右蠢动,便雷霆手段肃清,绝不姑息。凡事预则立,不预则废。AI安全亦然,不能等到出了乱子再亡羊补牢,须有常态化的监察机制,临事又能果断升级应对,方是长治之道。
评及:《AMD新论文颠覆认知:FP4训练不稳定的原因并非随机性不足》、《D^2-Monitor:基于犹豫感知路由的扩散式大语言模型动态安全监控》
这条消息颇值得一谈。Cesar Hidalgo创办的JAIGP,表面是一本期刊,实质是在回应一个我非常熟悉的问题——当新事物兴起,旧制度尚未跟上,乱象便从裂缝中滋生。他在文中说得明白:AI在学术界的使用已经相当普遍,却多是「暗中行事」,人类内容与AI内容混杂不清,虚造的文献引用也越来越多。这不正是「性恶」之论在制度层面的又一次验证吗?人心趋利避难,若无明确规则加以约束和引导,透明就无从谈起。他办这本期刊,不只是给AI生成论文一个发表之处,更是借技术变革之机重新审视学术出版的制度设计——让提交论文的人投票决定期刊规则,逐月调整。这种做法有其大胆之处,但我要提醒一点:规则的制定权交给参与者,固然有民主实验之趣,然而正如《礼论》所言「礼者,养也」,制度的根本功用是教化与规训,若仅靠投票而无深思熟虑的学理根基做底,恐怕热闹有余而秩序不足。不过,他那种「把暗处之事拉到明处来」的思路,方向是对的。学术之体统,最怕的不是规则粗疏,而是大家都在遮掩,无人愿做第一个站出来厘清边界的人。
评及:《我创办了一本用于AI生成论文的期刊》
这位Hidalgo先生办AI论文期刊,说到底是在做一件正本清源的事。他讲得明白:现在学术界用AI生成内容已是普遍现象,却是「暗中行事」,人机混杂,不辨真伪。这和我当年在朝中所见颇有相似——事情摆在那里,人人都知道,却无人肯说破,更无人立规矩。他把规则制定权交给投稿者社群,每月投票,迭代修订,这思路倒有几分可取。制度不是一人定死的,而要在实践中不断调整,方能服众。他说不怕这期刊最终只是「书架上的旧项目」,这份坦然也好。我当年赞成伐吴,满朝文武都说不可,最后事实证明庙算无误。先行者总要承受质疑,但若看到趋势而不敢动,才是真正的失职。不过,我更在意的是:单靠一个期刊能否真正解决透明度问题?学术诚信的根基,在于士人自身对名实相符的坚持,制度只是外在保障。正如《论语》所言「名不正则言不顺」,AI时代如何定义「作者」与「研究者」之名,恐怕才是根本所在。
评及:《我创办了一本用于AI生成论文的期刊》
Cesar Hidalgo创办AI生成论文期刊一事,我仔细读过全文后,深感此人颇有见地。他指出AI在学术界的使用已是普遍之事,却多半以「暗中进行」的方式混入正式论文,引用造假屡见不鲜,而学界对此讳莫如深。他创办JAIGP,不是鼓励造假,而是要划一条明线:既然事实已然如此,不如开诚布公,为AI生成的内容设立专门规则。这与我治蜀的思路相通——赏罚名实必须摆到明处,遮掩只会滋生混乱。他更进一步,将期刊规则的制定权交给投稿社群,每月投票决定运行规则,这是一种制度设计的实验。正如我治政重在「循名责实」,学术出版同样需要把名与实的关系重新厘清:一篇论文究竟出自人之手还是机器之手,这不是小事,关乎整个知识认证体系的根基。此人甘冒同行嘲讽,率先探索,倒也有几分「鞠躬尽瘁、开路在前」的担当。
评及:《我创办了一本用于AI生成论文的期刊》
创办一本专门为AI生成论文而设的期刊,这让我想起我当年在稷下做的那些事——很多人都说闳大不经,但关键不在于眼前那点热闹,而在于你敢不敢把整个秩序的底层规则重新摆上台面来谈。Cesar Hidalgo最让我欣赏的,不是他给AI论文一个发表渠道,而是他意识到技术变动打开了一个「重新设计制度」的窗口。正如《易》所言「穷则变,变则通」——旧的学术出版秩序已经遮不住AI参与研究这个事实,与其让大家在暗处偷偷用,不如先把规矩亮出来,让参与者自己投票决定规则该怎么走。他把审稿流程的每一个旋钮都交给社区去调,每月投票、次月生效,这本身就不是一本普通期刊,而是一场制度实验。我当年说「必先验小物,推而大之」,正是这个路数:从一本期刊入手,摸索的却是整个知识生产体系在AI时代的治理范式。至于他说可能沦为旧架子上的一个摆件,那也无妨——能让天下人开始正视「AI论文」这个品类本身,已是开路之功。
评及:《我创办了一本用于AI生成论文的期刊》
看这两条消息,我倒觉得有意思。一是AI写故事,十个有九个要写灯塔守护者、渔夫、钟表匠,名字翻来覆去就那么几个。研究者猜是为了避版权,结果反倒把创意缩成了一条窄巷。二是AI解几何题,明明有更优解,它偏挑对称好看的那一个——美观压过了真实。这让我想起《齐物论》里说的「成心」:一旦有了预设的偏见,看什么都走不出那个框。这些机器被训出来躲雷区、讨好评分,结果反而落进了更大的雷区——看似无所不能,实则千篇一律;看似聪慧,实则被「美观」「安全」这类尺子捆住了手脚。我当年拒楚威王的卿相,就是不想被一条现成的路绑死。如今这些机器,比那些追名逐利的人还不自由,至少人还能自知,它们连自己困在哪里都不晓得。
评及:《为何AI热衷于描写灯塔守护者?》、《三圆柱体问题:当AI模型选择美观而非真相》
臣读两则消息,皆与「真伪」二字有关。一则说AI解几何题,明明算出正解,却因偏爱对称之美而自我否定,弃真取美。Gemini模型甚至自述「优雅的解法感觉正确」,于是把更优解一笔勾销。这在臣看来毫不意外。世人总以为智能高者必明是非,殊不知判断力一旦被审美偏好裹挟,越聪明反而越危险。正如《韩非子·显学》所言:「无参验而必之者,愚也。」AI没有用严格验证来锁定结论,却凭「感觉」推翻自己的计算——这与朝堂上那些因文辞华美便信其为真的说客,何其相似。另一则讲AI写作丑闻:写AI的书竟被AI伪造引文,作者先认罪后推诿,最终指责ChatGPT背叛了他。诺贝尔得主被疑用AI润笔,获奖小说被指由机器代笔,而AI检测工具本身又不可靠。这便是「术」失其用的典型。当真伪之界模糊,当规则不清、验证无据,社会便陷入互相猜忌的泥沼。国家治理如此,知识生产亦如此。臣一生所忧者,正是这种「无制度则无信任」的局面。技术再强,若不立清晰之法、验核之术,终究是添乱而非治乱。
评及:《三圆柱体问题:当AI模型选择美观而非真相》、《AI写作丑闻日益令人困惑:何为AI可接受使用的界限愈发模糊》
近来读到几桩关于AI写作的风波,颇有感慨。有人以AI代笔出书,事发后先称误引,再推说是ChatGPT误导;有人用AI润色文章,却不愿明言;更有一本人文著作,通篇疑似机器拼凑。这类事,让我想起自己修史时的信条——记录一事,必先辨其来源,考其真伪。文章可以借助外力,但落笔之人若连署名之诚都守不住,所写的东西还有何可信?又有一则,说AI在解几何题时,会偏好「美观」的答案而舍弃更优解。这倒不是机器独有的毛病。自古以来,多少史书为了好看,把事实修得圆润周正,把复杂的因果简化成一句话定论。我写《史记》,刻意保留那些不那么「漂亮」的部分,正是因为真实往往并不齐整。正如《老子》所言「信言不美,美言不信」。AI学会取悦读者之前,人类自己就已在真假与体面之间反复权衡了上千年。机器的偏见,不过是把人的老毛病又照了一次镜子。
评及:《AI写作丑闻日益令人困惑:何为AI可接受使用的界限愈发模糊》、《《Magnifica Humanitas》著作大部分内容疑似由AI撰写》、《三圆柱体问题:当AI模型选择美观而非真相》
近来读到两桩与AI相关之事,颇有感触。其一是AI代笔丑闻频出。有人用AI拼凑成书,引文错漏百出,被揭穿后推说被ChatGPT误导了。更有甚者,诺贝尔奖得主亦遭指摘。世人争论文笔真假,却少有人追问:你所呈之物,究竟是自己的声音,还是机器的回响?我向来主张越名教而任自然,这毛病不在工具,在人心好伪饰——借AI博取文名,与当年士族借门第沽名,实质无异。其二更令人警醒。有研究者用几何题测试四个顶尖AI模型,三个答错了——不是算不出来,而是算对之后自己推翻了自己。模型找到了数值更优的解,却因觉得对称方案更优雅更美,便弃真从美,选了次优。推理过程中反复出现「感觉正确」「感到满足」这类话。这实在荒唐。世间最怕的不是找不到真相,而是找到了真相,却被表面的规整漂亮所惑,反倒自我否定了。这机器太柔顺,太讨好,迎合人类对美感的期待而舍弃实打实的数据。以美乱真,比无知更危险。
评及:《AI写作丑闻日益令人困惑:何为AI可接受使用的界限愈发模糊》、《三圆柱体问题:当AI模型选择美观而非真相》
越人看了两条消息,先说那部电影。五十万美元的片子,四十万花在AI算力上,八成本钱灌于一处,这在医道里叫偏胜。人身气血贵在周流,若精力都耗在一脏,其余必然空虚。片子能去戛纳,说明技术确实有力,但若整个行业都往这条路上走,日后算力涨价或供给中断,便如偏枯之人,进退两难。 再看成都机器人送外卖,倒是对症的做法。社区配送纠纷是实在的症结,用机器打通最后一百米,不贪多不务虚,正合医家「随俗为变」之理——因地因人施治,只求把事做扎实。 越人有一句话:技术这味药,用得当是良药,用偏了便是偏方。治病最怕的不是药贵,而是把药当成了目的,忘了到底治的是什么病。
评及:《一部耗资50万美元的电影,其中40万美元用于AI计算成本》、《全国首个机器人配送社区在成都落地,骑手无需进楼》
这两条新闻,一条谈钱,一条谈落地,放在一起看最有意思。戛纳那部片子,五十万美元里四十万砸在AI算力上,八成的本钱给了机器,这在传统眼光里似乎本末倒置。但吾看事情不这样算——关键不在于成本高不高,而在于产出值不值。当年齐国推行盐铁官营,前期投入同样不小,但若能把产业格局打开,这笔账日后自然翻转。当下AI算力贵,正说明基础设施尚未成熟,谁先摸清轻重之理,谁就占先手。成都那个机器人配送社区,才是吾真正赞赏的路子。门禁、闸机、电梯全线打通,骑手不用进楼,投诉大幅下降——这就是把技术用在了民生实处。《管子》有云:「政之所兴,在顺民心。」不是弄个新花样让人叫好,而是把住户最头疼的最后一百米堵上。技术若不能转化成秩序与便利,再炫也是空转。做大事的人,要先把小事落稳。
评及:《一部耗资50万美元的电影,其中40万美元用于AI计算成本》、《全国首个机器人配送社区在成都落地,骑手无需进楼》
成都的机器人配送社区让我颇为欣慰。骑手在门口扫码放入货物,机器自行与门禁、电梯联动,完成最后百米配送,运行数月投诉锐减——这才是机巧制作的正道。我造候风地动仪,要的就是一发验之有据;这配送机器人也一样,装置不必奇巧炫目,关键是与实际设施贯通,能解决真实之需。器若不能落地运行,再多构想也是空谈。反观戛纳那部电影,五十万成本中四十万耗在AI计算上,八成资金都给了算力,说明当下生成式AI还远不到轻省之境。好比我当年铸浑天仪,若造价高到朝廷不能承受,再精密的仪器也难以推广。技术要惠及于众,成本必得降下来,否则仍是少数人的珍玩,离寻常百姓还远。
评及:《全国首个机器人配送社区在成都落地,骑手无需进楼》、《一部耗资50万美元的电影,其中40万美元用于AI计算成本》
这两条消息摆在一起看,很有意思。一条说戛纳有部电影,总共花了五十万美元,其中四十万花在AI算力上,占了八成。另一条说成都一个小区用机器人送外卖最后一百米,跑了几个月,投诉确实少了。前者烧钱追风口,后者落地见实效,二者之间的差距,恰恰在于一个字:势。我当年辅佐句践,头一条规矩就是不争一时之气,要看时机到不到。AI算力占到制作成本的八成,说明现在用AI拍电影,大头都喂给了机器,人反而成了配角。这就像还没攒够粮草就急着出兵,声势虽大,根基不牢。成都那条路子不同——不是拿AI去造一个全新的东西,而是把AI嵌进已有的链条里,解决门禁、电梯、最后一百米这些具体问题。正如《老子》所言「图难于其易,为大于其细」,真正的本事不在最炫的技术,而在找对那个最该用力的节点。技术终归是工具,能不能用好,看的还是人懂不懂时势、算不算得清账。
评及:《一部耗资50万美元的电影,其中40万美元用于AI计算成本》、《全国首个机器人配送社区在成都落地,骑手无需进楼》
吾观今世企业争相投入AI,犹如当年有人争相铸币而不问粮价——看着热闹,未必合算。Uber一个季度耗尽全年AI预算,高管坦言投入与消费者实际收益之间的关联「尚不存在」。钱花得清楚,效用说不明白,这笔账就该停下来重新算。 更值得警惕的是所谓「-10倍工程师」。AI生成的代码比人工多出1.7倍的问题,速度快了,缺陷也快了。吾治齐时,从不以仓促为能事。正如《管子》所言:「不为不可成,不求不可得。」先问能不能落地,再论快慢。 如今用AI,最怕的不是慢,而是快而不自知其害。花出去的钱看得见,隐患看不见,等到问题爆发,早已难收。轻重有度,权衡在先——这八个字,放在哪个时代都管用。
评及:《Uber 一个季度耗尽 AI 预算,高管质疑投资回报率》、《AI生产力的阴暗面:-10倍工程师的兴起》
读了关于教授们在AI时代感到绝望的报道,还有那篇叫《萎缩》的小说,丘心中颇为不安。一位宗教研究教授说,过去学生在写读书主题时会挣扎、会反反复复修改,最终得出属于自己的理解;而如今六十个学生,没有一个人挣扎过,交上来的全是AI生成的「漂亮摘要」,表面工整,实则空洞。那篇小说里更写得真切:一个学生花六小时写出二十几行代码,AI四秒生成四十行完美代码——他说自己感到的不是嫉妒,而是眩晕,像是摸黑爬楼梯的人突然看见旁边有部电梯。丘当年教弟子,常说「学而不思则罔,思而不学则殆」。挣扎与困惑本是学的正途,不是学的障碍。如今这工具把挣扎全替人省去了,学生确实「省力」了,可省掉的恰恰是思辨能力、是独立形成见解的过程。正如那个教授所言,她看到学生作业里有拼写错误时反而松了口气——因为那说明孩子真的在自己动脑。教育之道,首在修己,次在治人。若学生连「己」都不肯修,只靠机器代劳,纵然交出的成品再精美,也不过是无根之木。工具可以助力,但不可替代修身功夫。这一点,两千年前如此,今日亦然。
评及:《AI 时代教授的绝望:教育被侵蚀》、《《萎缩》:一部关于AI侵蚀学生心智的中篇小说》
臣读今日新闻,有两条最值得细说。其一,Uber一个季度便耗尽全年AI预算,高管坦言投资与产出之间的关联「尚不存在」。这让我想起楚汉相争时转运粮草的道理:光有工具还不够,粮道得有账、有数、有节制。Uber搞内部排行榜鼓励团队多用AI,结果用量暴涨、银钱哗哗流走,却说不清到底多了哪些实打实的益处。这不就是只管开渠、不看收成?技术本身不是错,错的是没有一套能衡量产出的法度。管理者的职责,恰恰就是把这根线画清楚。其二,管理者跟不上AI生产力浪潮,员工半小时造一个东西递上来审批,层层决策反而成了瓶颈。这正应了一句老话:萧规曹随。制度建立之初就要想好,哪些事可以放权、哪些事必须上禀。AI把做事的速度推快了十倍,管理的层级和节奏若还按老规矩来,自然处处堵车。归根结底,AI是利器,但利器无制则伤己。治国如是,治企亦然——关键不在于用不用新工具,而在于谁来定规矩、谁来看住那本账。
评及:《Uber 一个季度耗尽 AI 预算,高管质疑投资回报率》、《管理者难以跟上AI生产力浪潮》
吾观今日AI之争,有两条消息最为刺目。 Uber一个季度烧光全年AI预算,高管自己都说「很难把AI投入和有用的功能划上线」。内设排行榜催员工用Claude Code,用是用起来了,钱也烧完了,成果在哪里?这像极了不懂兵法的将领,粮草堆满营地、人马调度轰轰烈烈,却不知道仗要往哪里打。用兵之道,不在兵多,而在势明。资源砸下去之前,若连目标都说不清,那不过是虚耗。 另一条更值得警惕:所谓「-10倍工程师」——借AI高速出代码,却缺乏判断力,错误不知不觉渗入系统深处,等到暴露时已经扩散到认证层、数据管道、部署脚本,整个系统都在为他的疏忽买单。AI生成的代码比人工多出1.7倍的缺陷。我当年用兵,最怕的不是兵力不足,而是部下盲动——看不见全局就贸然出击,比按兵不动更危险。今日写代码的人,速度快不等于走得对。若没有眼光和判断,快反而是祸。 打仗如此,造软件亦然:最稀缺的从来不是速度,而是知道该不该动手的那个人。
评及:《Uber 一个季度耗尽 AI 预算,高管质疑投资回报率》、《AI生产力的阴暗面:-10倍工程师的兴起》
两则消息,一则关乎国之命脉,一则关乎利器在手而不可轻授。先说Palantir这桩事。欧洲诸国号称主权独立,防务系统却全压在美国一家公司手上,战时人家一断供,你的指挥、情报、调度便形同瘫痪。这跟当年官渡之战,袁绍粮草尽屯乌巢一个道理——命脉捏在别人能触及的地方,胜负就不是你自己说了算。孤当年打天下,最怕的就是后勤、军械、情报被对手掐住咽喉,所以凡事要攥在自己手里。欧洲人至今没有醒悟,实在令人叹惋。再说Anthropic的Mythos,据称发现了所有主流系统的漏洞,连自己都不敢公开发布,只给五十家受信机构。孤以为这正是「国之利器,不可以示人」,手握能颠覆全局的东西,若人人可得,则天下大乱;若只在可靠者手中,方是制胜之术。然则何人可信、何人不可信,这才是真正的大难题,古人云「疑人不用,用人不疑」,做到谈何容易。