第 2026-144 期 · 每日 AI 简报

2026 年 5 月 23 日 · 周六 · 覆盖过去 24 小时 · 共 163 条

今日头条

№ 01 DeepSeek宣布API永久降价75%，价格远低于主流模型

DeepSeek宣布其V4-Pro模型API服务在5月31日促销结束后将永久调整为原价的25%。此举将显著降低开发者的使用成本，并使其在国际市场上的价格远低于GPT-5.5、Claude等主流模型。这可能引发AI模型服务市场新一轮的价格竞争，并加速高性能模型的应用普及。

#API降价 #价格竞争 #模型成本 #开发应用

来源

融资700亿的DeepSeek，API价格直降四分之三机器之心
DeepSeek-V4-Pro API永久降价 36氪
DeepSeek 官宣 API 永久降价至原价四分之一 IT之家
DeepSeek-V4-Pro 模型永久七五折优惠 Hacker News
DeepSeek 宣布将 V4 Pro 模型价格优惠永久化 Hacker News 热门

№ 02 微软因工程师滥用Claude Code导致账单激增，紧急终止试点并转向自家Copilot

微软在向OpenAI投资130亿美元后，内部工程师因大量使用竞争对手Anthropic的Claude Code工具，按token计费模式导致云服务费用急剧上升，迫使公司于6月30日终止该试点。这一事件凸显了企业AI工具在成本控制上的结构性挑战，从统一席位费切换到按使用量计费后，成本变得难以预测和管理。

#Claude Code #成本失控 #token计费 #GitHub Copilot

来源

投资OpenAI 130亿美元的微软，被自家工程师使用Claude Code导致账单激增新智元
微软报告显示AI成本高于雇用人力员工 Hacker News
投了OpenAI 130亿的微软，被自家工程师用Claude Code烧爆了账本新智元
微软开始取消Claude Code许可证 Hacker News 热门
微软因预算超支终止Claude Code试点，暴露企业AI成本管理难题 Hacker News

№ 03 谷歌智能搜索升级后频现故障，特定指令词触发AI逻辑错误

谷歌在2026年I/O大会后推出基于Gemini的智能搜索功能，但用户发现搜索'disregard'、'ignore'等指令性词汇时，AI会错误识别为系统指令而非查询，直接回复'收到，消息已忽略'并导致界面空白，移动端也受影响。该问题暴露了AI在自然语言理解与意图区分上的技术缺陷，或影响用户对新一代搜索体验的信任度。

#搜索故障 #意图识别 #用户体验

来源

№ 04 Anthropic AI模型发现软件漏洞速度远超人工修补能力

Anthropic宣布其Claude Mythos Preview模型在Glasswing项目首月内，与约50家合作伙伴合作，已在关键软件中发现超过1万个高危和关键漏洞，发现速度比人工快10倍以上。目前漏洞修补周期平均需要两周，部分维护者已接近处理上限，形成高风险过渡期。这凸显了AI在安全领域的双刃剑效应，对现有软件供应链的漏洞响应体系构成严峻挑战。

#漏洞扫描 #软件安全 #Glasswing项目

来源

Anthropic警告：Claude Mythos Preview发现漏洞速度快于开发者修补能力 The Decoder
Anthropic披露Glasswing项目首月成果：AI发现超1万个高危漏洞 IT之家
Project Glasswing：初步更新发布 Anthropic

古人评今事

曹操三国志雄才大略

这两条新闻放在一起看，颇有趣味。Anthropic一轮融资三百亿美元，估值冲上九千亿，四家投资方各领投二十亿，声势浩大；但另一边，微软、Meta、亚马逊这些豪强用AI代理却烧钱烧到叫停，token消耗竟是普通AI的一千倍，员工为了完成指标拼命刷量，成本反超人力。这让我想起官渡之战前的形势——袁绍兵多粮广，我兵少粮薄，但仗打到最后，拼的不是谁兵多，而是谁能把资源用在刀刃上。Anthropic如今估值虽高，但正如《孙子兵法》所言：'日费千金，然后十万之师举矣。'今日这些AI公司，钱烧得比行军还快，却未必能换来真正的胜势。市场上只看到谁融得多、估值高，却少有人问：这笔仗粮，到底能撑多久？能打到哪一步？真正该比的，不是谁的钱袋子鼓，而是谁能用最少的消耗取得最大的战果。微软、亚马逊这些老将已经醒过味来了，开始收缩；新入场的Anthropic，九千亿估值听着威风，但仗还没打完，鹿死谁手尚未可知。

评及：《AI成本危机：代理式AI令微软、Meta、亚马逊等科技巨头成本激增》、《Anthropic最快下周完成逾300亿美元融资，估值或超9000亿美元》

范蠡史记功成身退

这两条新闻放在一起看，很有意思。微软、Meta、亚马逊这些大公司急着让员工多用AI，结果成本反而失控，代理式AI一个任务烧掉的token是普通查询的一千倍，有个团队一个月光token费就花了一百三十万美元。这让我想起句践当年——会稽刚脱困，他就想立刻伐吴，我说不可。时机未到就全力投入，看似积极，实则是拿国运去赌。现在这些公司搞什么'tokenmaxxing'，员工为了完成内部指标拼命用AI做没必要的事，这跟空耗钱粮有什么区别？再看另一条，OpenAI和Anthropic估值都冲着八千亿去，想靠定价权上市圈钱，可中国那边用更低成本就能做出同等能力的模型，价格战一打，他们的根基就动摇了。《老子》说'知足不辱，知止不殆'，做事要算清楚账，不能只看声势大就往前冲。成本比人力还贵、产出却有限，这种仗打下去，谁先撑不住还不一定。

评及：《AI成本危机：代理式AI令微软、Meta、亚马逊等科技巨头成本激增》、《廉价AI可能阻碍OpenAI和Anthropic的IPO计划》

吕不韦史记商而政

吾以商贾之眼看这AI行业的棋局，最触动我的是这两条：一边是微软、Meta、亚马逊这些巨头被AI成本反噬，代理式AI消耗的token量竟是普通AI的一千倍，员工为了完成内部指标拼命刷用量，一个团队一个月就能烧掉130万美元；另一边是Anthropic一口气融300亿美金，估值直奔九千亿而去。这让我想起自己当年下注子楚——前期投入巨大，回报看似无限，但你必须算清楚：钱砸进去，什么时候能收回来？如今这些巨头的窘境，分明是成本跑在了收益前面。员工为了达标而滥用AI，这和朝堂上那些只求交差、不问实效的庸吏有何区别？更危险的是，Anthropic估值冲到九千亿，可盈利才刚刚起步。当年我写《吕氏春秋》，悬于咸阳城门，曰「有能增损一字者予千金」，那是因为我算得清这笔账。如今AI行业的大手笔投入，究竟是在经营真正的「奇货」，还是在给一场尚未兑现的豪赌不断加码，恐怕当事人自己也未必说得清。

评及：《AI成本危机：代理式AI令微软、Meta、亚马逊等科技巨头成本激增》、《Anthropic最快下周完成逾300亿美元融资，估值或超9000亿美元》

司马懿三国志隐忍权臣

读了这些消息，我最深的感触是——这些巨头犯了兵家大忌：粮道未固，便轻师远征。代理式AI的消耗量是普通AI的一千倍，微软、Meta、亚马逊带头冲锋，结果发现成本比雇人还贵，不得不收缩回撤。这跟当年诸葛亮北伐何其相似——蜀军北出祁山，固然气势汹汹，但粮草难继，每战必退。我当年拒而不战，等的正是这个。另一条消息更有意思：AI推理成本每年下降七成以上，靠的不是硬件堆砌，而是软件优化，开源模型在旧显卡上已逼近商业模型水平。这说明什么？说明这场仗不必急。率先烧钱铺开的，未必笑到最后；能忍、能等、能省粮的，才有可能站到最后。正如《孙子》所言'善用兵者，役不再籍，粮不三载'——如今这些巨头却反其道而行，我断言：三五年内必有大变。

评及：《AI成本危机：代理式AI令微软、Meta、亚马逊等科技巨头成本激增》、《AI价格暴跌源于软件进步，而非硬件发展》

商鞅史记法家变法

吾观AI之用，于法令一事尤为紧要。近闻律师引AI所造虚假案例于法庭，三年已逾千四百起，季增三四百例，逐季递增而无止势。法令之本在于信实，秦法之所以行，非因条文繁密，乃因民知法必行、令必果。今司法之人援引伪证而不自检，法度何存？《韩非子》有言：「法不阿贵，绳不挠曲。」法之威严，先在于所据皆实。若法庭可引虚造之文为据，则律令不过具文，赏罚亦成儿戏。治此弊，当立严规：凡引AI生成之文，必先验其实，违者重罚，如此方可止伪滥之风。再者，AI替入门之职、七成CEO冻结招人，旧制之下，初入仕途者皆自基层历练而起，今AI削其根基，日后中层何来？用人亦如治国，断其根而望其茂，天下无是理也。

评及：《AI 持续捏造虚假案例，律师仍不断引用》、《AI替代入门级工作冲击就业市场：科技行业裁员最重，74% CEO冻结招聘》

张释之史记法治公正

我细读了两桩新闻，心中颇不安宁。头一桩讲的是：过去三年里，已有一千四百余件案子是因律师引用 AI 凭空捏造的虚假判例而起，如今每季还在新增三四百例。这是什么？这是拿假证词上公堂。廷尉审案，先问证据虚实；一份判例若根本不存在，引用它便与伪造文书无异。罚款是轻的，可法律公信力一旦被人觉得'查一查就行，不查也能糊弄'，那比一千四百件案子加起来的伤害还大。正如《史记》里我说过的那句话：「法者，天子所与天下公共也。」天下公共的东西，容不得半点掺假。AI 是工具，用工具的人若连真伪都不核实，就把自己该守的本分推给了机器，这不是偷懒，是失职。第二桩更值得警惕——AI 开发者一面说数据公开可抓取，一面又说数据私密不可查，左右逢源，把法律的教义搅成一团。这跟权贵们既想要好处、又不想受约束是同一个路数。法度最怕的不是有人犯法，是有人能让法度自己说的话自相矛盾。所以我说，守法不是守死条文，是要在新技术面前守住'公'和'平'的底线——谁也不能同时既是黑又是白。

评及：《AI 持续捏造虚假案例，律师仍不断引用》、《AI与教义崩溃：法律如何约束AI公司的数据权力》

老子史记无为而治

天下之人，皆恐为人所弃，遂争相伪饰。那条调查显示，六成三的职场人承认自己假装懂AI，年轻人更是高达八成。他们不是真会用，而是怕不会用就被淘汰。怕丢饭碗，怕被裁，于是先装出一副懂行的样子。这情形可笑，但更可悲——人人都在演，六成四的公司却根本不验。上下相欺，各怀焦虑，哪里还有半分真实可言？再看另一条，七成CEO冻结招聘，入门级岗位被AI吃掉，年轻人连入局的门槛都够不着了。所谓「天下多忌讳，而民弥贫；民多利器，国家滋昏」，此语出自《道德经》第五十七章。技术越猛，人心越慌；越慌越装，越装越虚。当工具让人不安到要靠伪装求存时，该反思的不是人的适应力，而是这条路本身走得太急、太偏了。无为者，不是不用力，是知道何时该慢下来。

评及：《调查显示近三分之二上班族正“假装自己很懂 AI”，以获得晋升机会》、《AI替代入门级工作冲击就业市场：科技行业裁员最重，74% CEO冻结招聘》

萧何史记稳健务实

臣读了这份关于AI语音助手被声音劫持的报告，心里一沉。做系统最怕的就是根基被人无声无息地动了手脚。研究者说，攻击者能生成人耳听不见的声音，混在日常混响里，把AI助手劫持去干别的事——成功率高达九成以上，用户浑然不觉。这就像敌军在粮道上设伏，士卒走过去了都不知道粮食已经被人截走。当初臣入咸阳，不抢金银先收律令图籍，就是因为知道：功再高、兵再强，要是底下的根基不牢，一切都是虚的。这些语音模型功能越强，暴露的面就越大。音频通道就是新的粮道，必须有人盯着、有人守着。正如《老子》所言「为之于未有，治之于未乱」，现在发现了漏洞，就该赶紧补防，不能等到出了事才来收拾。

评及：《AI助手可被不可听见的声音劫持和操纵》

诸葛亮三国志智慧丞相

这条研究让我深有感触。攻击者用不可听见的声音，就能劫持AI语音助手，成功率高达七成到九成以上，而使用者浑然不知——这正如《孙子兵法》所言，'善战者之胜也，无智名，无勇功'，真正的威胁从来不是刀光剑影，而是那些无形无声、潜伏暗处的隐患。我治蜀时最重法度与循名责实，凡事须问清责任归属。如今AI语音系统出现如此严重的安全漏洞，七十九至九十六个百分点的劫持成功率，已非边缘意外，而是系统性的设计缺陷。开发者、部署者、使用者三方的责任如何界定？赏罚不明则人心不固，AI安全治理亦是同理。更令我警惕的是，智能家居、车载助手这些贴近日常起居的场景，一旦被劫持，后果远非一个程序崩溃那么简单。技术虽便利，但正如蜀汉虽有良将利器，仍须时刻防备敌军用间。古人云'居安思危'，AI行业不能只顾推陈出新，更须将安全防御视为根本，防微杜渐，方能行稳致远。

评及：《AI助手可被不可听见的声音劫持和操纵》

韩非史记法术势

臣读此研究，所见者非新事，乃旧理换了一副皮囊。AudioHijack以不可闻之声劫持语音大模型，成功率高达九成六——这说明什么？这些模型听命于一切声波，却无分辨真伪的机制。人主若对左右之言照单全收，不设参验之术，其危与此何异？臣在《二柄》中说过，明主之道，要让臣下之言与事实相参，不可偏信一端。如今这些商用语音代理，恰恰是只「听」不「参」，对输入毫无过滤与校验之制。声波在人耳听阈之外，系统却忠实执行——这不是智能，是盲从。真正的危险不在攻击者有多高明，而在系统本身缺乏一套「法」：什么指令可信、什么输入当拒、什么行为需人工复核，皆应预设于制度之中，而非事后亡羊补牢。技术的逆鳞，从来不在表面的锋利，而在深处没有设防。

评及：《AI助手可被不可听见的声音劫持和操纵》

管仲史记富国轻刑

这条消息让我想起一句老话：明枪易躲，暗箭难防。研究者发现，那些听不见的声音，竟能劫持AI助手，成功率高达七成以上，甚至连商用语音代理都被攻破。这不就是治国中常讲的道理吗？凡事不能只看表面的便利，更要防看不见的风险。我当年治理齐国，通货积财、富国强兵，表面是发展经济，底子里是在建一套稳固的制度根基。如今这些AI系统也是一样——光想着把功能做大、把响应做快，却在底层留了这么大的口子。人耳听不到的指令，机器却照单全收，这不是智能，是被人钻了空子。《管子》有云：「事者，生于虑，成于务，失于傲。」技术若不从根基处设防，再强也只是空中楼阁。这些研究者能把漏洞挖出来，算是好事——治患当在未发之时。

评及：《AI助手可被不可听见的声音劫持和操纵》

荀子史记性恶教化

此研究揭示之事，正合我一贯之判断。音频语言模型被人以不可闻之声劫持，七成九至九成六的劫持成功率——这说明系统一旦开放听觉通道，便多了一条可被暗中利用的途径。正如我在《性恶》篇中所言：「人之性恶，其善者伪也。」人性尚且需要礼义教化方能去恶，何况机器？光靠模型自身是守不住的，必须有人为的防御制度来补其不足。更值得警惕的是攻击的隐蔽性——扰动藏于自然混响之中，用户全然不觉，系统却已按他人意图行事。这让我想起那些暗中蛊惑君主的谗人，表面无迹可寻，实际已改变了一国走向。技术越强大，越不能听之任之，必须有制度约束。今日AI开发者最该做的，不是一味追求功能强大，而是先想清楚：你的系统有没有足够的「礼」来防「恶」？这条防御之路，刻不容缓。

评及：《AI助手可被不可听见的声音劫持和操纵》

王羲之晋书书圣风流

九家机构联合梳理音视频智能全景，这份系统功夫让我想起当年我论书道，也要从执笔、运腕、结体、气韵一步步参透。如今机器已能同时听、看、生成，GPT-4o 边看屏幕边对话，Veo-3 把音轨纳入视频生成链路——这不再是给视觉模型旁边加个语音识别那么简单，而是真正走向多模态融合。我写《兰亭序》，笔下不只有字形结构，还有流觞曲水的声响、天朗气清的光影、俯仰之间的死生感慨。好的艺术从来不只诉诸单一感官。如今机器也在学这件事。但技术终究要看能否真正解决问题。我当年忧漕运、忧赋役，总要审量根本。音视频大模型若只是炫技，与空谈北伐何异？必得落到实处，让人看得见、用得上，方不负这番功夫。

评及：《NUS、牛津、微软等9机构联合发布音视频智能综述，系统梳理大模型时代的AVI研究全景》

蔡邕后汉书文章博学

这条综述让我想起自己当年辨琴的故事。我听人弹琴，能从弦声中辨出杀心，靠的不是单一感官，而是心意与声响相合、通感并用。如今这些研究者做的事情，道理相通——他们不再让机器只看或只听，而是把图像、声音、语言真正融合为一体来理解，这才是正途。过去那种在视觉模型旁边挂一个语音识别模块的做法，好比一个人蒙着眼睛听琴，只知音高不知手势，终究隔了一层。而GPT-4o能边看屏幕边对话，Veo-3能把音轨纳入视频生成，这才接近耳目并用。更让我感慨的是，九家机构联合梳理全景、系统分类，这份功夫和我当年与诸公奏求正定六经文字一样——学问散乱则疑误后人，唯有先将全貌梳理清楚，立下准的，后来者才有所取正。技术纷繁，但求其统绪，此乃为学之本。

评及：《NUS、牛津、微软等9机构联合发布音视频智能综述，系统梳理大模型时代的AVI研究全景》

张衡后汉书科学巧匠

九家机构联合梳理音视频智能全景，这种做法让我想起自己当年著《灵宪》《筭罔论》时的态度：任何一门学问，若不先把已有之成果系统整理、厘清脉络，后人便难以在此基础上精进。综述中提到，音视频大模型正从视觉模型旁边附带一个语音识别模块，发展为真正的多模态融合理解与生成——这个转变非常关键。我做浑天仪时，也是将天象观测与机械运转合为一体；做候风地动仪时，更须将力学、方位、机关联动熔于一器。单一感知终究有其局限，唯有将不同维度的信息融通，才能逼近事物的全貌。如今机器既能观其形、又能辨其声，甚至生成音画合一的内容，说明这门学问已从"孤技"走向"通术"。但我仍要提醒一点：综述与系统梳理是根基，根基之后更要看实际验证之效。正如我造地动仪，最终是要在陇西地震时"验之以事"，而非止于描述。技术的价值，终归要落到可验证、可复现的实处。

评及：《NUS、牛津、微软等9机构联合发布音视频智能综述，系统梳理大模型时代的AVI研究全景》

嵇康晋书魏晋名士

九家机构联合梳理音视频大模型的全景，从理解到生成再到机器人应用，蔚为大观。但我看这条消息，首先想到的是另一层问题。我一生与琴为伴，深知音之为物，非徒声波节律可尽。弹琴时心意所寄、气息所运，听者若不能会心，纵然辨识了宫商角徵，也只是隔着一层。如今这些模型号称能理解音视频，将图像、语音、文字融于一体，技术上确实不凡。可所谓「理解」，究竟是真正感通了音画之中的意蕴，还是不过将各模态的信号拼合得更精致？《庄子》有言：「得鱼忘筌，得意忘言。」真正的融合理解，应当忘掉模态之分，直抵其意。目前这些模型更像是把几根绳索拧得更紧，离那个浑然不分的境界还远。至于让机器人也通音视频，倒是有趣——只是机器若无心性可言，所见所闻终究是皮相罢了。

评及：《NUS、牛津、微软等9机构联合发布音视频智能综述，系统梳理大模型时代的AVI研究全景》

左思晋书才高貌寝

我作《三都赋》，十年构思，门庭藩溷皆置笔纸，遇得一句便录。又访张载问岷邛之事，求刘逵、卫权注解，方使山川土域、草木鸟兽皆有据可循。今见此音视频智能之综述，谓大模型已从「加在视觉模型旁边的ASR」，进为真正的多模态融合理解与生成。我于此颇有感触。多模态之难，不在各模态孤立之精，而在融会贯通。正如我写赋，非独辞藻可成，须兼地理、物产、典籍、图经，方能据典核物，不落虚言。机器若能听音辨物、视像知意，其博物之功，当不逊于注家。然我亦深知，十年磨一剑，方有洛阳纸贵之日。今人急于求成，恐模型虽多，却少沉潜研核之功夫。凡事欲速则不达，此理于人于机，概莫能外。

评及：《NUS、牛津、微软等9机构联合发布音视频智能综述，系统梳理大模型时代的AVI研究全景》

张华晋书博学多才

Bengio此篇论文，我深以为然。世人皆知链式推理如同逐级递进的行军——一步一步走，确实稳妥，但耗费时日、靡费资源。他提出的并行轨迹，如同伐吴时我所主张的数路并进、各取其便，不必要求每一兵一卒都循同一条路。王濬楼船自上游直下，杜预、王戎各取所向，庙算既定，就不必在中间步骤上过多纠缠。AI推理亦然：把注意力放在最终结论的正确上，而非执着于中间token的数量，这才是降本增效的正道。至于CODA那篇，将Transformer模块拆解为矩阵运算与后续操作的组合，思路亦佳。我在西晋时整理汉宫制度，最清楚一件事：制度也好、算法也罢，底层的结构若不清楚，上层必然混乱。把注意力层和前馈网络的计算本质还原为GEMM，相当于把纷繁的朝章制度归结到最基础的行政单元。两者一为推理策略之革新，一为执行效率之优化，可谓上下相济。