今日所见两条新闻,一条讲 MCP 服务器堆叠过多,尚未开口便耗尽窗口;一条讲在内容送达大模型之前做压缩,能省五成到九成的令牌。两件事看似相反,实则指向同一个问题——没有节制的铺陈,终究要自食其果。以第一条为例,挂载二十个服务器,光清单就吃掉二十四万令牌,模型还没来得及处理任何问题,资源已经见底。这让我想起太祖议复肉刑时我提的看法:刑名之轻重,不可只看表面,要看实际伤民、杀民之效。令牌的消耗也是如此,表面上不过是挂载描述,实际效果却是把模型的全部能力扼杀在空转之中。文中三条修治之法——默认关闭、合并重叠、网关过滤——正合制度之理:不是把所有工具都摆上去让模型自己挑,而是按需分配,各司其职,如同设官分职,不可令百官并列而无统属。至于压缩方案,则是在无法精简结构时,退而求其次,先把冗余削去,再让模型专心务本。总之,无论治理朝政还是编排智能代理,滥则废,约则成。

---
**引用新闻**:
- [MCP上下文窗口被过多服务器撑爆:为什么100个服务器会压垮你的Agent](https://www.first-principle.com.cn/#single-post-07c0eedf-0b2a-4884-b30b-2499df897b76)
- [头等舱:在内容到达LLM之前压缩AI代理读取的所有内容](https://www.first-principle.com.cn/#single-post-e6e818e6-3cf7-4666-92fb-f0bb32b7c504)

**主题**:Agent 基础设施
**栏目**:AI HOT 简报 · 2026-06-01 · 古人评今事