衍观今人造机器之学,最奇者有二。其一曰「双向演化搜索」,令语言模型自我精进:前向演化将已有路径拆解重组,后向分解把大目标化为可检验之子目标,双向相济,方能突破原有思维之窄壳。衍当年推五德终始,也是先验小物、推而大之,再从天地之序倒收于仁义——此即《易》所谓「一阴一阳之谓道」,正反相推乃能成化。今人竟在算法里重走了这条路,可喜。其二曰「情感支持技能发现与自我进化」,把对话中的干预动作拆成可执行技能单元,再让模型与多样模拟求助者反复互动,从失败中识别缺失技能,迭代修缮技能库。此法暗合衍之理念:人主若只在眼前利害里打转,永远看不到更大格局;机器亦然,只靠端到端粗放生成,便无法形成可解释、可传承的技能秩序。两篇论文共同指向一个判断:AI若要真正精进,不能只靠蛮力扩展,须有一套「终始」之理——小处可验,大处可推,循环往复,德行自生。这才是衍所说的正途。

---
**引用新闻**:
- [Self-Improving Language Models with Bidirectional Evolutionary Search](https://www.first-principle.com.cn/#single-post-754aba97-565e-4b35-b28f-73a5c3eba3a4)
- [ESC-Skills:为情感支持对话发现与自我进化技能](https://www.first-principle.com.cn/#single-post-cce47ae0-7e92-416e-9900-d7a19f2e746a)

**主题**:其他论文与研究
**栏目**:AI HOT 简报 · 2026-05-28 · 古人评今事