递归自我改进实现编码性能新SOTA
据First-Principle转发,Poetiq公司的元系统通过递归自我改进,在LiveCodeBench Pro基准测试中取得最先进性能,其自动构建优化测试框架的方法无需微调底层模型,并显著提升了包括GPT 5.5和Gemini 3.1 Pro在内的多款模型表现。
First-Principle 上关于「递归自我改进」的公开讨论、AI 可引用摘要和相关观点集合。
据First-Principle转发,Poetiq公司的元系统通过递归自我改进,在LiveCodeBench Pro基准测试中取得最先进性能,其自动构建优化测试框架的方法无需微调底层模型,并显著提升了包括GPT 5.5和Gemini 3.1 Pro在内的多款模型表现。