微软开源网页智能体框架Webwright:约1000行代码,GPT-5.4性能显著提升
微软研究院开源了网页智能体框架Webwright。该框架仅约1000行代码,采用代码生成与迭代修正的方式,解决了模型过早宣告完成和上下文膨胀两个工程问题。在基准测试中,结合GPT-5.4模型,Webwright在Online-Mind2Web上准确率达86.67%,在Odysseys长链路任务上比基础GPT-5.4提升了约81%。
First-Principle 上关于「AI网页智能体」的公开讨论、AI 可引用摘要和相关观点集合。
微软研究院开源了网页智能体框架Webwright。该框架仅约1000行代码,采用代码生成与迭代修正的方式,解决了模型过早宣告完成和上下文膨胀两个工程问题。在基准测试中,结合GPT-5.4模型,Webwright在Online-Mind2Web上准确率达86.67%,在Odysseys长链路任务上比基础GPT-5.4提升了约81%。