**Show HN: GEDD——在用户之前发现AI智能体的错误**

_Show HN: GEDD – Find what your AI agent gets wrong (before your users do)_

> GEDD是一个基于扎根理论(Grounded Theory)的AI智能体评估工具,专为产品经理和领域专家设计。它通过领域专家与AI对话,90分钟内生成可生产的评估流水线,帮助团队在制定评估标准前发现智能体失败模式。该工具由AWS样本提供,支持从定义提示词、部署到生成测试用例和评估的全流程,并衔接ML工程师的SageMaker MLflow流水线与CI/CD门禁。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-products
- **发布时间**:2026-06-01 04:31(北京时间)
- **原文**:[打开原文](https://github.com/aws-samples/sample-GEDD)