可靠性 | 棱镜空间

AI Agent 的确定性工程：当 LLM 遇见可靠性要求

LLM 有一个根本矛盾：它的输出是概率性的，同一个输入每次调用都可能得到不同的回答。而生产环境的 AI Agent 对可靠性有刚性要求——同样的操作不能这次成功下次失败，同一个查询不能这次给正确答案下次胡说八道。 ...

AI Agent 测试方法论：如何让 autonomous agent 不把事情搞砸让 AI Agent 在 demo 环境里跑起来不难。难的永远是这件事：Agent 在凌晨 3 点、你没有在看的时候，自动执行了一个你没预期到的操作——删了数据、发了邮件、批了付款。 ...