最好的 LLM测试 AI工具

Citronetic

Citronetic是一个专门的MCP（多模态对话平台）测试和分析SaaS平台，确保在ChatGPT、Claude、Google AI和Apple Intelligence等领先LLM平台上的工具发现、意图处理和UI流程成功。

测试

2.6K

Scorecard

Scorecard 是一个用于评估、优化和部署企业级 AI 代理的端到端平台。它帮助团队用结构化评估取代主观测试，提供持续监控、提示词管理和性能指标等工具，从而充满信心地构建值得信赖且可靠的 AI 应用程序。

测试

14.3K

免费

PromptsLabs

PromptsLabs 是一个由社区驱动的提示词库，专为测试和评估新型大型语言模型（LLM）的性能而设计。它提供了一套标准化的、可复制粘贴的提示词及预期输出，帮助开发者和研究人员在逻辑、推理和数学等任务上对模型进行基准测试。

测试

2.6K

Prompteams

Prompteams 是一个专为团队设计的综合性 AI 提示词管理系统。它提供类似 Git 的工作流，通过版本控制、分支和提交来管理和迭代 LLM 提示词。该平台具有强大的测试套件以确保质量、实时 API 以实现即时部署，以及弥合工程师与行业专家之间差距的协作工具。它是为 AI 提示词构建 CI/CD 管道的一站式解决方案，可确保质量、一致性和快速开发。

提示工程

2.5K