最好的 LLM測試 AI工具

Citronetic

Citronetic是一個專門的MCP（多模態對話平台）測試和分析SaaS平台，確保在ChatGPT、Claude、Google AI和Apple Intelligence等領先LLM平台上的工具發現、意圖處理和UI流程成功。

測試

2.5K

Scorecard

Scorecard 是一個用於評估、優化和部署企業級 AI 代理的端到端平台。它幫助團隊用結構化評估取代主觀測試，提供持續監控、提示詞管理和效能指標等工具，從而充滿信心地建構值得信賴且可靠的 AI 應用程式。

測試

14.2K

免費

PromptsLabs

PromptsLabs 是一個由社群驅動的提示詞庫，專為測試和評估新型大型語言模型（LLM）的性能而設計。它提供了一套標準化的、可複製貼上的提示詞及預期輸出，幫助開發者和研究人員在邏輯、推理和數學等任務上對模型進行基準測試。

測試

2.6K

Prompteams

Prompteams 是一個專為團隊設計的綜合性 AI 提示詞管理系統。它提供類似 Git 的工作流程，透過版本控制、分支和提交來管理和迭代 LLM 提示詞。該平台具有強大的測試套件以確保品質、即時 API 以實現即時部署，以及彌合工程師與行業專家之間差距的協作工具。它是為 AI 提示詞建構 CI/CD 管道的一站式解決方案，可確保品質、一致性和快速開發。

提示工程

2.4K