Tốt nhất năm Đánh giá LLM Công cụ AI

Discover the most powerful Đánh giá LLM AI tools, including promptfoo、AfterQuery、Evidently AI、Confident AI、Ragas、getmaxim、deepchecks、Adaline、Giskard、Agenta, and other Đánh giá LLM AI tools.

Plurai

Plurai

Plurai là nền tảng niềm tin cho AI Agent, tăng tốc phát triển agent sẵn sàng đưa vào …

5.0K
Agenta

Agenta

Agenta là một nền tảng LLMOps mã nguồn mở được thiết kế để các nhóm xây dựng các …

33.3K
Athina

Athina

Athina là một nền tảng phát triển AI hợp tác được thiết kế để giúp các nhóm xây …

10.1K
LangWatch

LangWatch

LangWatch là một nền tảng mã nguồn mở tất cả trong một để giám sát, đánh giá và …

33.2K
deepchecks

deepchecks

Deepchecks là một nền tảng toàn diện để đánh giá, xác thực và giám sát các ứng dụng …

85.3K
EvalsOne

EvalsOne

EvalsOne là một nền tảng đánh giá tất cả trong một được thiết kế cho các ứng dụng …

3.0K
Prompt Octopus

Prompt Octopus

Một tiện ích mở rộng VSCode dành cho nhà phát triển để tối ưu hóa kỹ thuật prompt. …

2.2K
usevelvet

usevelvet

Velvet là một cổng phát triển, hiện là một phần của Arize AI, được thiết kế để phân …

3.0K
Ragas

Ragas

Ragas là một framework Python mã nguồn mở để đánh giá và kiểm thử các pipeline Sinh Tăng …

119.0K
Keywords AI

Keywords AI

Keywords AI là một nền tảng giám sát và quan sát LLM toàn diện được thiết kế cho …

13.9K
withpi.ai

withpi.ai

Một nền tảng tập trung vào nhà phát triển để tạo ra các hệ thống chấm điểm và …

2.3K
Basalt

Basalt

Basalt là một nền tảng toàn diện dành cho các nhà phát triển và đội ngũ sản phẩm …

10.7K
Evidently AI

Evidently AI

Evidently AI là một nền tảng kiểm thử và đánh giá toàn diện cho các sản phẩm AI, …

164.4K
Adaline

Adaline

Adaline là một nền tảng đầu cuối toàn diện cho các nhóm sản phẩm và kỹ thuật để …

68.2K
Confident AI

Confident AI

Confident AI là một nền tảng đánh giá và quan sát LLM dành cho các nhóm kỹ thuật. …

130.0K
RagaAI

RagaAI

RagaAI là một nền tảng kiểm thử và giám sát AI toàn diện được thiết kế để giúp …

26.1K
AfterQuery

AfterQuery

AfterQuery là một phòng thí nghiệm nghiên cứu AI chuyên sâu về việc thúc đẩy các mô hình …

179.1K
promptfoo

promptfoo

promptfoo là một khung kiểm thử và đánh giá toàn diện cho các Mô hình Ngôn ngữ Lớn …

190.8K
Miễn phí
BenchLLM

BenchLLM

Một framework mã nguồn mở mạnh mẽ dành cho các kỹ sư AI để đánh giá và kiểm …

2.2K
getmaxim

getmaxim

getmaxim là một nền tảng đánh giá và quan sát GenAI toàn diện được thiết kế cho các …

110.5K
Giskard

Giskard

Giskard là một nền tảng kiểm thử AI được thiết kế để bảo mật và xác thực các …

54.6K