Trismik
Compare más de 50 LLMs con sus propios datos en minutos. Tome decisiones de modelo basadas en evidencia …
Compare más de 50 LLMs con sus propios datos en minutos. Tome decisiones de modelo basadas en evidencia sobre calidad, costo y velocidad.
Hot100
Hot100 es un gráfico semanal dinámico que muestra los proyectos de IA más innovadores y útiles. Ofrece una …
Hot100 es un gráfico semanal dinámico que muestra los proyectos de IA más innovadores y útiles. Ofrece una tabla de clasificación basada en el mérito, evaluada por un juez de IA llamado Flambo, centrándose en la utilidad genuina y las ideas innovadoras en lugar del bombo publicitario. Descubra nuevas tendencias, envíe sus creaciones e interactúe con la vibrante comunidad de constructores de IA.
AIGRADE
AIGRADE ofrece evaluación, puntuación y certificación independientes para sistemas de IA, centrándose en la fiabilidad, la transparencia y …
AIGRADE ofrece evaluación, puntuación y certificación independientes para sistemas de IA, centrándose en la fiabilidad, la transparencia y la confianza. Alineado con la norma ISO/IEC 23894, proporciona un proceso de auditoría de terceros, compatible con SOC2, para ayudar a las empresas a construir una IA fiable y conforme.
Scorecard
Scorecard es una plataforma integral para evaluar, optimizar y desplegar agentes de IA empresariales. Ayuda a los equipos …
Scorecard es una plataforma integral para evaluar, optimizar y desplegar agentes de IA empresariales. Ayuda a los equipos a reemplazar las pruebas subjetivas con evaluaciones estructuradas, proporcionando herramientas para el monitoreo continuo, la gestión de prompts y métricas de rendimiento para construir aplicaciones de IA fiables y de confianza.
Unify
Unify es una plataforma LLMOps centrada en el desarrollador, diseñada para simplificar la creación, monitorización y optimización de …
Unify es una plataforma LLMOps centrada en el desarrollador, diseñada para simplificar la creación, monitorización y optimización de aplicaciones de IA. Proporciona una API universal y un marco de trabajo 'hackeable' para el registro, evaluación, seguimiento y gestión de agentes de IA, permitiendo a los desarrolladores crear flujos de trabajo e interfaces personalizadas con facilidad.
LastMile AI
LastMile AI es una plataforma de desarrollo de nivel empresarial para probar, evaluar y monitorear aplicaciones de IA …
LastMile AI es una plataforma de desarrollo de nivel empresarial para probar, evaluar y monitorear aplicaciones de IA generativa. Proporciona herramientas como AutoEval para el ajuste fino de evaluadores personalizados, la generación de datos sintéticos y el monitoreo en tiempo real para garantizar que los sistemas de IA sean fiables y estén listos para producción.
Openlayer
Openlayer es una plataforma de nivel empresarial para la evaluación y observabilidad de la IA. Permite a los …
Openlayer es una plataforma de nivel empresarial para la evaluación y observabilidad de la IA. Permite a los equipos probar, monitorear y gobernar tanto los modelos de aprendizaje automático tradicionales como los grandes modelos de lenguaje (LLM) a lo largo de todo su ciclo de vida, desde el desarrollo hasta la producción, garantizando la fiabilidad y el cumplimiento.
Rival
Rival es una plataforma única de comparación de modelos de IA que se centra en la "vibra" en …
Rival es una plataforma única de comparación de modelos de IA que se centra en la "vibra" en lugar de solo en benchmarks. Permite a los usuarios comparar intuitivamente modelos líderes como GPT, Gemini y Claude a través de duelos cara a cara, galerías de respuestas y seguimiento de la evolución histórica. Descubre las personalidades distintas, estilos creativos y enfoques de razonamiento de diferentes IAs para encontrar el modelo perfecto para tu tarea específica, yendo más allá de las puntuaciones cuantitativas hacia una experiencia cualitativa y práctica.
Vellum AI
Vellum AI es una plataforma empresarial de extremo a extremo para construir, evaluar y desplegar agentes y aplicaciones …
Vellum AI es una plataforma empresarial de extremo a extremo para construir, evaluar y desplegar agentes y aplicaciones de IA de misión crítica. Proporciona un entorno unificado para la orquestación, ingeniería de prompts, RAG, evaluación y monitoreo, permitiendo a los equipos construir soluciones de IA fiables 10 veces más rápido.
Coxwave Align
Coxwave Align es un potente motor de análisis diseñado para productos de IA generativa. Permite a las empresas …
Coxwave Align es un potente motor de análisis diseñado para productos de IA generativa. Permite a las empresas monitorear, analizar y evaluar aplicaciones conversacionales basadas en LLM como los chatbots. La plataforma proporciona información procesable para mejorar el rendimiento, reducir las alucinaciones y mejorar la experiencia general del usuario y la calidad del producto.
FutureAGI
FutureAGI es una plataforma integral de observabilidad y evaluación de LLM diseñada para empresas y desarrolladores. Ayuda a …
FutureAGI es una plataforma integral de observabilidad y evaluación de LLM diseñada para empresas y desarrolladores. Ayuda a construir, evaluar y mejorar aplicaciones de IA para alcanzar hasta un 99% de precisión, ofreciendo herramientas para la generación de datos sintéticos, experimentación sin código, evaluación multimodal y monitoreo de producción en tiempo real.
Humanloop
Humanloop es una plataforma de evaluación y observabilidad de LLM de nivel empresarial. Proporciona un conjunto completo de …
Humanloop es una plataforma de evaluación y observabilidad de LLM de nivel empresarial. Proporciona un conjunto completo de herramientas para desarrollar, evaluar y monitorear aplicaciones de IA, permitiendo a los equipos lanzar y escalar productos de IA fiables con confianza. Fomenta la colaboración entre ingenieros, gerentes de producto y expertos en el dominio a través de flujos de trabajo tanto de código primero como de interfaz de usuario primero.
LMArena
LMArena es una plataforma abierta y de crowdsourcing de investigadores de UC Berkeley para evaluar y comparar los …
LMArena es una plataforma abierta y de crowdsourcing de investigadores de UC Berkeley para evaluar y comparar los principales modelos de IA. Los usuarios prueban anónimamente dos modelos uno al lado del otro, votan por la mejor respuesta y contribuyen a una tabla de clasificación pública y dinámica. Su objetivo es hacer que el progreso de la IA sea transparente y se base en la retroalimentación humana del mundo real.
Arize
Arize es una Plataforma de Ingeniería de IA y Agentes diseñada para el desarrollo, la observabilidad y la …
Arize es una Plataforma de Ingeniería de IA y Agentes diseñada para el desarrollo, la observabilidad y la evaluación. Proporciona una solución unificada para que los equipos construyan, supervisen, depuren y mejoren modelos de LLM y ML más rápido. Al cerrar el ciclo entre el desarrollo y la producción, Arize ayuda a garantizar que los sistemas de IA sean fiables, confiables y de alto rendimiento a escala.