LLMRTC
LLMRTC es un SDK de TypeScript para construir aplicaciones de IA de voz y visión en tiempo real. …
LLMRTC es un SDK de TypeScript para construir aplicaciones de IA de voz y visión en tiempo real. Integra WebRTC para la transmisión de audio/video de baja latencia con LLM, voz a texto y texto a voz, todo a través de una API unificada e independiente del proveedor. Los desarrolladores pueden centrarse en la lógica de la aplicación mientras LLMRTC maneja la compleja infraestructura de IA conversacional.
Models
Models de Hathora ofrece un catálogo curado de modelos ASR, TTS y LLM de baja latencia optimizados para …
Models de Hathora ofrece un catálogo curado de modelos ASR, TTS y LLM de baja latencia optimizados para IA de voz y aplicaciones en tiempo real. Los desarrolladores pueden explorar, probar e implementar modelos listos para producción rápidamente, con sandboxes interactivas y acceso directo a la API para una integración perfecta en agentes de voz y otras aplicaciones.
Gabber
Gabber es una potente plataforma para construir aplicaciones de IA multimodal en tiempo real que pueden ver, oír …
Gabber es una potente plataforma para construir aplicaciones de IA multimodal en tiempo real que pueden ver, oír y hablar. Ofrece inferencia de baja latencia para Modelos de Lenguaje Visual (VLM), Texto a Voz (TTS) y Voz a Texto (STT), junto con un sistema de orquestación basado en grafos para un rápido desarrollo y despliegue.
Release.ai
Release.ai es una plataforma de nivel empresarial para que los desarrolladores desplieguen, gestionen y escalen fácilmente modelos de …
Release.ai es una plataforma de nivel empresarial para que los desarrolladores desplieguen, gestionen y escalen fácilmente modelos de IA de alto rendimiento. Ofrece una latencia de inferencia inferior a 100 ms, autoescalado sin interrupciones, seguridad robusta y una vasta biblioteca de modelos preoptimizados, permitiendo una rápida integración en cualquier flujo de trabajo de desarrollo con solo unas pocas líneas de código.
Daily
Daily es una plataforma para desarrolladores de vídeo, voz e IA en tiempo real. Proporciona APIs y SDKs …
Daily es una plataforma para desarrolladores de vídeo, voz e IA en tiempo real. Proporciona APIs y SDKs robustos para crear experiencias de conversación de latencia ultrabaja, escalables y de alta calidad, incluyendo videollamadas de persona a persona y agentes de IA de voz avanzados a través de su framework de código abierto, Pipecat.
Prodia
Prodia es una API de IA generativa de alta velocidad y escalable para desarrolladores. Permite la integración perfecta …
Prodia es una API de IA generativa de alta velocidad y escalable para desarrolladores. Permite la integración perfecta de la generación de imágenes y vídeo en aplicaciones, ofreciendo una latencia ultrabaja y eliminando la necesidad de gestionar la infraestructura de GPU. Construida para la producción, impulsa la próxima generación de herramientas creativas.
Telnyx
Telnyx es una plataforma de comunicaciones de pila completa que permite a desarrolladores y empresas construir y desplegar …
Telnyx es una plataforma de comunicaciones de pila completa que permite a desarrolladores y empresas construir y desplegar IA conversacional de alto rendimiento y en tiempo real. Integra telefonía global, infraestructura de IA dedicada y potentes APIs en una única plataforma, proporcionando latencia ultrabaja y control total para crear asistentes de voz con sonido natural y automatizar flujos de trabajo de comunicación.
Squawk Market
Squawk Market es un canal de audio en tiempo real impulsado por IA para traders. Ofrece noticias críticas …
Squawk Market es un canal de audio en tiempo real impulsado por IA para traders. Ofrece noticias críticas del mercado, datos y alertas con latencia ultrabaja (<1s). La plataforma ayuda a los traders a capitalizar la volatilidad y los movimientos intradía proporcionando actualizaciones instantáneas sobre acciones de momentum, noticias de última hora y eventos económicos.
Moshi AI
Moshi AI es un modelo avanzado de IA de voz conversacional de baja latencia desarrollado por Kyutai. Permite …
Moshi AI es un modelo avanzado de IA de voz conversacional de baja latencia desarrollado por Kyutai. Permite diálogos naturales, expresivos e interrumpibles, diseñado para ejecutarse localmente en diverso hardware para uso sin conexión. Esto lo hace ideal para aplicaciones centradas en la privacidad como dispositivos domésticos inteligentes y sistemas en vehículos.
Groq
Groq es una revolucionaria plataforma de inferencia de IA que proporciona a los desarrolladores una velocidad y una …
Groq es una revolucionaria plataforma de inferencia de IA que proporciona a los desarrolladores una velocidad y una rentabilidad inigualables. Impulsado por su Unidad de Procesamiento de Lenguaje (LPU) personalizada, Groq ofrece un rendimiento en tiempo real para grandes modelos de lenguaje (LLM), reconocimiento de voz y aplicaciones de texto a voz. Ofrece una API amigable para el desarrollador, permitiendo una integración perfecta para construir soluciones de IA de próxima generación y baja latencia a escala.
Sindarin
Sindarin es una plataforma en la nube acelerada para desarrolladores que construyen IA de voz conversacional de baja …
Sindarin es una plataforma en la nube acelerada para desarrolladores que construyen IA de voz conversacional de baja latencia. Proporciona una API y una plataforma sin código para crear personajes de IA altamente responsivos y con un sonido natural. Con una toma de turnos líder en la industria y un manejo de interrupciones sin fisuras, Sindarin permite la creación de experiencias de voz verdaderamente interactivas para aplicaciones en servicio al cliente, bienestar, juegos y más, ofreciendo escala y fiabilidad de nivel empresarial.
Cartesia
Cartesia es una plataforma de IA de voz de alto rendimiento para desarrolladores, que ofrece la conversión de …
Cartesia es una plataforma de IA de voz de alto rendimiento para desarrolladores, que ofrece la conversión de Texto a Voz (TTS) más rápida y ultrarrealista, Clonación de Voz en tiempo real y conversión de Voz a Texto (STT) de baja latencia. Impulsada por tecnología propietaria de Modelo de Espacio de Estados, está diseñada para construir aplicaciones de voz interactivas e inmersivas con una integración perfecta y seguridad de nivel empresarial.
Outspeed
Una API y SDK para que los desarrolladores construyan e implementen compañeros de voz de IA con emoción …
Una API y SDK para que los desarrolladores construyan e implementen compañeros de voz de IA con emoción y memoria en tiempo real. Integre fácilmente interacciones de voz naturales y de baja latencia en aplicaciones web y móviles.
Tencent RTC
Una plataforma integral para desarrolladores que proporciona potentes API y SDK para voz, vídeo, chat y transmisión en …
Una plataforma integral para desarrolladores que proporciona potentes API y SDK para voz, vídeo, chat y transmisión en vivo en tiempo real. Tencent RTC permite a las empresas crear experiencias de comunicación escalables, de baja latencia e interactivas directamente en sus aplicaciones en diversas industrias.
Inception Labs
Inception Labs presenta una nueva generación de Modelos de Lenguaje Grandes de Difusión (dLLMs) que son hasta 10 …
Inception Labs presenta una nueva generación de Modelos de Lenguaje Grandes de Difusión (dLLMs) que son hasta 10 veces más rápidos y económicos que los modelos tradicionales. Utilizando un enfoque paralelo basado en difusión, ofrece una velocidad, calidad y control sin precedentes para la generación de texto y código, ideal para aplicaciones de nivel empresarial.
Millis AI
Millis AI es una plataforma para construir agentes de voz de última generación con una latencia ultrabaja de …
Millis AI es una plataforma para construir agentes de voz de última generación con una latencia ultrabaja de 600ms. Permite tanto a desarrolladores como a usuarios no técnicos crear y desplegar agentes de voz asequibles y de aspecto humano para llamadas entrantes y salientes en minutos, con capacidades de integración sencillas.