LLMRTC
LLMRTC est un SDK TypeScript pour la création d'applications d'IA vocales et visuelles en temps réel. Il intègre …
LLMRTC est un SDK TypeScript pour la création d'applications d'IA vocales et visuelles en temps réel. Il intègre WebRTC pour le streaming audio/vidéo à faible latence avec les LLM, la reconnaissance vocale et la synthèse vocale, le tout via une API unifiée et agnostique aux fournisseurs. Les développeurs peuvent se concentrer sur la logique applicative tandis que LLMRTC gère l'infrastructure complexe de l'IA conversationnelle.
Models
Models de Hathora propose un catalogue sélectionné de modèles ASR, TTS et LLM à faible latence, optimisés pour …
Models de Hathora propose un catalogue sélectionné de modèles ASR, TTS et LLM à faible latence, optimisés pour l'IA vocale et les applications en temps réel. Les développeurs peuvent explorer, tester et déployer rapidement des modèles prêts pour la production, avec des bacs à sable interactifs et un accès direct à l'API pour une intégration transparente dans les agents vocaux et d'autres applications.
Gabber
Gabber est une plateforme puissante pour construire des applications d'IA multimodales en temps réel capables de voir, d'entendre …
Gabber est une plateforme puissante pour construire des applications d'IA multimodales en temps réel capables de voir, d'entendre et de parler. Elle offre une inférence à faible latence pour les modèles de langage visuel (VLM), la synthèse vocale (TTS) et la reconnaissance vocale (STT), associée à un système d'orchestration basé sur des graphes pour un développement et un déploiement rapides.
Release.ai
Release.ai est une plateforme de niveau entreprise pour les développeurs afin de déployer, gérer et mettre à l'échelle …
Release.ai est une plateforme de niveau entreprise pour les développeurs afin de déployer, gérer et mettre à l'échelle facilement des modèles d'IA haute performance. Elle offre une latence d'inférence inférieure à 100 ms, une mise à l'échelle automatique transparente, une sécurité robuste et une vaste bibliothèque de modèles pré-optimisés, permettant une intégration rapide dans n'importe quel flux de travail de développement avec seulement quelques lignes de code.
Daily
Daily est une plateforme pour développeurs de vidéo, voix et IA en temps réel. Elle fournit des API …
Daily est une plateforme pour développeurs de vidéo, voix et IA en temps réel. Elle fournit des API et des SDK robustes pour créer des expériences conversationnelles à très faible latence, évolutives et de haute qualité, y compris des appels vidéo d'humain à humain et des agents IA vocaux avancés via son framework open-source, Pipecat.
Prodia
Prodia est une API d'IA générative haute vitesse et évolutive pour les développeurs. Elle permet une intégration transparente …
Prodia est une API d'IA générative haute vitesse et évolutive pour les développeurs. Elle permet une intégration transparente de la génération d'images et de vidéos dans les applications, offrant une latence ultra-faible et éliminant le besoin de gérer une infrastructure GPU. Conçue pour la production, elle alimente la prochaine génération d'outils créatifs.
Telnyx
Telnyx est une plateforme de communication full-stack qui permet aux développeurs et aux entreprises de créer et de …
Telnyx est une plateforme de communication full-stack qui permet aux développeurs et aux entreprises de créer et de déployer une IA conversationnelle haute performance et en temps réel. Elle intègre la téléphonie mondiale, une infrastructure d'IA dédiée et des API puissantes sur une seule plateforme, offrant une latence ultra-faible et un contrôle total pour créer des assistants vocaux au son naturel et automatiser les flux de travail de communication.
Squawk Market
Squawk Market est un flux audio en temps réel alimenté par l'IA pour les traders. Il fournit des …
Squawk Market est un flux audio en temps réel alimenté par l'IA pour les traders. Il fournit des nouvelles, des données et des alertes critiques du marché avec une latence ultra-faible (<1s). La plateforme aide les traders à capitaliser sur la volatilité et les mouvements intrajournaliers en fournissant des mises à jour instantanées sur les actions à momentum, les dernières nouvelles et les événements économiques.
Moshi AI
Moshi AI est un modèle d'IA vocale conversationnelle avancé à faible latence développé par Kyutai. Il permet des …
Moshi AI est un modèle d'IA vocale conversationnelle avancé à faible latence développé par Kyutai. Il permet des dialogues naturels, expressifs et interruptibles, conçu pour fonctionner localement sur divers matériels pour une utilisation hors ligne. Cela le rend idéal pour les applications axées sur la confidentialité comme les appareils domestiques intelligents et les systèmes embarqués.
Groq
Groq est une plateforme d'inférence IA révolutionnaire offrant aux développeurs une vitesse et une rentabilité inégalées. Propulsé par …
Groq est une plateforme d'inférence IA révolutionnaire offrant aux développeurs une vitesse et une rentabilité inégalées. Propulsé par son unité de traitement du langage (LPU) sur mesure, Groq offre des performances en temps réel pour les grands modèles de langage (LLM), la reconnaissance vocale et les applications de synthèse vocale. Il propose une API conviviale pour les développeurs, permettant une intégration transparente pour créer des solutions d'IA de nouvelle génération à faible latence et à grande échelle.
Sindarin
Sindarin est une plateforme cloud accélérée pour les développeurs qui créent des IA vocales conversationnelles à faible latence. …
Sindarin est une plateforme cloud accélérée pour les développeurs qui créent des IA vocales conversationnelles à faible latence. Elle fournit une API et une plateforme sans code pour créer des personas d'IA très réactifs et au son naturel. Avec une prise de parole de pointe et une gestion transparente des interruptions, Sindarin permet de créer des expériences vocales véritablement interactives pour des applications dans le service client, le bien-être, les jeux, et plus encore, offrant une échelle et une fiabilité de niveau entreprise.
Cartesia
Cartesia est une plateforme d'IA vocale haute performance pour les développeurs, offrant la synthèse vocale (TTS) la plus …
Cartesia est une plateforme d'IA vocale haute performance pour les développeurs, offrant la synthèse vocale (TTS) la plus rapide et ultra-réaliste, le clonage de voix en temps réel et la reconnaissance vocale (STT) à faible latence. Propulsée par une technologie propriétaire de modèle d'espace d'états, elle est conçue pour créer des applications vocales interactives et immersives avec une intégration transparente et une sécurité de niveau entreprise.
Outspeed
Une API et un SDK pour les développeurs afin de créer et de déployer des compagnons vocaux IA …
Une API et un SDK pour les développeurs afin de créer et de déployer des compagnons vocaux IA avec émotion et mémoire en temps réel. Intégrez facilement des interactions vocales naturelles à faible latence dans les applications web et mobiles.
Tencent RTC
Une plateforme de développement complète fournissant des API et des SDK puissants pour la voix, la vidéo, le …
Une plateforme de développement complète fournissant des API et des SDK puissants pour la voix, la vidéo, le chat et la diffusion en direct en temps réel. Tencent RTC permet aux entreprises de créer des expériences de communication évolutives, à faible latence et interactives directement dans leurs applications dans divers secteurs.
Inception Labs
Inception Labs présente une nouvelle génération de grands modèles de langage à diffusion (dLLM) jusqu'à 10 fois plus …
Inception Labs présente une nouvelle génération de grands modèles de langage à diffusion (dLLM) jusqu'à 10 fois plus rapides et moins chers que les modèles traditionnels. En s'appuyant sur une approche parallèle basée sur la diffusion, il offre une vitesse, une qualité et un contrôle sans précédent pour la génération de texte et de code, idéal pour les applications d'entreprise.
Millis AI
Millis AI est une plateforme pour créer des agents vocaux de nouvelle génération avec une latence ultra-faible de …
Millis AI est une plateforme pour créer des agents vocaux de nouvelle génération avec une latence ultra-faible de 600ms. Elle permet aux développeurs et aux utilisateurs non techniques de créer et de déployer des agents vocaux abordables et humains pour les appels entrants et sortants en quelques minutes, avec des capacités d'intégration faciles.