LLMRTC
LLMRTC é um SDK TypeScript para construir aplicações de IA de voz e visão em tempo real. Ele …
LLMRTC é um SDK TypeScript para construir aplicações de IA de voz e visão em tempo real. Ele integra o WebRTC para streaming de áudio/vídeo de baixa latência com LLMs, conversão de fala em texto e texto em fala, tudo através de uma API unificada e agnóstica a provedores. Desenvolvedores podem focar na lógica da aplicação enquanto o LLMRTC gerencia a complexa infraestrutura de IA conversacional.
Models
Models da Hathora oferece um catálogo selecionado de modelos ASR, TTS e LLM de baixa latência, otimizados para …
Models da Hathora oferece um catálogo selecionado de modelos ASR, TTS e LLM de baixa latência, otimizados para IA de voz e aplicações em tempo real. Desenvolvedores podem explorar, testar e implantar modelos prontos para produção rapidamente, com sandboxes interativas e acesso direto à API para integração perfeita em agentes de voz e outros aplicativos.
Gabber
Gabber é uma plataforma poderosa para construir aplicativos de IA multimodal em tempo real que podem ver, ouvir …
Gabber é uma plataforma poderosa para construir aplicativos de IA multimodal em tempo real que podem ver, ouvir e falar. Oferece inferência de baixa latência para Modelos de Linguagem Visual (VLM), Text-to-Speech (TTS) e Speech-to-Text (STT), combinada com um sistema de orquestração baseado em grafo para rápido desenvolvimento e implantação.
Release.ai
Release.ai é uma plataforma de nível empresarial para desenvolvedores implantarem, gerenciarem e escalarem facilmente modelos de IA de …
Release.ai é uma plataforma de nível empresarial para desenvolvedores implantarem, gerenciarem e escalarem facilmente modelos de IA de alto desempenho. Oferece latência de inferência abaixo de 100ms, auto-scaling contínuo, segurança robusta e uma vasta biblioteca de modelos pré-otimizados, permitindo uma rápida integração em qualquer fluxo de trabalho de desenvolvimento com apenas algumas linhas de código.
Daily
Daily é uma plataforma para desenvolvedores de vídeo, voz e IA em tempo real. Fornece APIs e SDKs …
Daily é uma plataforma para desenvolvedores de vídeo, voz e IA em tempo real. Fornece APIs e SDKs robustos para construir experiências de conversação de latência ultrabaixa, escaláveis e de alta qualidade, incluindo chamadas de vídeo de humano para humano e agentes de IA de voz avançados através de sua estrutura de código aberto, Pipecat.
Prodia
Prodia é uma API de IA generativa de alta velocidade e escalável para desenvolvedores. Permite a integração perfeita …
Prodia é uma API de IA generativa de alta velocidade e escalável para desenvolvedores. Permite a integração perfeita da geração de imagens e vídeos em aplicativos, oferecendo latência ultrabaixa e eliminando a necessidade de gerenciamento de infraestrutura de GPU. Construído para produção, ele impulsiona a próxima geração de ferramentas criativas.
Telnyx
A Telnyx é uma plataforma de comunicações full-stack que permite a desenvolvedores e empresas construir e implantar IA …
A Telnyx é uma plataforma de comunicações full-stack que permite a desenvolvedores e empresas construir e implantar IA conversacional de alto desempenho e em tempo real. Ela integra telefonia global, infraestrutura de IA dedicada e APIs poderosas em uma única plataforma, fornecendo latência ultrabaixa e controle completo para criar assistentes de voz com som natural e automatizar fluxos de trabalho de comunicação.
Squawk Market
O Squawk Market é um feed de áudio em tempo real, alimentado por IA, para traders. Ele entrega …
O Squawk Market é um feed de áudio em tempo real, alimentado por IA, para traders. Ele entrega notícias críticas do mercado, dados e alertas com latência ultrabaixa (<1s). A plataforma ajuda os traders a capitalizar a volatilidade e os movimentos intradiários, fornecendo atualizações instantâneas sobre ações de momentum, notícias de última hora e eventos econômicos.
Moshi AI
O Moshi AI é um modelo avançado de IA de voz conversacional de baixa latência desenvolvido pela Kyutai. …
O Moshi AI é um modelo avançado de IA de voz conversacional de baixa latência desenvolvido pela Kyutai. Ele permite diálogos naturais, expressivos e interrompíveis, projetado para ser executado localmente em diversos hardwares para uso offline. Isso o torna ideal para aplicações focadas em privacidade, como dispositivos domésticos inteligentes e sistemas automotivos.
Groq
Groq é uma plataforma revolucionária de inferência de IA que oferece aos desenvolvedores velocidade e eficiência de custo …
Groq é uma plataforma revolucionária de inferência de IA que oferece aos desenvolvedores velocidade e eficiência de custo inigualáveis. Alimentado por sua Unidade de Processamento de Linguagem (LPU) personalizada, o Groq oferece desempenho em tempo real para grandes modelos de linguagem (LLMs), reconhecimento de fala e aplicações de texto para fala. Oferece uma API amigável para desenvolvedores, permitindo integração perfeita para construir soluções de IA de próxima geração e baixa latência em escala.
Sindarin
Sindarin é uma plataforma de nuvem acelerada para desenvolvedores que constroem IA de voz conversacional de baixa latência. …
Sindarin é uma plataforma de nuvem acelerada para desenvolvedores que constroem IA de voz conversacional de baixa latência. Ele fornece uma API e uma plataforma sem código para criar personas de IA altamente responsivas e com som natural. Com troca de turnos líder do setor e manuseio de interrupções contínuo, o Sindarin permite a criação de experiências de voz verdadeiramente interativas para aplicações em atendimento ao cliente, bem-estar, jogos e muito mais, oferecendo escala e confiabilidade de nível empresarial.
Cartesia
Cartesia é uma plataforma de IA de voz de alto desempenho para desenvolvedores, oferecendo a mais rápida e …
Cartesia é uma plataforma de IA de voz de alto desempenho para desenvolvedores, oferecendo a mais rápida e ultrarrealista conversão de Texto em Fala (TTS), Clonagem de Voz em tempo real e conversão de Fala em Texto (STT) de baixa latência. Alimentada por tecnologia proprietária de Modelo de Espaço de Estado, foi projetada para construir aplicações de voz interativas e imersivas com integração perfeita e segurança de nível empresarial.
Outspeed
Uma API e SDK para desenvolvedores construírem e implantarem companheiros de voz de IA com emoção e memória …
Uma API e SDK para desenvolvedores construírem e implantarem companheiros de voz de IA com emoção e memória em tempo real. Integre facilmente interações de voz naturais e de baixa latência em aplicações web e móveis.
Tencent RTC
Uma plataforma de desenvolvedor abrangente que fornece APIs e SDKs poderosos para voz, vídeo, chat e streaming ao …
Uma plataforma de desenvolvedor abrangente que fornece APIs e SDKs poderosos para voz, vídeo, chat e streaming ao vivo em tempo real. O Tencent RTC permite que as empresas criem experiências de comunicação escaláveis, de baixa latência e interativas diretamente em seus aplicativos em vários setores.
Inception Labs
A Inception Labs apresenta uma nova geração de Modelos de Linguagem Grandes de Difusão (dLLMs) que são até …
A Inception Labs apresenta uma nova geração de Modelos de Linguagem Grandes de Difusão (dLLMs) que são até 10x mais rápidos e baratos que os modelos tradicionais. Utilizando uma abordagem paralela baseada em difusão, oferece velocidade, qualidade e controle sem precedentes para geração de texto e código, ideal para aplicações de nível empresarial.
Millis AI
Millis AI é uma plataforma para construir agentes de voz de última geração com latência ultrabaixa de 600ms. …
Millis AI é uma plataforma para construir agentes de voz de última geração com latência ultrabaixa de 600ms. Permite que desenvolvedores e usuários não técnicos criem e implantem agentes de voz acessíveis e semelhantes a humanos para chamadas de entrada e saída em minutos, com capacidades de integração fáceis.