LLMRTC
LLMRTC는 실시간 음성 및 비전 AI 애플리케이션 구축을 위한 TypeScript SDK입니다. WebRTC의 낮은 지연 시간 오디오/비디오 스트리밍과 LLM, …
LLMRTC는 실시간 음성 및 비전 AI 애플리케이션 구축을 위한 TypeScript SDK입니다. WebRTC의 낮은 지연 시간 오디오/비디오 스트리밍과 LLM, 음성-텍스트 변환, 텍스트-음성 변환 기술을 통합된, 공급자 독립적인 API를 통해 원활하게 결합합니다. 개발자는 애플리케이션 로직에 집중할 수 있으며, LLMRTC는 복잡한 대화형 AI 인프라를 처리합니다.
Langtrain
Langtrain은 개발자와 엔지니어링 팀이 최소한의 코드로 대규모 언어 모델(LLM)을 미세 조정, 배포 및 관리할 수 있도록 설계된 강력한 …
Langtrain은 개발자와 엔지니어링 팀이 최소한의 코드로 대규모 언어 모델(LLM)을 미세 조정, 배포 및 관리할 수 있도록 설계된 강력한 플랫폼입니다. 시각적 인터페이스를 제공하며 LLaMA 및 Mistral과 같은 인기 있는 오픈 소스 모델을 지원하고 로컬 또는 보안 클라우드 훈련을 통해 데이터 프라이버시를 보장합니다.
Rixx
Rixx는 단순한 정보 검색을 넘어 심층적인 이해를 제공하도록 설계된 AI 기반 연구 엔진입니다. 수백 개의 출처에서 복잡한 정보를 …
Rixx는 단순한 정보 검색을 넘어 심층적인 이해를 제공하도록 설계된 AI 기반 연구 엔진입니다. 수백 개의 출처에서 복잡한 정보를 구조화되고 검증 가능한 답변으로 종합하여 전문가, 학생, 엔지니어에게 심오한 통찰력을 제공하는 지칠 줄 모르는 연구 조교 역할을 합니다.
GenAI List
GenAI List는 생성형 AI 모델을 추적, 탐색 및 비교하기 위한 포괄적인 온라인 디렉토리입니다. 빠르게 발전하는 AI 환경에 대한 …
GenAI List는 생성형 AI 모델을 추적, 탐색 및 비교하기 위한 포괄적인 온라인 디렉토리입니다. 빠르게 발전하는 AI 환경에 대한 필수 가이드 역할을 하며, 다양한 조직의 수천 가지 모델을 제공합니다. 사용자는 새로운 릴리스를 발견하고, 유형, 개방성, 기능별로 필터링하며, 실무자 의견에 대한 통찰력을 얻을 수 있습니다.
Nexa SDK
Nexa SDK는 개발자가 최첨단 AI 모델을 포함한 모든 AI 모델을 모바일, PC, IoT, 자동차 등 모든 장치에 몇 …
Nexa SDK는 개발자가 최첨단 AI 모델을 포함한 모든 AI 모델을 모바일, PC, IoT, 자동차 등 모든 장치에 몇 분 만에 배포할 수 있도록 지원하는 강력한 툴킷입니다. NPU, GPU, CPU 전반에 걸쳐 하드웨어 가속을 통한 생산 준비된 온디바이스 추론을 제공하며, 속도와 에너지 효율성을 위해 최적화되었습니다.
MiMo
MiMo는 샤오미의 고급 대규모 AI 모델로, 깊은 언어 이해와 실제 물리적 세계 인식을 통합하여 지능을 재정의하도록 설계되었습니다. 지능형 …
MiMo는 샤오미의 고급 대규모 AI 모델로, 깊은 언어 이해와 실제 물리적 세계 인식을 통합하여 지능을 재정의하도록 설계되었습니다. 지능형 동반자 역할을 하며 예측 지원, 창의적 생성 기능을 제공하고 원활한 인간-기계 협업을 촉진합니다.
Amazon Nova
Amazon Nova는 아마존이 개발한 차세대 파운데이션 모델 제품군입니다. 텍스트, 코드, 이미지, 비디오 및 인간과 유사한 음성을 생성하기 위한 …
Amazon Nova는 아마존이 개발한 차세대 파운데이션 모델 제품군입니다. 텍스트, 코드, 이미지, 비디오 및 인간과 유사한 음성을 생성하기 위한 다양한 특수 모델을 제공하며, 고성능 및 비용 효율성을 위해 설계되었습니다. 개발자는 Amazon Bedrock을 통해 이러한 모델에 액세스할 수 있습니다.
DreamOmni2
DreamOmni2는 고급 이미지 생성 및 편집을 위한 멀티모달 AI 도구입니다. 텍스트 및 이미지 프롬프트를 모두 사용하여 시각 자료를 …
DreamOmni2는 고급 이미지 생성 및 편집을 위한 멀티모달 AI 도구입니다. 텍스트 및 이미지 프롬프트를 모두 사용하여 시각 자료를 생성하고 변환할 수 있으며, 디자인부터 광고까지 다양한 응용 분야에서 뛰어난 일관성과 창의적 제어를 보장합니다.
Seedream 4
Seedream 4는 ByteDance가 개발한 전문 AI 이미지 생성 및 편집 도구로, 초고속으로 4K 해상도까지의 초현실적이고 상세한 이미지를 생성할 …
Seedream 4는 ByteDance가 개발한 전문 AI 이미지 생성 및 편집 도구로, 초고속으로 4K 해상도까지의 초현실적이고 상세한 이미지를 생성할 수 있습니다. 텍스트-이미지, 이미지-이미지, 창의적 업스케일링, 다중 이미지 생성과 같은 고급 기능을 제공하여 디지털 아티스트와 콘텐츠 제작자에게 강력한 도구입니다.
Seedream4
Seedream4는 전례 없는 속도와 품질로 아이디어를 전문적인 시각 자료로 변환하는 차세대 AI 이미지 생성 및 편집기입니다. 멀티모달 생성, …
Seedream4는 전례 없는 속도와 품질로 아이디어를 전문적인 시각 자료로 변환하는 차세대 AI 이미지 생성 및 편집기입니다. 멀티모달 생성, 고급 편집 및 4K 해상도 출력을 제공하여 다양한 요구 사항을 충족하는 올인원 크리에이티브 허브입니다.
Wan25
Wan25는 동기화된 오디오-비디오 콘텐츠 생성을 위한 혁신적인 네이티브 멀티모달 AI 플랫폼입니다. 텍스트나 이미지를 통해 1080p HD 시네마틱 비디오와 …
Wan25는 동기화된 오디오-비디오 콘텐츠 생성을 위한 혁신적인 네이티브 멀티모달 AI 플랫폼입니다. 텍스트나 이미지를 통해 1080p HD 시네마틱 비디오와 고품질 이미지를 생성하며, 고급 편집 기능을 제공합니다. 통합 아키텍처와 RLHF를 활용하여 Wan25는 전 세계 크리에이터와 연구자들에게 전문적인 수준의 고품질 및 인간 선호도에 맞는 결과를 제공합니다.
Seedream 4
Seedream 4는 초고속 2K 이미지 및 비디오 생성과 편집을 위한 최첨단 멀티모달 AI 플랫폼입니다. 고급 MoE 아키텍처를 활용하여 …
Seedream 4는 초고속 2K 이미지 및 비디오 생성과 편집을 위한 최첨단 멀티모달 AI 플랫폼입니다. 고급 MoE 아키텍처를 활용하여 정확한 텍스트-이미지 생성, 다중 참조 처리 및 일괄 생성을 제공하며, 전 세계 크리에이터를 위해 영어와 중국어 프롬프트를 모두 지원합니다.
Gabber
Gabber는 보고, 듣고, 말할 수 있는 실시간 다중 모드 AI 애플리케이션을 구축하기 위한 강력한 플랫폼입니다. VLM(Vision Language Models), …
Gabber는 보고, 듣고, 말할 수 있는 실시간 다중 모드 AI 애플리케이션을 구축하기 위한 강력한 플랫폼입니다. VLM(Vision Language Models), TTS(Text-to-Speech), STT(Speech-to-Text)를 위한 저지연 추론과 그래프 기반 오케스트레이션 시스템을 결합하여 빠른 개발 및 배포를 지원합니다.
Alethea AI
Alethea AI는 에이전틱 AI(Agentic AI)와 블록체인의 교차점을 개척하는 연구 개발 연구소입니다. 다중 모달 엔진인 EMOTE-1과 텍스트-캐릭터 시스템인 CharacterGPT를 …
Alethea AI는 에이전틱 AI(Agentic AI)와 블록체인의 교차점을 개척하는 연구 개발 연구소입니다. 다중 모달 엔진인 EMOTE-1과 텍스트-캐릭터 시스템인 CharacterGPT를 통해 상호작용 가능하고 지능적이며 소유 가능한 AI 캐릭터 생성을 지원합니다. 이 플랫폼은 지능형 NFT(iNFT) 및 탈중앙화 AI 분야의 선두 주자로서 개발자가 온체인에서 자율 AI 에이전트를 구축하고 배포할 수 있도록 지원합니다.
Fluxx
fluxx는 FLUX.1 Kontext 모델로 구동되는 혁신적인 AI 이미지 편집 및 생성 플랫폼입니다. 텍스트와 시각적 맥락을 모두 독특하게 이해하여 …
fluxx는 FLUX.1 Kontext 모델로 구동되는 혁신적인 AI 이미지 편집 및 생성 플랫폼입니다. 텍스트와 시각적 맥락을 모두 독특하게 이해하여 정밀한 로컬 편집, 여러 장면에서의 캐릭터 일관성 유지, 간단한 텍스트 지침을 통한 스타일 변환을 가능하게 합니다. Stable Diffusion의 개발팀이 개발했으며, 뛰어난 속도로 전문가 수준의 결과를 제공합니다.
HIX.AI
HIX.AI는 GPT-4o, Claude, Gemini와 같은 최첨단 모델을 통합하여 다양한 작업을 수행하는 강력한 올인원 AI 플랫폼입니다. 고급 AI 챗봇, …
HIX.AI는 GPT-4o, Claude, Gemini와 같은 최첨단 모델을 통합하여 다양한 작업을 수행하는 강력한 올인원 AI 플랫폼입니다. 고급 AI 챗봇, AI 작가, 이미지 및 비디오 생성기, 숙제 도우미, AI 탐지 회피 도구를 제공합니다. 이 포괄적인 제품군은 콘텐츠 제작자, 마케터, 학생 및 기업이 창의적이고 생산적인 워크플로우를 한 곳에서 간소화할 수 있도록 설계되었습니다.
PowerBrain AI
PowerBrain AI는 업무, 학습, 생활을 위한 다재다능한 AI 챗봇 어시스턴트입니다. iOS 및 Android에서 사용 가능하며, 콘텐츠 생성기, AI …
PowerBrain AI는 업무, 학습, 생활을 위한 다재다능한 AI 챗봇 어시스턴트입니다. iOS 및 Android에서 사용 가능하며, 콘텐츠 생성기, AI 작가, 숙제 도우미, 광고 없는 AI 검색 엔진으로 기능합니다. 텍스트와 이미지를 처리하는 멀티모달 기능을 갖추고 있으며, 개인화된 상호작용을 위한 다양한 AI 페르소나를 제공하여 모든 사용자의 생산성과 창의성을 향상시키는 것을 목표로 합니다.
Google Gemini
Google Gemini는 창의성과 생산성을 향상시키기 위해 설계된 강력한 멀티모달 AI 어시스턴트입니다. 텍스트, 코드, 이미지, 비디오를 이해하고 처리하여 글쓰기, …
Google Gemini는 창의성과 생산성을 향상시키기 위해 설계된 강력한 멀티모달 AI 어시스턴트입니다. 텍스트, 코드, 이미지, 비디오를 이해하고 처리하여 글쓰기, 계획, 학습 및 창작 활동을 돕습니다. Google 생태계와 통합되어 고급 콘텐츠 생성, 심층 연구, Google 앱 내 원활한 협업과 같은 기능을 제공합니다.
Felo Chat
Felo Chat은 GPT-4o, Claude, Gemini와 같은 최고의 AI 모델에 무료로 액세스할 수 있는 다목적 AI 어시스턴트 플랫폼입니다. 코딩, …
Felo Chat은 GPT-4o, Claude, Gemini와 같은 최고의 AI 모델에 무료로 액세스할 수 있는 다목적 AI 어시스턴트 플랫폼입니다. 코딩, 콘텐츠 제작, 번역, 데이터 분석 등 다양한 작업을 위한 전문 AI 봇의 방대한 라이브러리를 갖추고 있습니다. 텍스트, 파일, 이미지 업로드를 지원하여 전문가, 학생, 크리에이터를 위한 포괄적인 올인원 솔루션을 제공합니다.
Seeles
seeles는 간단한 텍스트 프롬프트를 완전한 플레이 가능한 3D 게임 세계로 변환하는 선구적인 엔드투엔드 멀티모달 AI 플랫폼입니다. 코딩 없이 …
seeles는 간단한 텍스트 프롬프트를 완전한 플레이 가능한 3D 게임 세계로 변환하는 선구적인 엔드투엔드 멀티모달 AI 플랫폼입니다. 코딩 없이 모든 수준의 크리에이터가 상호작용 가능한 환경, 캐릭터, 게임 메커니즘을 생성하고 무한히 리믹스할 수 있도록 지원합니다. 레이싱 게임부터 미스터리 어드벤처까지, seeles는 게임 개발을 모두에게 접근 가능하게 만들어 창작과 플레이를 재정의합니다.
Reka
Reka는 실제 세계에 영향을 미치도록 설계된 강력한 멀티모달 AI 모델 및 솔루션 제품군을 제공합니다. 초소형 Spark 모델부터 최첨단 …
Reka는 실제 세계에 영향을 미치도록 설계된 강력한 멀티모달 AI 모델 및 솔루션 제품군을 제공합니다. 초소형 Spark 모델부터 최첨단 Core 모델에 이르기까지 Reka의 기술은 텍스트, 이미지, 오디오 및 비디오를 이해하고 처리합니다. 개발자, 기업 및 콘텐츠 제작자를 위해 지능형 비디오 분석을 위한 Reka Vision 및 자동화된 소셜 미디어 클립 생성을 위한 Reka for Creators와 같은 애플리케이션을 지원합니다.
Google AI for Developers
Google이 개발자를 위해 제공하는 포괄적인 플랫폼으로, API를 통해 Gemini, Imagen, Veo와 같은 최첨단 AI 모델과 Gemma 오픈 소스 …
Google이 개발자를 위해 제공하는 포괄적인 플랫폼으로, API를 통해 Gemini, Imagen, Veo와 같은 최첨단 AI 모델과 Gemma 오픈 소스 모델에 대한 액세스를 제공합니다. 프로토타이핑을 위한 Google AI Studio, 온디바이스 배포를 위한 AI Edge, 통합 코드 지원 도구를 포함하여 개발자가 혁신적인 애플리케이션을 책임감 있게 구축하고 개발 워크플로우를 간소화할 수 있도록 지원합니다.
Pi
Pi(Presentation Intelligence)는 콘텐츠 제작을 혁신하는 AI 네이티브 플랫폼입니다. 고급 멀티모달 AI 및 디자인 엔지니어링을 사용하여 간단한 프롬프트, PDF, …
Pi(Presentation Intelligence)는 콘텐츠 제작을 혁신하는 AI 네이티브 플랫폼입니다. 고급 멀티모달 AI 및 디자인 엔지니어링을 사용하여 간단한 프롬프트, PDF, 웹사이트 또는 데이터로부터 멋진 프레젠테이션과 문서를 자동으로 생성합니다. Pi는 콘텐츠 구조화, 레이아웃 디자인, 정보 시각화를 지능적으로 수행하며 모든 기기에서 원활하고 유연한 경험을 보장하여 전문가 수준의 디자인을 누구나 이용할 수 있게 합니다.
GPT-4 Vision Chatbot
GPT-4 비전 기술로 구동되는 코드 없는 고급 AI 챗봇 빌더 플랫폼입니다. 텍스트, 문서, 웹사이트 및 이미지를 기반으로 챗봇을 …
GPT-4 비전 기술로 구동되는 코드 없는 고급 AI 챗봇 빌더 플랫폼입니다. 텍스트, 문서, 웹사이트 및 이미지를 기반으로 챗봇을 훈련시켜 사용자에게 다중 모드 대화형 경험을 제공하세요. 고객 지원, 교육 및 사용자 참여 강화에 이상적입니다.
Llama
Llama는 Meta의 오픈소스 대규모 언어 모델(LLM) 제품군입니다. 최신 세대인 Llama 4는 네이티브 멀티모달리티, 효율성을 위한 전문가 혼합(MoE) 아키텍처, …
Llama는 Meta의 오픈소스 대규모 언어 모델(LLM) 제품군입니다. 최신 세대인 Llama 4는 네이티브 멀티모달리티, 효율성을 위한 전문가 혼합(MoE) 아키텍처, 방대한 컨텍스트 창을 통해 업계 최고의 성능을 자랑합니다. 개발자와 기업이 다운로드 가능한 모델과 간소화된 API를 통해 고급적이고 확장 가능하며 책임감 있는 AI 애플리케이션을 구축하고 배포할 수 있도록 설계되었습니다.
TwelveLabs
TwelveLabs는 강력한 멀티모달 AI 비디오 이해 플랫폼입니다. 개발자가 비디오 콘텐츠에서 텍스트를 검색, 분석 및 생성하는 애플리케이션을 구축할 수 …
TwelveLabs는 강력한 멀티모달 AI 비디오 이해 플랫폼입니다. 개발자가 비디오 콘텐츠에서 텍스트를 검색, 분석 및 생성하는 애플리케이션을 구축할 수 있도록 API와 SDK를 제공합니다. 시각, 오디오 및 음성을 이해하여 대규모 비디오 라이브러리에서 깊은 통찰력을 얻을 수 있습니다.
myunite
myunite는 최고의 비디오, 이미지, 음성 생성 AI 모델을 하나의 간소화된 인터페이스로 통합한 통합 AI 크리에이티브 플랫폼입니다. Veo 2, …
myunite는 최고의 비디오, 이미지, 음성 생성 AI 모델을 하나의 간소화된 인터페이스로 통합한 통합 AI 크리에이티브 플랫폼입니다. Veo 2, Kling, Luma, Ideogram, Flux와 같은 최상위 도구에 액세스하여 멋진 멀티미디어 콘텐츠를 손쉽게 제작하세요. 강력한 워크플로우 자동화 기능을 통해 myunite는 전체 크리에이티브 프로세스를 단순화하여 마케터, 크리에이터, 비즈니스를 위한 궁극적인 올인원 솔루션을 제공합니다.
Scriptaa
Scriptaa는 매력적인 콘텐츠, 이미지, 오디오를 제작하기 위해 설계된 멀티모달 생성형 AI 플랫폼입니다. 콘텐츠 생성 속도를 10배 높여 사용자의 …
Scriptaa는 매력적인 콘텐츠, 이미지, 오디오를 제작하기 위해 설계된 멀티모달 생성형 AI 플랫폼입니다. 콘텐츠 생성 속도를 10배 높여 사용자의 생산성을 향상시키고, 브랜드에 맞는 고품질 자료를 생성하도록 돕습니다. 주요 기능으로는 브랜드 보이스 일관성, 개인 정보 보호 강화를 위한 제로 데이터 보존 정책, 다국어 기능, 정확하고 맥락에 맞는 결과물을 위한 RAG 프레임워크가 있습니다.
iFlytek Spark
iFlytek Spark는 iFlytek이 개발한 포괄적인 AI 어시스턴트 및 대규모 언어 모델 플랫폼입니다. 심층 추론, 멀티모달 상호작용, 130개 이상의 …
iFlytek Spark는 iFlytek이 개발한 포괄적인 AI 어시스턴트 및 대규모 언어 모델 플랫폼입니다. 심층 추론, 멀티모달 상호작용, 130개 이상의 언어를 지원하는 언어 이해 능력에 뛰어납니다. 이 플랫폼은 대화형 AI, AI 검색, 개발자 API, 미세 조정을 위한 서비스형 모델(MaaS) 플랫폼을 포함한 도구 모음을 제공하여 개인 사용자뿐만 아니라 교육, 의료, 금융 등 다양한 산업의 기업을 지원합니다.
Morphik
Morphik은 매우 정확한 검색 증강 생성(RAG) 시스템 및 AI 에이전트를 구축하기 위한 고급 개발자 플랫폼입니다. 다이어그램과 회로도를 포함한 …
Morphik은 매우 정확한 검색 증강 생성(RAG) 시스템 및 AI 에이전트를 구축하기 위한 고급 개발자 플랫폼입니다. 다이어그램과 회로도를 포함한 복잡하고 특정 분야의 문서를 이해하기 위해 시각 우선 검색을 사용하여 환각을 제거하는 데 특화되어 있습니다. 단 두 줄의 코드로 배포할 수 있으며, 엔터프라이즈급 AI 애플리케이션을 위한 우수한 성능, 속도 및 확장성을 제공합니다.
Chat 4O AI
Chat 4O AI는 최고의 대규모 언어 모델, 이미지 생성기 및 비디오 제작 도구를 통합한 올인원 AI 플랫폼입니다. 단일하고 …
Chat 4O AI는 최고의 대규모 언어 모델, 이미지 생성기 및 비디오 제작 도구를 통합한 올인원 AI 플랫폼입니다. 단일하고 사용자 친화적인 인터페이스를 통해 GPT-4o, Claude 3.5, Gemini 2.5와 같은 모델에 액세스하여 복잡한 문제를 해결하고, 멋진 시각 자료를 생성하며, 동적 비디오를 제작하여 생산성과 창의성을 향상시키세요.