년 최고의 멀티모달 AI AI 도구

KarmaBox

KarmaBox는 모든 AI 도구, 모델, 에이전트를 iPhone에 하나의 비공개 Always-On 슈퍼브레인으로 통합하는 주권 AI 주조소 앱입니다. 병렬 작업 …

KarmaBox는 모든 AI 도구, 모델, 에이전트를 iPhone에 하나의 비공개 Always-On 슈퍼브레인으로 통합하는 주권 AI 주조소 앱입니다. 병렬 작업 실행과 지속적 메모리를 가능하게 합니다.

개인 비서

2.8K

Wan2_7

Wan2_7은 텍스트, 이미지, 오디오, 비디오를 고품질이고 일관된 비디오 콘텐츠로 변환하는 고급 멀티모달 AI 비디오 생성 플랫폼입니다. 캐릭터 일관성 …

Wan2_7은 텍스트, 이미지, 오디오, 비디오를 고품질이고 일관된 비디오 콘텐츠로 변환하는 고급 멀티모달 AI 비디오 생성 플랫폼입니다. 캐릭터 일관성 유지, 비디오 시퀀스 논리적 확장, 정확한 오디오-비주얼 동기화에 탁월하여 크리에이터와 팀에 이상적인 도구입니다.

AI 비디오 생성

4.5K

LLMRTC

LLMRTC는 실시간 음성 및 비전 AI 애플리케이션 구축을 위한 TypeScript SDK입니다. WebRTC의 낮은 지연 시간 오디오/비디오 스트리밍과 LLM, …

LLMRTC는 실시간 음성 및 비전 AI 애플리케이션 구축을 위한 TypeScript SDK입니다. WebRTC의 낮은 지연 시간 오디오/비디오 스트리밍과 LLM, 음성-텍스트 변환, 텍스트-음성 변환 기술을 통합된, 공급자 독립적인 API를 통해 원활하게 결합합니다. 개발자는 애플리케이션 로직에 집중할 수 있으며, LLMRTC는 복잡한 대화형 AI 인프라를 처리합니다.

SDK

2.8K

Langtrain

Langtrain은 개발자와 엔지니어링 팀이 최소한의 코드로 대규모 언어 모델(LLM)을 미세 조정, 배포 및 관리할 수 있도록 설계된 강력한 …

Langtrain은 개발자와 엔지니어링 팀이 최소한의 코드로 대규모 언어 모델(LLM)을 미세 조정, 배포 및 관리할 수 있도록 설계된 강력한 플랫폼입니다. 시각적 인터페이스를 제공하며 LLaMA 및 Mistral과 같은 인기 있는 오픈 소스 모델을 지원하고 로컬 또는 보안 클라우드 훈련을 통해 데이터 프라이버시를 보장합니다.

Llmfinetuning

2.8K

Rixx

Rixx는 단순한 정보 검색을 넘어 심층적인 이해를 제공하도록 설계된 AI 기반 연구 엔진입니다. 수백 개의 출처에서 복잡한 정보를 …

Rixx는 단순한 정보 검색을 넘어 심층적인 이해를 제공하도록 설계된 AI 기반 연구 엔진입니다. 수백 개의 출처에서 복잡한 정보를 구조화되고 검증 가능한 답변으로 종합하여 전문가, 학생, 엔지니어에게 심오한 통찰력을 제공하는 지칠 줄 모르는 연구 조교 역할을 합니다.

Deep Search

2.8K

GenAI List

GenAI List는 생성형 AI 모델을 추적, 탐색 및 비교하기 위한 포괄적인 온라인 디렉토리입니다. 빠르게 발전하는 AI 환경에 대한 …

GenAI List는 생성형 AI 모델을 추적, 탐색 및 비교하기 위한 포괄적인 온라인 디렉토리입니다. 빠르게 발전하는 AI 환경에 대한 필수 가이드 역할을 하며, 다양한 조직의 수천 가지 모델을 제공합니다. 사용자는 새로운 릴리스를 발견하고, 유형, 개방성, 기능별로 필터링하며, 실무자 의견에 대한 통찰력을 얻을 수 있습니다.

Model Discovery

2.8K

Nexa SDK

Nexa SDK는 개발자가 최첨단 AI 모델을 포함한 모든 AI 모델을 모바일, PC, IoT, 자동차 등 모든 장치에 몇 …

Nexa SDK는 개발자가 최첨단 AI 모델을 포함한 모든 AI 모델을 모바일, PC, IoT, 자동차 등 모든 장치에 몇 분 만에 배포할 수 있도록 지원하는 강력한 툴킷입니다. NPU, GPU, CPU 전반에 걸쳐 하드웨어 가속을 통한 생산 준비된 온디바이스 추론을 제공하며, 속도와 에너지 효율성을 위해 최적화되었습니다.

Ai Development Kit

9.4K

MiMo

MiMo는 샤오미의 고급 대규모 AI 모델로, 깊은 언어 이해와 실제 물리적 세계 인식을 통합하여 지능을 재정의하도록 설계되었습니다. 지능형 …

MiMo는 샤오미의 고급 대규모 AI 모델로, 깊은 언어 이해와 실제 물리적 세계 인식을 통합하여 지능을 재정의하도록 설계되었습니다. 지능형 동반자 역할을 하며 예측 지원, 창의적 생성 기능을 제공하고 원활한 인간-기계 협업을 촉진합니다.

Largelanguagemodels

1.2M

Kling O1

Kling O1은 텍스트, 이미지, 비디오 참조를 통해 고품질 비디오를 손쉽게 생성, 편집, 제작할 수 있는 세계 최초의 통합 …

Kling O1은 텍스트, 이미지, 비디오 참조를 통해 고품질 비디오를 손쉽게 생성, 편집, 제작할 수 있는 세계 최초의 통합 멀티모달 AI 비디오 모델입니다. 일관된 캐릭터 생성, 멀티태스킹 융합, 유연한 길이 제어 등 고급 기능을 제공하며, 특별한 하드웨어 없이 클라우드에서 완벽하게 실행되어 다양한 창의적 프로젝트에 적합합니다.

AI 비디오 제작

4.0K

AI Loft

AI Loft는 크리에이터와 시각 예술가를 위해 설계된 다중 모드 AI 창작 플랫폼입니다. Sora 2 및 Nano Banana Pro와 …

AI Loft는 크리에이터와 시각 예술가를 위해 설계된 다중 모드 AI 창작 플랫폼입니다. Sora 2 및 Nano Banana Pro와 같은 최첨단 AI 모델을 사용하여 텍스트나 이미지에서 놀라운 이미지, 비디오를 생성하고 스타일 전송을 수행할 수 있습니다. 이중 언어 프롬프트 지원과 유연한 가격으로 빠르고 손쉬운 콘텐츠 제작을 경험하세요.

이미지 생성

2.7K

Amazon Nova

Amazon Nova는 아마존이 개발한 차세대 파운데이션 모델 제품군입니다. 텍스트, 코드, 이미지, 비디오 및 인간과 유사한 음성을 생성하기 위한 …

Amazon Nova는 아마존이 개발한 차세대 파운데이션 모델 제품군입니다. 텍스트, 코드, 이미지, 비디오 및 인간과 유사한 음성을 생성하기 위한 다양한 특수 모델을 제공하며, 고성능 및 비용 효율성을 위해 설계되었습니다. 개발자는 Amazon Bedrock을 통해 이러한 모델에 액세스할 수 있습니다.

기반 모델

214.6K

Seed

Seed는 범용 인공지능 구축에 중점을 둔 ByteDance의 첨단 AI 연구 이니셔티브입니다. 멀티모달, 비전, 음성, 로보틱스, LLM 등 다양한 …

Seed는 범용 인공지능 구축에 중점을 둔 ByteDance의 첨단 AI 연구 이니셔티브입니다. 멀티모달, 비전, 음성, 로보틱스, LLM 등 다양한 분야의 기초 모델을 개발하여 학술 연구와 실제 응용 분야의 혁신을 주도합니다.

기반 모델

1.3M

무료

Yugong

Yugong은 AI 창작물, 프롬프트, 프로젝트 및 사례 연구를 발견하고 공유하기 위한 글로벌 커뮤니티 플랫폼입니다. 사용자가 상세한 AI 워크플로우를 …

Yugong은 AI 창작물, 프롬프트, 프로젝트 및 사례 연구를 발견하고 공유하기 위한 글로벌 커뮤니티 플랫폼입니다. 사용자가 상세한 AI 워크플로우를 게시하고, 전 세계 사용자와 소통하며, ChatGPT, Gemini, Perplexity와 같은 AI 도구의 혁신적인 응용 프로그램을 탐색할 수 있도록 지원합니다.

프롬프트 공유

2.7K

Koyal

Koyal은 스크립트나 오디오를 일관된 캐릭터와 스토리라인을 가진 매력적인 영상으로 변환하는 에이전트 AI 플랫폼입니다. 고급 멀티모달 AI를 활용하여 사실적, …

Koyal은 스크립트나 오디오를 일관된 캐릭터와 스토리라인을 가진 매력적인 영상으로 변환하는 에이전트 AI 플랫폼입니다. 고급 멀티모달 AI를 활용하여 사실적, 애니메이션, 스케치 등 다양한 스타일로 맞춤형 캐릭터, 설정, 애니메이션을 생성하며, 특허 출원 중인 C.H.A.R.C.H.A. 기술을 통해 개인화된 아바타를 제공합니다.

AI 비디오

11.9K

Zuvu

Zuvu는 차세대 AI 에이전트 플랫폼으로, 스마트 라우터 역할을 하여 OpenAI GPT-5, Anthropic Claude, Google Gemini와 같은 다양한 고급 …

Zuvu는 차세대 AI 에이전트 플랫폼으로, 스마트 라우터 역할을 하여 OpenAI GPT-5, Anthropic Claude, Google Gemini와 같은 다양한 고급 AI 모델에 대한 액세스를 제공하며, 다양한 영역에 걸쳐 복잡한 에이전트 워크플로우를 지원합니다.

AI 에이전트

16.4K

Mixhubai

Mixhubai는 최고의 채팅, 이미지 및 비디오 생성 모델을 통합한 올인원 AI 플랫폼입니다. 단일 구독으로 GPT-5, Sora 2, Kling, …

Mixhubai는 최고의 채팅, 이미지 및 비디오 생성 모델을 통합한 올인원 AI 플랫폼입니다. 단일 구독으로 GPT-5, Sora 2, Kling, Seedream 4.0 등에 액세스할 수 있습니다. 초보자와 전문가 모두에게 적합한 사용하기 쉬운 웹 기반 인터페이스를 통해 텍스트, 이미지 또는 오디오로 고품질 콘텐츠를 만드세요.

비디오 생성

103.3K

DreamOmni2

DreamOmni2는 고급 이미지 생성 및 편집을 위한 멀티모달 AI 도구입니다. 텍스트 및 이미지 프롬프트를 모두 사용하여 시각 자료를 …

DreamOmni2는 고급 이미지 생성 및 편집을 위한 멀티모달 AI 도구입니다. 텍스트 및 이미지 프롬프트를 모두 사용하여 시각 자료를 생성하고 변환할 수 있으며, 디자인부터 광고까지 다양한 응용 분야에서 뛰어난 일관성과 창의적 제어를 보장합니다.

텍스트-이미지 변환

2.8K

Seedream 4

Seedream 4는 ByteDance가 개발한 전문 AI 이미지 생성 및 편집 도구로, 초고속으로 4K 해상도까지의 초현실적이고 상세한 이미지를 생성할 …

Seedream 4는 ByteDance가 개발한 전문 AI 이미지 생성 및 편집 도구로, 초고속으로 4K 해상도까지의 초현실적이고 상세한 이미지를 생성할 수 있습니다. 텍스트-이미지, 이미지-이미지, 창의적 업스케일링, 다중 이미지 생성과 같은 고급 기능을 제공하여 디지털 아티스트와 콘텐츠 제작자에게 강력한 도구입니다.

텍스트-이미지 변환

2.7K

Seedream4

Seedream4는 전례 없는 속도와 품질로 아이디어를 전문적인 시각 자료로 변환하는 차세대 AI 이미지 생성 및 편집기입니다. 멀티모달 생성, …

Seedream4는 전례 없는 속도와 품질로 아이디어를 전문적인 시각 자료로 변환하는 차세대 AI 이미지 생성 및 편집기입니다. 멀티모달 생성, 고급 편집 및 4K 해상도 출력을 제공하여 다양한 요구 사항을 충족하는 올인원 크리에이티브 허브입니다.

텍스트-이미지 변환

22.8K

Wan25

Wan25는 동기화된 오디오-비디오 콘텐츠 생성을 위한 혁신적인 네이티브 멀티모달 AI 플랫폼입니다. 텍스트나 이미지를 통해 1080p HD 시네마틱 비디오와 …

Wan25는 동기화된 오디오-비디오 콘텐츠 생성을 위한 혁신적인 네이티브 멀티모달 AI 플랫폼입니다. 텍스트나 이미지를 통해 1080p HD 시네마틱 비디오와 고품질 이미지를 생성하며, 고급 편집 기능을 제공합니다. 통합 아키텍처와 RLHF를 활용하여 Wan25는 전 세계 크리에이터와 연구자들에게 전문적인 수준의 고품질 및 인간 선호도에 맞는 결과를 제공합니다.

멀티모달 비디오

57.7K

Seedream 4

Seedream 4는 초고속 2K 이미지 및 비디오 생성과 편집을 위한 최첨단 멀티모달 AI 플랫폼입니다. 고급 MoE 아키텍처를 활용하여 …

Seedream 4는 초고속 2K 이미지 및 비디오 생성과 편집을 위한 최첨단 멀티모달 AI 플랫폼입니다. 고급 MoE 아키텍처를 활용하여 정확한 텍스트-이미지 생성, 다중 참조 처리 및 일괄 생성을 제공하며, 전 세계 크리에이터를 위해 영어와 중국어 프롬프트를 모두 지원합니다.

텍스트-이미지 변환

68.9K

Gabber

Gabber는 보고, 듣고, 말할 수 있는 실시간 다중 모드 AI 애플리케이션을 구축하기 위한 강력한 플랫폼입니다. VLM(Vision Language Models), …

Gabber는 보고, 듣고, 말할 수 있는 실시간 다중 모드 AI 애플리케이션을 구축하기 위한 강력한 플랫폼입니다. VLM(Vision Language Models), TTS(Text-to-Speech), STT(Speech-to-Text)를 위한 저지연 추론과 그래프 기반 오케스트레이션 시스템을 결합하여 빠른 개발 및 배포를 지원합니다.

실시간 AI

4.8K

Amarsia

Amarsia는 팀이 맞춤형 AI 기능을 손쉽게 구축, 배포 및 API로 모니터링할 수 있도록 설계된 직관적인 플랫폼입니다. 광범위한 코딩이나 …

Amarsia는 팀이 맞춤형 AI 기능을 손쉽게 구축, 배포 및 API로 모니터링할 수 있도록 설계된 직관적인 플랫폼입니다. 광범위한 코딩이나 AI 엔지니어링 전문 지식이 필요 없으며, 내장된 버전 제어 및 성능 모니터링을 통해 지능형 워크플로, 지식 기반 및 다중 모드 AI 솔루션을 신속하게 개발할 수 있습니다.

워크플로우 자동화

2.7K

Alethea AI

Alethea AI는 에이전틱 AI(Agentic AI)와 블록체인의 교차점을 개척하는 연구 개발 연구소입니다. 다중 모달 엔진인 EMOTE-1과 텍스트-캐릭터 시스템인 CharacterGPT를 …

Alethea AI는 에이전틱 AI(Agentic AI)와 블록체인의 교차점을 개척하는 연구 개발 연구소입니다. 다중 모달 엔진인 EMOTE-1과 텍스트-캐릭터 시스템인 CharacterGPT를 통해 상호작용 가능하고 지능적이며 소유 가능한 AI 캐릭터 생성을 지원합니다. 이 플랫폼은 지능형 NFT(iNFT) 및 탈중앙화 AI 분야의 선두 주자로서 개발자가 온체인에서 자율 AI 에이전트를 구축하고 배포할 수 있도록 지원합니다.

블록체인

2.6K

무료

Zyphra

Zyphra는 고성능, 고효율의 기초 모델을 개발하는 오픈소스 AI 연구 회사입니다. 개발자와 연구원을 위해 최첨단 소형 언어 모델(SLM), 텍스트 …

Zyphra는 고성능, 고효율의 기초 모델을 개발하는 오픈소스 AI 연구 회사입니다. 개발자와 연구원을 위해 최첨단 소형 언어 모델(SLM), 텍스트 음성 변환(TTS) 시스템 및 전문 추론 모델을 제공하며, 온디바이스 및 엔터프라이즈 애플리케이션을 위한 고급 AI의 민주화에 중점을 둡니다.

언어 모델

20.8K

Qwen

Qwen은 Alibaba Cloud의 강력한 멀티모달 AI 채팅 어시스턴트입니다. 자연어 대화, 콘텐츠 제작, 코드 생성, 데이터 분석 및 이미지 …

Qwen은 Alibaba Cloud의 강력한 멀티모달 AI 채팅 어시스턴트입니다. 자연어 대화, 콘텐츠 제작, 코드 생성, 데이터 분석 및 이미지 생성에 탁월합니다. 통합된 웹 검색 및 문서 분석 기능을 통해 Qwen은 다양한 작업에 대해 포괄적이고 최신의 정확한 답변을 제공합니다.

챗봇

34.7M

Fluxx

fluxx는 FLUX.1 Kontext 모델로 구동되는 혁신적인 AI 이미지 편집 및 생성 플랫폼입니다. 텍스트와 시각적 맥락을 모두 독특하게 이해하여 …

fluxx는 FLUX.1 Kontext 모델로 구동되는 혁신적인 AI 이미지 편집 및 생성 플랫폼입니다. 텍스트와 시각적 맥락을 모두 독특하게 이해하여 정밀한 로컬 편집, 여러 장면에서의 캐릭터 일관성 유지, 간단한 텍스트 지침을 통한 스타일 변환을 가능하게 합니다. Stable Diffusion의 개발팀이 개발했으며, 뛰어난 속도로 전문가 수준의 결과를 제공합니다.

이미지 편집

5.8K

HIX.AI

HIX.AI는 GPT-4o, Claude, Gemini와 같은 최첨단 모델을 통합하여 다양한 작업을 수행하는 강력한 올인원 AI 플랫폼입니다. 고급 AI 챗봇, …

HIX.AI는 GPT-4o, Claude, Gemini와 같은 최첨단 모델을 통합하여 다양한 작업을 수행하는 강력한 올인원 AI 플랫폼입니다. 고급 AI 챗봇, AI 작가, 이미지 및 비디오 생성기, 숙제 도우미, AI 탐지 회피 도구를 제공합니다. 이 포괄적인 제품군은 콘텐츠 제작자, 마케터, 학생 및 기업이 창의적이고 생산적인 워크플로우를 한 곳에서 간소화할 수 있도록 설계되었습니다.

올인원

1.1M

PowerBrain AI

PowerBrain AI는 업무, 학습, 생활을 위한 다재다능한 AI 챗봇 어시스턴트입니다. iOS 및 Android에서 사용 가능하며, 콘텐츠 생성기, AI …

PowerBrain AI는 업무, 학습, 생활을 위한 다재다능한 AI 챗봇 어시스턴트입니다. iOS 및 Android에서 사용 가능하며, 콘텐츠 생성기, AI 작가, 숙제 도우미, 광고 없는 AI 검색 엔진으로 기능합니다. 텍스트와 이미지를 처리하는 멀티모달 기능을 갖추고 있으며, 개인화된 상호작용을 위한 다양한 AI 페르소나를 제공하여 모든 사용자의 생산성과 창의성을 향상시키는 것을 목표로 합니다.

어시스턴트

8.6K

XPDF AI

xPDF AI는 PDF 문서와의 상호 작용을 혁신하는 개인 AI 비서입니다. 모든 PDF와 채팅하고, 질문하며, 텍스트, 표, 그림에서 즉각적인 …

xPDF AI는 PDF 문서와의 상호 작용을 혁신하는 개인 AI 비서입니다. 모든 PDF와 채팅하고, 질문하며, 텍스트, 표, 그림에서 즉각적인 답변을 얻으세요. 다중 모드 분석, AI 요약기, 보고서 생성 및 음성 활성화 인터페이스를 갖추고 있어 학생, 연구원, 전문가가 신속하게 통찰력을 추출하고 생산성을 높이는 데 필수적인 도구입니다.

문서 분석

2.8K

Google Gemini

Google Gemini는 창의성과 생산성을 향상시키기 위해 설계된 강력한 멀티모달 AI 어시스턴트입니다. 텍스트, 코드, 이미지, 비디오를 이해하고 처리하여 글쓰기, …

Google Gemini는 창의성과 생산성을 향상시키기 위해 설계된 강력한 멀티모달 AI 어시스턴트입니다. 텍스트, 코드, 이미지, 비디오를 이해하고 처리하여 글쓰기, 계획, 학습 및 창작 활동을 돕습니다. Google 생태계와 통합되어 고급 콘텐츠 생성, 심층 연구, Google 앱 내 원활한 협업과 같은 기능을 제공합니다.

어시스턴트

34.4M

Felo Chat

Felo Chat은 GPT-4o, Claude, Gemini와 같은 최고의 AI 모델에 무료로 액세스할 수 있는 다목적 AI 어시스턴트 플랫폼입니다. 코딩, …

Felo Chat은 GPT-4o, Claude, Gemini와 같은 최고의 AI 모델에 무료로 액세스할 수 있는 다목적 AI 어시스턴트 플랫폼입니다. 코딩, 콘텐츠 제작, 번역, 데이터 분석 등 다양한 작업을 위한 전문 AI 봇의 방대한 라이브러리를 갖추고 있습니다. 텍스트, 파일, 이미지 업로드를 지원하여 전문가, 학생, 크리에이터를 위한 포괄적인 올인원 솔루션을 제공합니다.

어시스턴트

8.4K

Seeles

seeles는 간단한 텍스트 프롬프트를 완전한 플레이 가능한 3D 게임 세계로 변환하는 선구적인 엔드투엔드 멀티모달 AI 플랫폼입니다. 코딩 없이 …

seeles는 간단한 텍스트 프롬프트를 완전한 플레이 가능한 3D 게임 세계로 변환하는 선구적인 엔드투엔드 멀티모달 AI 플랫폼입니다. 코딩 없이 모든 수준의 크리에이터가 상호작용 가능한 환경, 캐릭터, 게임 메커니즘을 생성하고 무한히 리믹스할 수 있도록 지원합니다. 레이싱 게임부터 미스터리 어드벤처까지, seeles는 게임 개발을 모두에게 접근 가능하게 만들어 창작과 플레이를 재정의합니다.

게임 개발

147.4K

Qwen

Qwen은 Alibaba Cloud에서 개발한 강력한 오픈소스 대규모 언어 및 멀티모달 모델 제품군입니다. 대화형 AI, 최첨단 코드 생성, 정밀한 …

Qwen은 Alibaba Cloud에서 개발한 강력한 오픈소스 대규모 언어 및 멀티모달 모델 제품군입니다. 대화형 AI, 최첨단 코드 생성, 정밀한 텍스트 렌더링을 갖춘 고급 이미지 생성, 고품질 다국어 번역 등 광범위한 작업에서 뛰어난 성능을 발휘하여 전 세계 개발자와 크리에이터에게 힘을 실어줍니다.

코드 어시스턴트

600.9K

Reka

Reka는 실제 세계에 영향을 미치도록 설계된 강력한 멀티모달 AI 모델 및 솔루션 제품군을 제공합니다. 초소형 Spark 모델부터 최첨단 …

Reka는 실제 세계에 영향을 미치도록 설계된 강력한 멀티모달 AI 모델 및 솔루션 제품군을 제공합니다. 초소형 Spark 모델부터 최첨단 Core 모델에 이르기까지 Reka의 기술은 텍스트, 이미지, 오디오 및 비디오를 이해하고 처리합니다. 개발자, 기업 및 콘텐츠 제작자를 위해 지능형 비디오 분석을 위한 Reka Vision 및 자동화된 소셜 미디어 클립 생성을 위한 Reka for Creators와 같은 애플리케이션을 지원합니다.

머신러닝

237.0K

Google AI for Developers

Google이 개발자를 위해 제공하는 포괄적인 플랫폼으로, API를 통해 Gemini, Imagen, Veo와 같은 최첨단 AI 모델과 Gemma 오픈 소스 …

Google이 개발자를 위해 제공하는 포괄적인 플랫폼으로, API를 통해 Gemini, Imagen, Veo와 같은 최첨단 AI 모델과 Gemma 오픈 소스 모델에 대한 액세스를 제공합니다. 프로토타이핑을 위한 Google AI Studio, 온디바이스 배포를 위한 AI Edge, 통합 코드 지원 도구를 포함하여 개발자가 혁신적인 애플리케이션을 책임감 있게 구축하고 개발 워크플로우를 간소화할 수 있도록 지원합니다.

API 플랫폼

11.0M

Google AI

Google AI는 고급 인공지능 모델, 도구 및 연구 이니셔티브를 포함하는 포괄적인 생태계입니다. 강력한 Gemini 모델 제품군, Vertex AI와 …

Google AI는 고급 인공지능 모델, 도구 및 연구 이니셔티브를 포함하는 포괄적인 생태계입니다. 강력한 Gemini 모델 제품군, Vertex AI와 같은 개발자 플랫폼, 그리고 창의성, 생산성, 과학적 발견을 아우르는 애플리케이션을 포함하며, 이 모든 것은 안전과 책임에 대한 약속을 바탕으로 구축되었습니다.

대규모 언어 모델

2.6M

Pi

Pi(Presentation Intelligence)는 콘텐츠 제작을 혁신하는 AI 네이티브 플랫폼입니다. 고급 멀티모달 AI 및 디자인 엔지니어링을 사용하여 간단한 프롬프트, PDF, …

Pi(Presentation Intelligence)는 콘텐츠 제작을 혁신하는 AI 네이티브 플랫폼입니다. 고급 멀티모달 AI 및 디자인 엔지니어링을 사용하여 간단한 프롬프트, PDF, 웹사이트 또는 데이터로부터 멋진 프레젠테이션과 문서를 자동으로 생성합니다. Pi는 콘텐츠 구조화, 레이아웃 디자인, 정보 시각화를 지능적으로 수행하며 모든 기기에서 원활하고 유연한 경험을 보장하여 전문가 수준의 디자인을 누구나 이용할 수 있게 합니다.

프레젠테이션

399.9K

GPT-4 Vision Chatbot

GPT-4 비전 기술로 구동되는 코드 없는 고급 AI 챗봇 빌더 플랫폼입니다. 텍스트, 문서, 웹사이트 및 이미지를 기반으로 챗봇을 …

GPT-4 비전 기술로 구동되는 코드 없는 고급 AI 챗봇 빌더 플랫폼입니다. 텍스트, 문서, 웹사이트 및 이미지를 기반으로 챗봇을 훈련시켜 사용자에게 다중 모드 대화형 경험을 제공하세요. 고객 지원, 교육 및 사용자 참여 강화에 이상적입니다.

챗봇 빌더

2.9K

Llama

Llama는 Meta의 오픈소스 대규모 언어 모델(LLM) 제품군입니다. 최신 세대인 Llama 4는 네이티브 멀티모달리티, 효율성을 위한 전문가 혼합(MoE) 아키텍처, …

Llama는 Meta의 오픈소스 대규모 언어 모델(LLM) 제품군입니다. 최신 세대인 Llama 4는 네이티브 멀티모달리티, 효율성을 위한 전문가 혼합(MoE) 아키텍처, 방대한 컨텍스트 창을 통해 업계 최고의 성능을 자랑합니다. 개발자와 기업이 다운로드 가능한 모델과 간소화된 API를 통해 고급적이고 확장 가능하며 책임감 있는 AI 애플리케이션을 구축하고 배포할 수 있도록 설계되었습니다.

대규모 언어 모델

755.4K

Sesame

Sesame는 자연스럽고 감성 지능이 뛰어난 대화를 통해 상호작용하도록 설계된 생생한 AI 개인 동반자를 개발하고 있습니다. '음성 존재감'에 초점을 …

Sesame는 자연스럽고 감성 지능이 뛰어난 대화를 통해 상호작용하도록 설계된 생생한 AI 개인 동반자를 개발하고 있습니다. '음성 존재감'에 초점을 맞춰 디지털 음성의 '불쾌한 골짜기'를 넘어서는 것을 목표로 합니다. 이 플랫폼은 고급 대화형 음성 모델(CSM)과 경량 안경에 대한 비전을 결합하여 언제 어디서나 함께하는 협력 파트너를 만듭니다.

개인 비서

1.1M

Jiva.ai

Jiva.ai는 신속한 멀티모달 AI 개발을 위한 제로코드, 엔드투엔드 플랫폼입니다. 이를 통해 조직은 광범위한 데이터 과학 전문 지식 없이도 …

Jiva.ai는 신속한 멀티모달 AI 개발을 위한 제로코드, 엔드투엔드 플랫폼입니다. 이를 통해 조직은 광범위한 데이터 과학 전문 지식 없이도 이미지, 비디오, 텍스트, 오디오 및 구조화된 데이터를 사용하여 복잡한 AI 모델을 구축, 훈련 및 배포할 수 있습니다.

노코드 & 로코드

5.0K

TwelveLabs

TwelveLabs는 강력한 멀티모달 AI 비디오 이해 플랫폼입니다. 개발자가 비디오 콘텐츠에서 텍스트를 검색, 분석 및 생성하는 애플리케이션을 구축할 수 …

TwelveLabs는 강력한 멀티모달 AI 비디오 이해 플랫폼입니다. 개발자가 비디오 콘텐츠에서 텍스트를 검색, 분석 및 생성하는 애플리케이션을 구축할 수 있도록 API와 SDK를 제공합니다. 시각, 오디오 및 음성을 이해하여 대규모 비디오 라이브러리에서 깊은 통찰력을 얻을 수 있습니다.

API 및 SDK

161.2K

myunite

myunite는 최고의 비디오, 이미지, 음성 생성 AI 모델을 하나의 간소화된 인터페이스로 통합한 통합 AI 크리에이티브 플랫폼입니다. Veo 2, …

myunite는 최고의 비디오, 이미지, 음성 생성 AI 모델을 하나의 간소화된 인터페이스로 통합한 통합 AI 크리에이티브 플랫폼입니다. Veo 2, Kling, Luma, Ideogram, Flux와 같은 최상위 도구에 액세스하여 멋진 멀티미디어 콘텐츠를 손쉽게 제작하세요. 강력한 워크플로우 자동화 기능을 통해 myunite는 전체 크리에이티브 프로세스를 단순화하여 마케터, 크리에이터, 비즈니스를 위한 궁극적인 올인원 솔루션을 제공합니다.

멀티모달

3.5K

Scriptaa

Scriptaa는 매력적인 콘텐츠, 이미지, 오디오를 제작하기 위해 설계된 멀티모달 생성형 AI 플랫폼입니다. 콘텐츠 생성 속도를 10배 높여 사용자의 …

Scriptaa는 매력적인 콘텐츠, 이미지, 오디오를 제작하기 위해 설계된 멀티모달 생성형 AI 플랫폼입니다. 콘텐츠 생성 속도를 10배 높여 사용자의 생산성을 향상시키고, 브랜드에 맞는 고품질 자료를 생성하도록 돕습니다. 주요 기능으로는 브랜드 보이스 일관성, 개인 정보 보호 강화를 위한 제로 데이터 보존 정책, 다국어 기능, 정확하고 맥락에 맞는 결과물을 위한 RAG 프레임워크가 있습니다.

글쓰기

2.7K

iFlytek Spark

iFlytek Spark는 iFlytek이 개발한 포괄적인 AI 어시스턴트 및 대규모 언어 모델 플랫폼입니다. 심층 추론, 멀티모달 상호작용, 130개 이상의 …

iFlytek Spark는 iFlytek이 개발한 포괄적인 AI 어시스턴트 및 대규모 언어 모델 플랫폼입니다. 심층 추론, 멀티모달 상호작용, 130개 이상의 언어를 지원하는 언어 이해 능력에 뛰어납니다. 이 플랫폼은 대화형 AI, AI 검색, 개발자 API, 미세 조정을 위한 서비스형 모델(MaaS) 플랫폼을 포함한 도구 모음을 제공하여 개인 사용자뿐만 아니라 교육, 의료, 금융 등 다양한 산업의 기업을 지원합니다.

어시스턴트

320.7K

nonfinito

nonfinito는 멀티모달 AI 모델을 평가하고 비교하기 위한 포괄적인 플랫폼입니다. 개발자, 연구원 및 기업이 맞춤형 프롬프트에서 다양한 LLM을 나란히 …

nonfinito는 멀티모달 AI 모델을 평가하고 비교하기 위한 포괄적인 플랫폼입니다. 개발자, 연구원 및 기업이 맞춤형 프롬프트에서 다양한 LLM을 나란히 테스트하고, 통과/실패 등급으로 성능을 평가하며, 원시 출력을 분석할 수 있도록 지원합니다. 모든 작업에 가장 적합한 모델을 찾기 위해 공개 또는 비공개 벤치마크를 생성하세요.

모델 평가

2.7K

Morphik

Morphik은 매우 정확한 검색 증강 생성(RAG) 시스템 및 AI 에이전트를 구축하기 위한 고급 개발자 플랫폼입니다. 다이어그램과 회로도를 포함한 …

Morphik은 매우 정확한 검색 증강 생성(RAG) 시스템 및 AI 에이전트를 구축하기 위한 고급 개발자 플랫폼입니다. 다이어그램과 회로도를 포함한 복잡하고 특정 분야의 문서를 이해하기 위해 시각 우선 검색을 사용하여 환각을 제거하는 데 특화되어 있습니다. 단 두 줄의 코드로 배포할 수 있으며, 엔터프라이즈급 AI 애플리케이션을 위한 우수한 성능, 속도 및 확장성을 제공합니다.

데이터베이스

9.5K

Genie AI

Genie AI는 GPT-4o로 구동되는 다재다능한 멀티모달 AI 어시스턴트입니다. 대화형 AI, 콘텐츠 제작, 3D 모델 생성(Luma 경유), 비즈니스 인텔리전스 …

Genie AI는 GPT-4o로 구동되는 다재다능한 멀티모달 AI 어시스턴트입니다. 대화형 AI, 콘텐츠 제작, 3D 모델 생성(Luma 경유), 비즈니스 인텔리전스 분석(Databricks 경유)을 단일 크로스 플랫폼 인터페이스에 통합했습니다. 팀, 크리에이터, 지식 근로자의 생산성 향상을 위해 설계되었습니다.

AI 챗봇

48.2K

Chat 4O AI

Chat 4O AI는 최고의 대규모 언어 모델, 이미지 생성기 및 비디오 제작 도구를 통합한 올인원 AI 플랫폼입니다. 단일하고 …

Chat 4O AI는 최고의 대규모 언어 모델, 이미지 생성기 및 비디오 제작 도구를 통합한 올인원 AI 플랫폼입니다. 단일하고 사용자 친화적인 인터페이스를 통해 GPT-4o, Claude 3.5, Gemini 2.5와 같은 모델에 액세스하여 복잡한 문제를 해결하고, 멋진 시각 자료를 생성하며, 동적 비디오를 제작하여 생산성과 창의성을 향상시키세요.

올인원

108.5K

년 최고의 멀티모달 AI AI 도구

KarmaBox

Wan2_7

LLMRTC

Langtrain

Rixx

GenAI List

Nexa SDK

MiMo

Kling O1

AI Loft

Amazon Nova

Seed

Yugong

Koyal

Zuvu

Mixhubai

DreamOmni2

Seedream 4

Seedream4

Wan25

Seedream 4

Gabber

Amarsia

Alethea AI

Zyphra

Qwen

Fluxx

HIX.AI

PowerBrain AI

XPDF AI

Google Gemini

Felo Chat

Seeles

Qwen

Reka

Google AI for Developers

Google AI

Pi

GPT-4 Vision Chatbot

Llama

Sesame

Jiva.ai

TwelveLabs

myunite

Scriptaa

iFlytek Spark

nonfinito

Morphik

Genie AI

Chat 4O AI

멀티모달 AI 관련 태그

AI 도구 검색

인기 검색어

카테고리

언어 선택