Plano
Plano는 에이전트형 AI 애플리케이션을 위한 모델 네이티브 전달 인프라로, 에이전트 라우팅, 오케스트레이션, 풍부한 에이전트 추적 및 가드레일 후크와 …
Plano는 에이전트형 AI 애플리케이션을 위한 모델 네이티브 전달 인프라로, 에이전트 라우팅, 오케스트레이션, 풍부한 에이전트 추적 및 가드레일 후크와 같은 중요한 배관 작업을 오프로드합니다. 이는 AI 에이전트의 개발 및 안정적인 프로덕션 배포를 가속화하여 개발자가 핵심 제품 로직에 집중할 수 있도록 합니다. 속도와 신뢰성을 위해 설계된 Plano는 복잡한 AI 인프라 문제를 단순화합니다.
TwoTrim
TwoTrim은 대규모 언어 모델 프롬프트를 실시간으로 지능적으로 압축하여 AI API 비용을 최대 60% 절감하면서 100% 출력 품질을 보장하는 …
TwoTrim은 대규모 언어 모델 프롬프트를 실시간으로 지능적으로 압축하여 AI API 비용을 최대 60% 절감하면서 100% 출력 품질을 보장하는 AI 토큰 최적화 플랫폼입니다. 기업을 위한 안전하고 상태 비저장 방식의 투명한 솔루션을 제공합니다.
Nexlayer
Nexlayer는 AI 코딩 에이전트가 프로덕션 준비 애플리케이션을 신속하게 배포할 수 있도록 설계된 최초의 에이전트 네이티브 클라우드 플랫폼입니다. 복잡한 …
Nexlayer는 AI 코딩 에이전트가 프로덕션 준비 애플리케이션을 신속하게 배포할 수 있도록 설계된 최초의 에이전트 네이티브 클라우드 플랫폼입니다. 복잡한 인프라를 자동화하여 개발자와 창업자가 DevOps 오버헤드 없이 몇 분 만에 풀스택 앱, API 및 데이터베이스를 출시할 수 있도록 합니다.
MCPeasy
MCPeasy는 사용자가 코드 작성이나 인프라 관리 없이 맞춤형 AI 에이전트(MCP)를 구축할 수 있도록 지원하는 서비스입니다. 이 서비스를 통해 …
MCPeasy는 사용자가 코드 작성이나 인프라 관리 없이 맞춤형 AI 에이전트(MCP)를 구축할 수 있도록 지원하는 서비스입니다. 이 서비스를 통해 AI 에이전트는 모든 API 또는 웹훅과 원활하게 통신할 수 있으며, ChatGPT, Claude, Cursor와 같은 인기 AI 클라이언트를 다양한 도구 및 서비스에 몇 분 만에 연결할 수 있습니다.
Cirtus AI
Cirtus AI는 자율 AI 에이전트를 위한 신뢰 계층으로, 분산형 신원, 안전한 격리 지갑 및 검증 가능한 온체인 평판을 …
Cirtus AI는 자율 AI 에이전트를 위한 신뢰 계층으로, 분산형 신원, 안전한 격리 지갑 및 검증 가능한 온체인 평판을 제공합니다. 이는 AI 에이전트가 자율적이고 안전하게 행동할 수 있도록 지원하여 민감한 자산 및 데이터에 직접 접근하는 것과 관련된 위험을 완화하고 신뢰할 수 있는 AI 상호 작용의 새로운 시대를 열어줍니다.
NeocloudX
NeocloudX는 GPU 컴퓨팅 용량을 상품화하는 혁신적인 마켓플레이스로, 사용자가 NVIDIA H100 SXM GPU와 같은 고성능 컴퓨팅 리소스를 실제 시장 …
NeocloudX는 GPU 컴퓨팅 용량을 상품화하는 혁신적인 마켓플레이스로, 사용자가 NVIDIA H100 SXM GPU와 같은 고성능 컴퓨팅 리소스를 실제 시장 가격으로 구매, 판매 및 거래할 수 있도록 합니다. 브라우저 기반 콘솔을 통해 베어 메탈 성능에 즉시 액세스할 수 있어 기존 클라우드 제공업체에 비해 상당한 비용 절감 효과를 제공합니다.
Symphony
Symphony는 OpenAI 호환 API를 제공하는 범용 LLM 인터페이스로, AI 애플리케이션 배포, 관리 및 확장을 지원합니다. 엔터프라이즈급 안정성, 최대 …
Symphony는 OpenAI 호환 API를 제공하는 범용 LLM 인터페이스로, AI 애플리케이션 배포, 관리 및 확장을 지원합니다. 엔터프라이즈급 안정성, 최대 20% 낮은 비용, GPT-5 및 Llama 4와 같은 100개 이상의 주요 AI 모델을 지원하여 효율적이고 강력한 AI 인프라를 찾는 개발자와 기업에 이상적인 솔루션입니다.
Bilberrydb
Bilberrydb는 고급 AI 애플리케이션 구축을 위해 설계된 엔터프라이즈급 멀티모달 벡터 데이터베이스입니다. 통합 플랫폼에서 3D 모델, 이미지, 비디오, 오디오, …
Bilberrydb는 고급 AI 애플리케이션 구축을 위해 설계된 엔터프라이즈급 멀티모달 벡터 데이터베이스입니다. 통합 플랫폼에서 3D 모델, 이미지, 비디오, 오디오, 텍스트, 테이블 데이터 등 다양한 데이터 유형에 걸쳐 초고속 임베딩 검색을 지원합니다.
Gmi Cloud
Gmi Cloud는 확장 가능한 AI 훈련 및 추론을 위해 설계된 고성능 GPU 클라우드 플랫폼입니다. 최상위 NVIDIA GPU에 대한 …
Gmi Cloud는 확장 가능한 AI 훈련 및 추론을 위해 설계된 고성능 GPU 클라우드 플랫폼입니다. 최상위 NVIDIA GPU에 대한 온디맨드 액세스, 저지연을 위한 최적화된 추론 엔진, 간소화된 MLOps를 위한 클러스터 엔진을 제공하여 개발자와 기업이 효율적이고 비용 효과적으로 AI 애플리케이션을 구축, 배포 및 확장할 수 있도록 지원합니다.
Protocol Lattice
Protocol Lattice는 상호 운용 가능한 지능형 AI 시스템을 가능하게 하는 오픈 소스 프로토콜 및 프레임워크를 구축하는 데 전념하는 …
Protocol Lattice는 상호 운용 가능한 지능형 AI 시스템을 가능하게 하는 오픈 소스 프로토콜 및 프레임워크를 구축하는 데 전념하는 조직입니다. 그들의 핵심 프로젝트인 범용 도구 호출 프로토콜(UTCP)은 AI 에이전트와 애플리케이션이 기본 프로토콜을 사용하여 도구를 직접 검색하고 호출할 수 있도록 하는 경량, 보안 및 확장 가능한 표준을 제공합니다. 그들은 실용적이고 잘 문서화된 솔루션과 커뮤니티 협력을 강조합니다.
Metorial
Metorial은 AI 에이전트 통합 플랫폼으로, 개발자가 강력한 에이전트 AI 애플리케이션을 신속하게 구축, 배포 및 모니터링할 수 있도록 지원합니다. …
Metorial은 AI 에이전트 통합 플랫폼으로, 개발자가 강력한 에이전트 AI 애플리케이션을 신속하게 구축, 배포 및 모니터링할 수 있도록 지원합니다. 서버리스 MCP(Model Context Protocol) 플랫폼을 통해 수백 가지 도구, 데이터 소스 및 API에 원활하게 연결되며, 확장 가능한 AI 솔루션을 위한 강력한 SDK, 관찰 가능성 및 엔터프라이즈급 보안을 제공합니다.
Portkey AI
Portkey AI는 개발자를 위해 설계된 고급 AI 게이트웨이 및 LLM Ops 플랫폼입니다. 다양한 LLM을 위한 통합 API, 실시간 …
Portkey AI는 개발자를 위해 설계된 고급 AI 게이트웨이 및 LLM Ops 플랫폼입니다. 다양한 LLM을 위한 통합 API, 실시간 관찰 가능성, 시맨틱 캐싱 및 지능형 로드 밸런싱을 제공하여 신뢰할 수 있고 확장 가능하며 비용 효율적인 AI 애플리케이션 개발을 간소화합니다.
Hewlett Packard Enterprise (HPE)
Hewlett Packard Enterprise(HPE)는 기업을 위한 포괄적인 AI, 하이브리드 클라우드, 네트워킹 및 데이터 솔루션을 제공하는 글로벌 엣지-투-클라우드 기업입니다. HPE …
Hewlett Packard Enterprise(HPE)는 기업을 위한 포괄적인 AI, 하이브리드 클라우드, 네트워킹 및 데이터 솔루션을 제공하는 글로벌 엣지-투-클라우드 기업입니다. HPE GreenLake 플랫폼, NVIDIA와 같은 리더와의 전략적 파트너십, 강력한 하드웨어 및 서비스 포트폴리오를 통해 HPE는 조직이 혁신을 가속화하고 운영을 최적화하며 데이터를 실행 가능한 통찰력으로 전환할 수 있도록 지원합니다.
HIVE Digital Technologies
HIVE Digital Technologies는 지속 가능한 데이터 센터 인프라 분야의 글로벌 리더로, 대규모 비트코인 채굴과 인공지능 애플리케이션을 위한 고성능 …
HIVE Digital Technologies는 지속 가능한 데이터 센터 인프라 분야의 글로벌 리더로, 대규모 비트코인 채굴과 인공지능 애플리케이션을 위한 고성능 컴퓨팅(HPC) 제공을 전문으로 합니다. HIVE는 NVIDIA GPU 클러스터를 활용하여 캐나다, 스웨덴, 파라과이에 위치한 지리적으로 다변화된 데이터 센터에서 효율적인 친환경 에너지로 혁신적인 기술에 동력을 공급합니다.
Runware
Runware는 개발자들이 이미지 및 비디오 생성을 위한 생성형 AI를 통합할 수 있도록 고성능, 저비용 API를 제공합니다. 맞춤형 하드웨어와 …
Runware는 개발자들이 이미지 및 비디오 생성을 위한 생성형 AI를 통합할 수 있도록 고성능, 저비용 API를 제공합니다. 맞춤형 하드웨어와 재생 가능 에너지를 활용하여 Stable Diffusion, FLUX.1, Kling 등 30만 개 이상의 모델에 대해 업계 최고의 추론 속도를 제공합니다. ML 전문 지식이 필요 없는 확장 가능하고 사용하기 쉬운 플랫폼으로, 차세대 AI 네이티브 애플리케이션 구축을 위해 설계되었습니다.
Exa Laboratories
Exa Laboratories(현재 Zettascale)는 YC의 지원을 받는 실리콘 밸리 스타트업으로, AI를 위한 최첨단 에너지 효율적인 재구성 가능 칩(XPU)을 개발합니다. …
Exa Laboratories(현재 Zettascale)는 YC의 지원을 받는 실리콘 밸리 스타트업으로, AI를 위한 최첨단 에너지 효율적인 재구성 가능 칩(XPU)을 개발합니다. 이들의 폴리모픽 컴퓨팅 아키텍처는 훈련 및 추론 모두에서 기존 GPU 및 TPU에 비해 우수한 성능, 다용성 및 효율성을 제공하여 AI 에너지 위기를 해결하는 것을 목표로 합니다.
Vectorize
Vectorize는 비정형 데이터 기반 AI 애플리케이션 구축을 간소화하는 RAG-as-a-Service 플랫폼입니다. 관리형 RAG 파이프라인, 광범위한 데이터 소스 커넥터, 자체 …
Vectorize는 비정형 데이터 기반 AI 애플리케이션 구축을 간소화하는 RAG-as-a-Service 플랫폼입니다. 관리형 RAG 파이프라인, 광범위한 데이터 소스 커넥터, 자체 관리형 벡터 데이터베이스 사용 또는 기존 데이터베이스 연결 유연성을 제공하여 개발자가 프로덕션 준비가 된 AI 솔루션을 신속하게 배포할 수 있도록 지원합니다.
SiliconFlow
SiliconFlow는 대규모 언어 모델(LLM) 및 멀티모달 모델의 고성능 추론을 위해 설계된 통합 AI 인프라 플랫폼입니다. 개발자와 기업에 서버리스 …
SiliconFlow는 대규모 언어 모델(LLM) 및 멀티모달 모델의 고성능 추론을 위해 설계된 통합 AI 인프라 플랫폼입니다. 개발자와 기업에 서버리스 API, 예약 GPU, 미세 조정 기능 등 확장 가능하고 비용 효율적이며 유연한 배포 옵션을 제공하며, 이 모든 것은 단일 OpenAI 호환 API를 통해 액세스할 수 있습니다.
Nevermined
Nevermined는 AI 경제를 위해 설계된 전문 결제 및 청구 인프라입니다. 개발자와 기업이 사용량 기반, 결과 기반, 가치 기반 …
Nevermined는 AI 경제를 위해 설계된 전문 결제 및 청구 인프라입니다. 개발자와 기업이 사용량 기반, 결과 기반, 가치 기반 청구와 같은 유연한 AI 네이티브 가격 모델을 통해 모든 AI 에이전트 요청을 즉시 수익화할 수 있도록 지원합니다. 실시간 계량, 즉시 지급, 범용 에이전트 ID를 제공하여 인간-에이전트 및 에이전트-에이전트 간 거래를 모두 지원하며, 새로운 에이전트 상거래 환경에 대비할 수 있도록 합니다.
OpenRouter
OpenRouter는 개발자를 위한 통합 API 게이트웨이로, OpenAI, Google, Anthropic 등 60개 이상의 제공업체로부터 400개 이상의 AI 모델에 대한 …
OpenRouter는 개발자를 위한 통합 API 게이트웨이로, OpenAI, Google, Anthropic 등 60개 이상의 제공업체로부터 400개 이상의 AI 모델에 대한 액세스를 제공합니다. 단일 API로 개발을 단순화하고, 경쟁력 있는 종량제 가격, 고가용성을 위한 자동 장애 조치, 비용 및 성능 최적화를 위한 지능형 모델 라우팅을 제공합니다.
PostgresML
PostgresML은 머신러닝과 AI를 PostgreSQL 데이터베이스에 직접 통합하는 강력한 오픈 소스 확장 프로그램입니다. 간단한 SQL 명령을 사용하여 GPU 가속 …
PostgresML은 머신러닝과 AI를 PostgreSQL 데이터베이스에 직접 통합하는 강력한 오픈 소스 확장 프로그램입니다. 간단한 SQL 명령을 사용하여 GPU 가속 추론, 벡터 검색 및 완전한 RAG 파이프라인을 지원하여 데이터 이동을 제거하고 고성능의 확장 가능한 AI 애플리케이션을 위한 MLOps 스택을 단순화합니다.
Crossing Minds
Crossing Minds는 딥 유저 개인화 및 검색 증강 생성(RAG)에 특화된 고급 AI 플랫폼이었습니다. 실시간 추천 및 의도 이해를 …
Crossing Minds는 딥 유저 개인화 및 검색 증강 생성(RAG)에 특화된 고급 AI 플랫폼이었습니다. 실시간 추천 및 의도 이해를 위한 인프라를 제공했습니다. 이 회사와 팀은 OpenAI에 인수되어 합류했습니다.
Milvus
Milvus는 AI 애플리케이션을 위해 구축된 고성능 오픈 소스 벡터 데이터베이스입니다. 개발자는 최소한의 지연 시간으로 수십억 개의 고차원 벡터를 …
Milvus는 AI 애플리케이션을 위해 구축된 고성능 오픈 소스 벡터 데이터베이스입니다. 개발자는 최소한의 지연 시간으로 수십억 개의 고차원 벡터를 관리하고 검색할 수 있습니다. 검색 증강 생성(RAG), 추천 엔진, 시맨틱 검색과 같은 확장 가능한 시스템을 구축하는 데 이상적인 Milvus는 로컬 프로토타이핑부터 대규모 분산 클러스터까지 유연한 배포 옵션을 제공합니다.
Qdrant
Qdrant는 Rust로 구축된 고성능 오픈 소스 벡터 데이터베이스 및 유사성 검색 엔진입니다. 수십억 개의 고차원 벡터를 효율적으로 관리하고 …
Qdrant는 Rust로 구축된 고성능 오픈 소스 벡터 데이터베이스 및 유사성 검색 엔진입니다. 수십억 개의 고차원 벡터를 효율적으로 관리하고 검색하여 차세대 AI 애플리케이션을 지원하도록 설계되었습니다. 풍부한 필터링, 페이로드 저장 및 다양한 양자화 방법과 같은 고급 기능을 통해 개발자는 시맨틱 검색, 추천 시스템 및 검색 증강 생성(RAG)을 위한 확장 가능하고 비용 효율적인 솔루션을 구축할 수 있습니다.
FriendliAI
FriendliAI는 생성형 AI 모델 추론을 가속화하고 최적화하기 위해 설계된 생성형 AI 인프라 플랫폼입니다. 프로덕션 환경에서 대규모 언어 및 …
FriendliAI는 생성형 AI 모델 추론을 가속화하고 최적화하기 위해 설계된 생성형 AI 인프라 플랫폼입니다. 프로덕션 환경에서 대규모 언어 및 멀티모달 모델을 배포, 서빙 및 확장하기 위한 고성능, 비용 효율적인 솔루션을 제공하며, 전용, 서버리스 또는 온프레미스 환경을 위한 유연한 옵션을 제공합니다.
InfluxData
InfluxData는 실시간 데이터 및 AI 애플리케이션을 위해 구축된 선도적인 시계열 데이터베이스 플랫폼인 InfluxDB를 제공합니다. 개발자는 IoT, 애플리케이션, 인프라에서 …
InfluxData는 실시간 데이터 및 AI 애플리케이션을 위해 구축된 선도적인 시계열 데이터베이스 플랫폼인 InfluxDB를 제공합니다. 개발자는 IoT, 애플리케이션, 인프라에서 발생하는 대규모 고속 데이터를 수집, 저장 및 분석할 수 있습니다. 고성능 쿼리, 뛰어난 데이터 압축, 데이터 레이크 및 AI/ML 파이프라인과의 원활한 통합을 특징으로 하는 InfluxData는 이상 감지, 예측 유지보수 및 자율 시스템의 핵심 엔진입니다.
Inferless
Inferless는 개발자가 몇 분 만에 머신러닝 모델을 배포할 수 있도록 설계된 서버리스 GPU 플랫폼입니다. 인프라 관리를 없애고, 급증하는 …
Inferless는 개발자가 몇 분 만에 머신러닝 모델을 배포할 수 있도록 설계된 서버리스 GPU 플랫폼입니다. 인프라 관리를 없애고, 급증하는 워크로드를 처리하기 위해 제로에서부터 자동 확장을 제공합니다. 이 플랫폼은 초고속 콜드 스타트와 비용 효율성에 최적화되어 있어 사용자가 사용한 만큼만 비용을 지불하고 GPU 비용을 최대 90%까지 절감할 수 있습니다.
Predibase
Predibase는 오픈 소스 대규모 언어 모델(LLM)을 효율적으로 미세 조정하고 서빙하기 위한 엔드투엔드 개발자 플랫폼입니다. 사용자가 특정 작업에서 GPT-4와 …
Predibase는 오픈 소스 대규모 언어 모델(LLM)을 효율적으로 미세 조정하고 서빙하기 위한 엔드투엔드 개발자 플랫폼입니다. 사용자가 특정 작업에서 GPT-4와 같은 대형 독점 모델을 능가하는 맞춤형 AI 모델을 구축하면서 비용과 추론 지연 시간을 크게 줄일 수 있도록 지원합니다. 이 플랫폼은 강화 학습 미세 조정(RFT) 및 LoRAX와 같은 고급 기술을 통해 고속, 다중 모델 서빙을 제공합니다.
Heurist AI
Heurist AI는 온체인 경제를 위해 설계된 풀스택, 탈중앙화 AI 인프라입니다. 개발자에게 수많은 AI 모델에 접근할 수 있는 통합 …
Heurist AI는 온체인 경제를 위해 설계된 풀스택, 탈중앙화 AI 인프라입니다. 개발자에게 수많은 AI 모델에 접근할 수 있는 통합 API와 구성 가능한 AI 에이전트를 구축할 수 있는 프레임워크를 제공합니다. 탈중앙화 물리적 인프라 네트워크(DePIN)를 활용하여 Heurist는 GPU 제공업체와 AI 개발자를 연결하여 AI 컴퓨팅에 대한 접근을 민주화하고 Web3 분야의 혁신을 촉진하는 것을 목표로 합니다.
Ducky
Ducky는 개발자를 위해 설계된 완전 관리형 AI 검색 인프라입니다. 데이터 청킹, 임베딩, 재순위 지정과 같은 복잡한 작업을 처리하여 …
Ducky는 개발자를 위해 설계된 완전 관리형 AI 검색 인프라입니다. 데이터 청킹, 임베딩, 재순위 지정과 같은 복잡한 작업을 처리하여 검색 증강 생성(RAG) 구현을 단순화합니다. 간단한 Python SDK를 통해 개발자는 애플리케이션에 빠르고 정확하며 확장 가능한 시맨틱 검색 기능을 신속하게 구축하여 LLM에 컨텍스트를 인식하고 환각 없는 응답을 제공할 수 있습니다.
WaveSpeedAI
WaveSpeedAI는 AI 이미지, 비디오 및 오디오 생성을 가속화하기 위해 설계된 고성능 통합 API 플랫폼입니다. 개발자와 크리에이터에게 구글, 바이트댄스, …
WaveSpeedAI는 AI 이미지, 비디오 및 오디오 생성을 가속화하기 위해 설계된 고성능 통합 API 플랫폼입니다. 개발자와 크리에이터에게 구글, 바이트댄스, 콰이쇼우와 같은 제공업체의 방대한 최첨단 모델 라이브러리에 대한 단일 액세스 포인트를 제공하여 다중 모드 AI 애플리케이션의 구축, 생성 및 확장을 더 빠르게 할 수 있도록 지원합니다.
Cirrascale Cloud Services
Cirrascale은 대규모 AI, 딥 러닝 및 고성능 컴퓨팅(HPC)에 특화된 고성능 전용 GPU 클라우드 서비스를 제공합니다. 최신 NVIDIA GPU …
Cirrascale은 대규모 AI, 딥 러닝 및 고성능 컴퓨팅(HPC)에 특화된 고성능 전용 GPU 클라우드 서비스를 제공합니다. 최신 NVIDIA GPU 하드웨어와 확장 가능한 인프라에 대한 액세스를 제공하여 조직이 대규모 모델을 효율적으로 훈련하고 복잡한 컴퓨팅 워크로드를 실행할 수 있도록 지원합니다.