Nexa SDK
Nexa SDK là bộ công cụ mạnh mẽ giúp nhà phát triển triển khai bất kỳ mô hình …
Nexa SDK là bộ công cụ mạnh mẽ giúp nhà phát triển triển khai bất kỳ mô hình AI nào, bao gồm các mô hình tiên tiến và hiện đại nhất, lên mọi thiết bị (di động, PC, IoT, ô tô) trong vài phút. Nó cung cấp khả năng suy luận trên thiết bị sẵn sàng cho sản xuất với tăng tốc phần cứng trên NPU, GPU và CPU, được tối ưu hóa cho tốc độ và hiệu quả năng lượng.
OCR Arena
OCR Arena là một nền tảng trực tuyến miễn phí được thiết kế để kiểm tra và đánh …
OCR Arena là một nền tảng trực tuyến miễn phí được thiết kế để kiểm tra và đánh giá các Mô hình Ngôn ngữ Thị giác (VLM) nền tảng hàng đầu và các mô hình Nhận dạng Ký tự Quang học (OCR) mã nguồn mở. Nó cho phép người dùng tải lên tài liệu, đo lường độ chính xác và so sánh hiệu suất của mô hình trên bảng xếp hạng công khai.
Hakko
Hakko là một người bạn đồng hành AI chơi game tiên tiến, tận dụng Mô hình Ngôn ngữ …
Hakko là một người bạn đồng hành AI chơi game tiên tiến, tận dụng Mô hình Ngôn ngữ Thị giác (VLM) để cung cấp hướng dẫn bằng giọng nói theo thời gian thực, sự đồng hành về mặt cảm xúc và hỗ trợ thông minh trong nhiều trò chơi. Nó nâng cao trải nghiệm chơi game của bạn với khả năng nhận diện cảnh, tìm kiếm kiến thức và tương tác cá nhân hóa, mở rộng hỗ trợ sang các kịch bản cuộc sống hàng ngày để có một mối quan hệ đối tác AI thực sự tích hợp.
Gabber
Gabber là một nền tảng mạnh mẽ để xây dựng các ứng dụng AI đa phương thức thời …
Gabber là một nền tảng mạnh mẽ để xây dựng các ứng dụng AI đa phương thức thời gian thực có khả năng nhìn, nghe và nói. Nó cung cấp suy luận độ trễ thấp cho Mô hình Ngôn ngữ Thị giác (VLM), Chuyển văn bản thành giọng nói (TTS) và Chuyển giọng nói thành văn bản (STT), kết hợp với hệ thống điều phối dựa trên đồ thị để phát triển và triển khai nhanh chóng.
Reducto
Reducto là một API Nhập liệu Tài liệu tiên tiến dành cho nhà phát triển và doanh nghiệp. …
Reducto là một API Nhập liệu Tài liệu tiên tiến dành cho nhà phát triển và doanh nghiệp. Nó sử dụng OCR Tác tử và Mô hình Ngôn ngữ-Thị giác để phân tích cú pháp, tách, trích xuất và thậm chí chỉnh sửa tài liệu một cách chính xác. Nó biến đổi dữ liệu phi cấu trúc từ các định dạng tệp khác nhau thành đầu vào có cấu trúc, sẵn sàng cho LLM, tự động hóa các quy trình xử lý tài liệu phức tạp với độ chính xác cao và bảo mật cấp doanh nghiệp.
Moondream
Moondream là một mô hình ngôn ngữ hình ảnh (VLM) mã nguồn mở mạnh mẽ, cực kỳ nhẹ …
Moondream là một mô hình ngôn ngữ hình ảnh (VLM) mã nguồn mở mạnh mẽ, cực kỳ nhẹ và nhanh. Với dung lượng chỉ 1GB, nó có thể chạy ở mọi nơi, từ thiết bị biên đến máy tính xách tay. Nó cho phép các nhà phát triển hiểu hình ảnh thông qua các câu lệnh văn bản đơn giản cho các tác vụ như tạo phụ đề, phát hiện đối tượng, OCR và hỏi đáp trực quan, mà không cần đào tạo phức tạp hay cơ sở hạ tầng nặng nề. Nó được thiết kế vì sự đơn giản, linh hoạt và giá cả phải chăng.
Prism Replay
Prism Replay là một nền tảng phân tích sản phẩm AI-native tự động xem, tóm tắt và phân …
Prism Replay là một nền tảng phân tích sản phẩm AI-native tự động xem, tóm tắt và phân tích các bản ghi lại phiên của người dùng. Nó cung cấp thông tin chi tiết hữu ích để giúp các nhóm sản phẩm tối ưu hóa chuyển đổi, hiểu hành vi người dùng và xác định các điểm vướng mắc mà không cần nỗ lực thủ công.
Oda Studio
Oda Studio cung cấp các giải pháp AI tùy chỉnh để biến đổi dữ liệu phức tạp, phi …
Oda Studio cung cấp các giải pháp AI tùy chỉnh để biến đổi dữ liệu phức tạp, phi cấu trúc thành những hiểu biết có thể hành động. Chuyên về Mô hình Ngôn ngữ-Thị giác (VLM) và các đường ống dữ liệu tùy chỉnh, họ phục vụ các ngành như xây dựng, tài chính và truyền thông. Đội ngũ chuyên gia của họ cung cấp các dịch vụ từ đầu đến cuối, từ chú thích dữ liệu đến triển khai mô hình, giúp doanh nghiệp đưa ra quyết định thông minh hơn, nhanh hơn.
OpalAi
OpalAi là một nền tảng AI không gian tiên tiến giúp chuyển đổi dữ liệu không gian, hình …
OpalAi là một nền tảng AI không gian tiên tiến giúp chuyển đổi dữ liệu không gian, hình ảnh, văn bản và âm thanh phức tạp thành thông tin chi tiết hữu ích cho doanh nghiệp. Nền tảng này tận dụng các công nghệ tiên tiến như Mô hình Ngôn ngữ Tầm nhìn (VLM) và tái tạo 3D để cung cấp các giải pháp chuyên biệt cho các ngành như PropTech, InsurTech, giao thông và quản lý cháy rừng, giúp đẩy nhanh quá trình ra quyết định dựa trên dữ liệu.
moondream2
moondream2 là một mô hình ngôn ngữ hình ảnh (VLM) nhẹ, mã nguồn mở được thiết kế để …
moondream2 là một mô hình ngôn ngữ hình ảnh (VLM) nhẹ, mã nguồn mở được thiết kế để hoạt động hiệu quả cao trên các thiết bị biên. Nó xuất sắc trong việc tạo mô tả hình ảnh, hiểu các tài liệu phức tạp và thực hiện hỏi đáp trực quan, lý tưởng cho các ứng dụng di động và kịch bản IoT có tài nguyên hạn chế.