Moondream
Moondream là một mô hình ngôn ngữ hình ảnh (VLM) mã nguồn mở mạnh mẽ, cực kỳ nhẹ …
Moondream là một mô hình ngôn ngữ hình ảnh (VLM) mã nguồn mở mạnh mẽ, cực kỳ nhẹ và nhanh. Với dung lượng chỉ 1GB, nó có thể chạy ở mọi nơi, từ thiết bị biên đến máy tính xách tay. Nó cho phép các nhà phát triển hiểu hình ảnh thông qua các câu lệnh văn bản đơn giản cho các tác vụ như tạo phụ đề, phát hiện đối tượng, OCR và hỏi đáp trực quan, mà không cần đào tạo phức tạp hay cơ sở hạ tầng nặng nề. Nó được thiết kế vì sự đơn giản, linh hoạt và giá cả phải chăng.
moondream2
moondream2 là một mô hình ngôn ngữ hình ảnh (VLM) nhẹ, mã nguồn mở được thiết kế để …
moondream2 là một mô hình ngôn ngữ hình ảnh (VLM) nhẹ, mã nguồn mở được thiết kế để hoạt động hiệu quả cao trên các thiết bị biên. Nó xuất sắc trong việc tạo mô tả hình ảnh, hiểu các tài liệu phức tạp và thực hiện hỏi đáp trực quan, lý tưởng cho các ứng dụng di động và kịch bản IoT có tài nguyên hạn chế.