Moondream
Moondream 是一款功能强大、开源的视觉语言模型(VLM),它极其轻量且快速。凭借仅 1GB 的微小体积,它可以在从边缘设备到笔记本电脑的任何地方运行。它允许开发者通过简单的文本提示来理解图像,执行字幕生成、对象检测、OCR 和视觉问答等任务,而无需复杂的训练或重型基础设施。它的设计宗旨是简单、多功能和经济实惠。
Moondream 是一款功能强大、开源的视觉语言模型(VLM),它极其轻量且快速。凭借仅 1GB 的微小体积,它可以在从边缘设备到笔记本电脑的任何地方运行。它允许开发者通过简单的文本提示来理解图像,执行字幕生成、对象检测、OCR 和视觉问答等任务,而无需复杂的训练或重型基础设施。它的设计宗旨是简单、多功能和经济实惠。
43.7K
免费
moondream2
moondream2 是一款专为边缘设备设计的高效、轻量级开源视觉语言模型(VLM)。它擅长生成图像描述、理解复杂文档和执行视觉问答,是资源有限的移动应用和物联网场景的理想选择。
moondream2 是一款专为边缘设备设计的高效、轻量级开源视觉语言模型(VLM)。它擅长生成图像描述、理解复杂文档和执行视觉问答,是资源有限的移动应用和物联网场景的理想选择。
2.4K