Moondream
Moondream ist ein leistungsstarkes, quelloffenes visuelles Sprachmodell (VLM), das unglaublich leicht und schnell ist. Mit einer winzigen Größe …
Moondream ist ein leistungsstarkes, quelloffenes visuelles Sprachmodell (VLM), das unglaublich leicht und schnell ist. Mit einer winzigen Größe von nur 1 GB läuft es überall, von Edge-Geräten bis hin zu Laptops. Es ermöglicht Entwicklern, Bilder durch einfache Textaufforderungen für Aufgaben wie Bildbeschreibung, Objekterkennung, OCR und visuelle F&A zu verstehen, ohne komplexes Training oder aufwendige Infrastruktur. Es ist auf Einfachheit, Vielseitigkeit und Erschwinglichkeit ausgelegt.
moondream2
moondream2 ist ein leichtgewichtiges, quelloffenes visuelles Sprachmodell (VLM), das für hohe Effizienz auf Edge-Geräten entwickelt wurde. Es zeichnet …
moondream2 ist ein leichtgewichtiges, quelloffenes visuelles Sprachmodell (VLM), das für hohe Effizienz auf Edge-Geräten entwickelt wurde. Es zeichnet sich durch die Generierung von Bildbeschreibungen, das Verständnis komplexer Dokumente und die Durchführung von visuellen Q&A aus und ist somit ideal für mobile Anwendungen und IoT-Szenarien mit begrenzten Ressourcen.