Moondream2 auf dem Mac: 1,7 GB Vision ohne Cloud
Moondream2 lokal auf Apple Silicon: Ollama-Setup, Bildanalyse und echte Grenzen.
Moondream2 ist ein kompaktes Vision-Language-Modell mit nur 1,7 GB Ollama-Paket. Ich habe es auf meinem Mac Mini M4 getestet. Die Ergebnisse sind für diese Größe überraschend brauchbar.
Was Moondream2 kann
Das Modell kann Bilder beschreiben, visuelle Fragen beantworten und auf Bildelemente zeigen. Alles läuft lokal auf dem Mac. Die Kombination aus kleiner Größe und brauchbarer Qualität macht es ideal für Mac-Nutzer mit wenig Speicher.
Was ich getestet habe
Screenshots analysieren: funktioniert gut. Einfache UI-Prüfungen, kurze Texterkennung aus Screenshots und das Einordnen von Bildschirminhalten klappt.
Bildfragen beantworten: für einfache Fragen brauchbar. “Was steht auf diesem Bild?”, “Welche Farbe hat das Auto?” Das Modell liefert brauchbare Antworten.
Komplexe Analyse: hier stößt es an seine Grenzen. Feingranulare OCR, Multi-Bild-Vergleiche und reasoningbasierte Bildanalyse sind zu anspruchsvoll.
RAM-Bedarf
8 GB reichen für einfache Aufgaben, wenn nicht viele andere Apps laufen. 16 GB sind entspannter. Der kleine Speicherbedarf (1,7 GB) macht es ideal für Macs mit wenig RAM.
Wann auf größere Modelle wechseln?
Wenn Moondream2 zu schwach ist: Llama 3.2 Vision 11B oder Gemma 3 12B sind die natürlichen nächsten Schritte. Aber diese brauchen deutlich mehr Speicher.
Mein Fazit
Moondream2 ist kein Ersatz für GPT-4o Vision oder Gemini. Aber für einfache, lokale Bildanalyse auf dem Mac ist es eine exzellente Wahl, besonders wenn Speicher knapp ist.
Getestet Juni 2026 auf Mac Mini M4 mit 32 GB.
Transparenz
Quellen und Prüfgrundlage
Diese Primär- und Referenzquellen bilden die Grundlage der technischen Einordnung. Herstellerangaben und externe Benchmarks werden im Artikel als solche gekennzeichnet.