Mac mini M4 als KI-Server: Ollama, RAM & Kosten

Der Mac mini M4 kann ein nützlicher lokaler KI-Server sein, wenn seine Grenzen zur Workload passen. Ich betreibe meinen seit Monaten als leisen Always-on-Ollama-Server. Hier ist, was ich gelernt habe.

Die kurze Empfehlung

24 GB: erschwinglicher Single-User-Server für 7B-13B-Modelle. Reicht für die meisten persönlichen Use Cases.

32 GB: was ich habe. Sweet Spot für die meisten Modelle, genug Raum für Kontext und parallele Anfragen.

48-64 GB M4 Pro: für größere Modelle, RAG, Vision-Workflows oder mehrere Clients. Die 273 GB/s Bandbreite macht einen spürbaren Unterschied.

16 GB: nicht als dedizierten KI-Server kaufen. Zu begrenzt für ernsthafte Arbeit.

Was ich gelernt habe

Ollama im LAN ist einfach, braucht aber Sicherheit. Ollama hat keine eingebaute Authentifizierung. Lokal lassen, vertrauenswürdiges LAN oder VPN nutzen, Reverse-Proxy mit TLS davor für externen Zugang.

Stromverbrauch minimal. Apple gibt 5W Leerlauf und 140W max für M4 Pro an. In der Praxis bleiben LLM-Lasten meist unter 10W. Der Mac mini läuft 24/7 ohne spürbare Stromkosten.

32 GB schafft die meisten Workflows. Ich betreibe Gemma 4 26B, Qwen3 8B und kleinere Modelle parallel ohne Probleme. Kontext bleibt bei 16-32K Tokens komfortabel.

Wann Cloud besser ist

Cloud-GPUs (Lambda, RunPod) machen Sinn für Spitzenlasten, sehr große Modelle (100B+) oder Kurzzeit-Experimente. Der Mac mini ist besser für kontinuierliche Nutzung, Datenschutz, Offline-Arbeit und planbare Budgets.

Mein Setup: Mac mini als Standard, Cloud als Burst-Buffer bei Bedarf.

Mein Fazit

Der Mac mini M4 ist der beste leise, effiziente lokale KI-Server für den persönlichen Gebrauch. Kein Ersatz für A100/H100-Cluster, aber perfekt für die 90% der Use Cases, die diese Leistung nicht brauchen.

Getestet Juni 2026 auf Mac Mini M4 mit 32 GB.

Mac mini M4 als KI-Server: Lohnt sich das?

Die kurze Empfehlung

Was ich gelernt habe

Wann Cloud besser ist

Mein Fazit

Quellen und Prüfgrundlage

Die kurze Empfehlung

Was ich gelernt habe

Wann Cloud besser ist

Mein Fazit

Weiterlesen