Mac mini M4 Pro: Welche Modelle sind wirklich schneller?
Ollama, MLX, llama.cpp auf dem Mac mini M4 Pro: RAM-Grenzen und lokale LLM-Tests.
Der Mac mini M4 Pro ist eine sinnvolle Maschine für lokale LLMs: 24-64 GB Unified Memory, 273 GB/s Speicherbandbreite, leise und sparsam. Aber bei Benchmarks ist Vorsicht nötig — Tokens pro Sekunde hängen stark von Modell, Quantisierung, Kontextlänge und parallelen Apps ab.
Was ich auf meinem M4 Pro getestet habe
Ich habe verschiedene Runtimes auf meinem 32 GB M4 Pro verglichen: Ollama, MLX und llama.cpp. Hier ist, was mir aufgefallen ist:
Ollama ist der einfachste Weg. ollama run funktioniert sofort, und die MLX-Unterstützung für ausgewählte Modelle macht es noch schneller. Für die meisten Nutzer die beste Wahl.
MLX ist auf Apple Silicon schneller als Standard-GGUF. Auf meinem M4 Max war MLX 10-30% schneller. Auf dem M4 Pro ist der Unterschied kleiner, aber spürbar.
llama.cpp gibt die meiste Kontrolle. Wenn du Benchmarks reproduzierbar machen willst, ist llama-bench das Tool der Wahl. Aber für den Alltag ist es umständlicher als Ollama.
RAM und Modellgröße
24 GB: 13B-Klasse in Q4. Für 30B+ wird es eng.
32 GB: 30B-Klasse komfortabel, 70B-Q4 möglich aber eng.
64 GB: Die volle Paletten. 70B-Q4 läuft, alles darüber swappt.
Die 273 GB/s Bandbreite des M4 Pro ist über alle SKU’s identisch — die RAM-Größe ist der entscheidende Faktor.
Wie du selbst misst
Modell-Version pinnen, Quantisierung dokumentieren, feste Kontextlänge, Hintergrund-Apps deaktivieren. Vor dem Messen aufwärmen. llama-bench liefert reproduzierbare PP- und TG-Messungen. Prompt-Eval und Generation getrennt vergleichen.
Mein Fazit
Der M4 Pro mit 32-64 GB ist der Sweet Spot für lokale LLMs. Die Wahl der Runtimes hängt vom Einsatzzweck ab — Ollama für den Alltag, MLX für Geschwindigkeit, llama.cpp für Reproduzierbarkeit.
Basierend auf eigenen Tests mit Mac Mini M4 Pro 32 GB, Juni 2026.
Transparenz
Quellen und Prüfgrundlage
Diese Primär- und Referenzquellen bilden die Grundlage der technischen Einordnung. Herstellerangaben und externe Benchmarks werden im Artikel als solche gekennzeichnet.