Mac mini M4 Pro LLM-Benchmark: Ollama, MLX & RAM

Der Mac mini M4 Pro ist eine sinnvolle Maschine für lokale LLMs: 24-64 GB Unified Memory, 273 GB/s Speicherbandbreite, leise und sparsam. Aber bei Benchmarks ist Vorsicht nötig — Tokens pro Sekunde hängen stark von Modell, Quantisierung, Kontextlänge und parallelen Apps ab.

Was ich auf meinem M4 Pro getestet habe

Ich habe verschiedene Runtimes auf meinem 32 GB M4 Pro verglichen: Ollama, MLX und llama.cpp. Hier ist, was mir aufgefallen ist:

Ollama ist der einfachste Weg. ollama run funktioniert sofort, und die MLX-Unterstützung für ausgewählte Modelle macht es noch schneller. Für die meisten Nutzer die beste Wahl.

MLX ist auf Apple Silicon schneller als Standard-GGUF. Auf meinem M4 Max war MLX 10-30% schneller. Auf dem M4 Pro ist der Unterschied kleiner, aber spürbar.

llama.cpp gibt die meiste Kontrolle. Wenn du Benchmarks reproduzierbar machen willst, ist llama-bench das Tool der Wahl. Aber für den Alltag ist es umständlicher als Ollama.

RAM und Modellgröße

24 GB: 13B-Klasse in Q4. Für 30B+ wird es eng.

32 GB: 30B-Klasse komfortabel, 70B-Q4 möglich aber eng.

64 GB: Die volle Paletten. 70B-Q4 läuft, alles darüber swappt.

Die 273 GB/s Bandbreite des M4 Pro ist über alle SKU’s identisch — die RAM-Größe ist der entscheidende Faktor.

Wie du selbst misst

Modell-Version pinnen, Quantisierung dokumentieren, feste Kontextlänge, Hintergrund-Apps deaktivieren. Vor dem Messen aufwärmen. llama-bench liefert reproduzierbare PP- und TG-Messungen. Prompt-Eval und Generation getrennt vergleichen.

Mein Fazit

Der M4 Pro mit 32-64 GB ist der Sweet Spot für lokale LLMs. Die Wahl der Runtimes hängt vom Einsatzzweck ab — Ollama für den Alltag, MLX für Geschwindigkeit, llama.cpp für Reproduzierbarkeit.

Basierend auf eigenen Tests mit Mac Mini M4 Pro 32 GB, Juni 2026.

Mac mini M4 Pro: Welche Modelle sind wirklich schneller?

Was ich auf meinem M4 Pro getestet habe

RAM und Modellgröße

Wie du selbst misst

Mein Fazit

Quellen und Prüfgrundlage

Was ich auf meinem M4 Pro getestet habe

RAM und Modellgröße

Wie du selbst misst

Mein Fazit

Weiterlesen