Über diesen Blog

Lokale KI auf dem Mac —
realistisch getestet.

AI auf dem Mac dokumentiert, testet und erklärt lokale KI-Workflows auf Apple-Silicon-Macs. Im Mittelpunkt stehen Datenschutz, Performance, reproduzierbare Setups und ehrliche Einschätzungen statt KI-Hype. Ich teste, welche Modelle auf Macs mit M1, M2, M3 und M4 sinnvoll laufen, wo lokale KI stark ist und wo Cloud-Dienste weiterhin Vorteile haben.

Wer schreibt hier?

Hinter KI auf dem Mac steht Julian Dominic Altmann / Altmann Digital Studio. Ich betreibe diese Seite als unabhängigen technischen Blog über lokale KI auf Apple-Silicon-Macs. Ich teste Modelle, Tools und Workflows selbst, vergleiche Messwerte, prüfe Herstellerangaben und schreibe die Ergebnisse so auf, dass Mac-Nutzer, Entwickler und Datenschutz-Interessierte sie praktisch nutzen können.

Mein Fokus liegt auf lokalen LLMs, Speech-AI, Vision-Modellen und den Tools, die das möglich machen: Ollama, LM Studio, MLX, llama.cpp und die Apple-Silicon-Plattform.

Impressum →

Für wen ist dieser Blog?

🍎 Mac-Nutzer:innen Du willst wissen, was auf einem M1, M2, M3, M4 oder neueren Apple-Silicon-Mac wirklich läuft.
🔒 Datenschutzbewusste Nutzer:innen Du möchtest KI nutzen und dabei möglichst viele Daten auf deinem eigenen Rechner behalten — mit so wenig Cloud-Abhängigkeit wie möglich in den getesteten Workflows.
⚙️ Entwickler:innen Du suchst Setups, APIs, lokale Server, Benchmarks, Modellvergleiche und Integrationshinweise für macOS.
✍️ Kreative und Power-User Du willst lokale KI für Schreiben, Coding, Bildanalyse, Transkription, Automatisierung oder persönliche Assistenten nutzen.

Warum dieser Blog?

Viele KI-Workflows laufen heute über Cloud-Dienste wie ChatGPT, Claude oder Gemini. Diese Dienste sind leistungsfähig und bequem, bedeuten aber oft externe Verarbeitung, laufende Kosten und weniger Kontrolle über Daten, Modelle und Infrastruktur.

Mit Apple Silicon ist lokale KI auf dem Mac für viele Nutzer:innen praktikabel geworden. Unified Memory, effiziente GPUs und Tools wie Ollama, LM Studio, MLX und llama.cpp machen es möglich, viele Modelle direkt unter macOS auszuführen.

Dieser Blog zeigt nicht nur, was theoretisch möglich ist. Er prüft, was im Alltag wirklich funktioniert: Welche Modelle laufen flüssig? Wie viel RAM ist sinnvoll? Wo helfen Quantisierung und kleinere Modelle? Und wann ist ein Cloud-Modell trotzdem die bessere Wahl?

Was du hier findest

  • Setup-Guides — Schritt-für-Schritt-Anleitungen von der Installation bis zum stabilen Alltagseinsatz
  • Modell-Vergleiche — Benchmarks, Messwerte und nachvollziehbare Einschätzungen statt Bauchgefühl
  • Hardware-Tests — Praxisnahe Tests zu Mac mini, MacBook Pro und Mac Studio bei lokaler KI
  • Tool-Erklärungen — Einordnung von Ollama, LM Studio, MLX, llama.cpp und weiteren Tools für lokale KI
  • Workflow-Beispiele — Konkrete Anwendungen für Coding, Schreiben, Recherche, Automatisierung und Wissensarbeit
  • Cloud-vs-Lokal-Vergleiche — Ehrliche Einordnung, wann die Cloud besser ist und wann lokale Inferenz wirklich sinnvoll ist

Wie ich teste

Ich versuche, Tests nachvollziehbar und ehrlich zu machen. Wenn ich lokale Modelle teste, zählen Hardware, RAM, Runtime, Modellvariante, Quantisierung, Kontextgröße und Temperatur. Ein MacBook Air M1 mit 8 GB RAM ist nicht dasselbe wie ein Mac Studio mit 128 GB. Deshalb sind Benchmarks auf dieser Website als praxisnahe Orientierung zu verstehen — nicht als universelle Garantie.

Wenn ein Artikel auf Herstellerangaben, API-Dokumentation, OpenRouter-Daten, Artificial-Analysis-Werten oder Community-Erfahrungen basiert, soll das klar von eigenen Messungen getrennt werden.

Wenn ein Artikel keine eigenen Messwerte enthält, wird das klar gemacht. Hersteller-Benchmarks, API-Dokumentation, Community-Werte und eigene Praxistests werden nicht ungekennzeichnet vermischt.

Benchmark-Standards

Gerade bei KI ändern sich Modelle, Preise, APIs und Benchmarks schnell. Deshalb versuche ich, Zahlen immer mit Kontext zu nennen: Datum, Hardware, Modellversion, Runtime, Quantisierung und Testaufbau. Ich unterscheide zwischen eigenen Messungen, Herstellerangaben, Provider-Daten, akademischen Benchmarks und Community-Erfahrungen. Ein einzelner Benchmark macht selten ein Modell „besser" — meistens entscheidet der konkrete Einsatzzweck.

Wie Inhalte entstehen

Artikel auf dieser Website entstehen aus praktischen Tests, technischer Recherche, Herstellerdokumentation, API-Dokumentation und redaktioneller Einordnung. AI-Tools können dabei als Arbeitsmittel helfen — zum Beispiel für Struktur, Übersetzung, Zusammenfassung, Recherchevorbereitung oder Entwürfe. Technische Aussagen, Preise, Modellangaben und Quellen werden jedoch geprüft und eingeordnet.

Der Anspruch ist nicht, möglichst viel Content zu produzieren, sondern nützliche Orientierung für lokale KI auf dem Mac zu geben. Wenn dir ein Fehler auffällt, freue ich mich über einen Hinweis.

Technischer Stack

Astro Statischer Site-Generator für eine schnelle, leichte Website mit standardmäßig wenig JavaScript.
Cloudflare Pages Hosting und CDN für schnelle Auslieferung der statischen Website.
Ollama Einfacher Einstieg in lokale LLMs und Modellverwaltung direkt auf dem Mac.
LM Studio Desktop-App mit Chat-UI, Modellverwaltung und lokalem Server-Modus.
MLX Apples Machine-Learning-Framework für Apple Silicon, optimiert für Unified Memory und effiziente Ausführung auf Apple-Plattformen.
llama.cpp Portable Inferenz-Engine für quantisierte Modelle und lokale Workflows.

Datenschutz: lokale KI vs. Website-Betrieb

Wenn ich über lokale KI schreibe, geht es meist darum, Modelle und Daten auf dem eigenen Mac zu behalten. Das ist ein anderes Thema als der Betrieb dieser Website.

Die Website selbst kann optionale Dienste wie Google Analytics oder Werbung verwenden, um Reichweite zu messen und den Blog zu finanzieren. Diese Dienste werden nur nach deiner Einwilligung geladen. Die Datenschutzerklärung erklärt, welche Dienste aktiv werden können.

Mehr dazu: Datenschutzerklärung →

Finanzierung und Affiliate-Links

Diese Website kann Werbung und Affiliate-Links enthalten. Wenn du über einen solchen Link etwas kaufst, kann ich eine Provision erhalten — für dich ohne Mehrkosten. Empfehlungen sollen trotzdem redaktionell begründet bleiben. Eine positive Bewertung kann nicht gekauft werden. Gesponserte Inhalte würden klar als solche gekennzeichnet.

Affiliate-Links oder Werbung ändern nicht die redaktionelle Bewertung. Wenn ein Tool Schwächen hat, werden diese genannt.

Kontakt

Du hast Feedback, eine Tool-Empfehlung oder möchtest einen Test vorschlagen?

Schreib eine E-Mail an: macmini-ai.lifter912@silomails.com

Rechtliches und Transparenz

KI auf dem Mac soll dir helfen, lokale KI realistisch einzuschätzen: Was läuft schnell? Was braucht zu viel RAM? Wo ist die Cloud noch besser? Und wo lohnt sich lokale Inferenz wirklich? Die Antworten sollen nicht perfekt klingen — sie sollen nützlich sein.