Lokale KI auf Apple Silicon

Alle Artikel

43 Artikel

Cloud-KI 30. Juni 2026 14 min

Claude Sonnet 5 auf dem Mac: Agenten, Coding, 1M Kontext und API-Kosten erklärt

Claude Sonnet 5 erklärt: offizieller Modellname, 1M Kontext, 128K Output, adaptive Thinking, Preise, Claude Code, OpenRouter-Schreibweise und warum es nicht lokal auf dem Mac läuft.
Cloud-KI 30. Juni 2026 10 min

Gemini 3.1 Flash Lite Image auf dem Mac: Nano Banana Lite für schnelle KI-Bilder erklärt

Gemini 3.1 Flash Lite Image, auch Nano Banana Lite, ist Googles schnelles und günstiges Bildmodell für Text-zu-Bild und Bildbearbeitung. Hier erfährst du Preise, Limits, Mac-Workflow und warum es kein lokales Ollama-Modell ist.
Cloud-KI 29. Juni 2026 8 min

ChatGPT 5.6: GPT-5.6 Sol, Terra und Luna erklärt

OpenAI startet GPT-5.6 als limitierte Preview. Was Sol, Terra und Luna können, was sie kosten und warum der Launch kontrovers ist.
Cloud-KI 24. Juni 2026 8 min

Sakana Fugu Ultra: KI-Orchestrator mit Agenten-Pool statt lokalem Modell

Sakana Fugu Ultra ist kein lokales LLM, sondern ein Cloud-Orchestrator mit mehreren Agenten. Was das fuer Mac-Nutzer, EU-Verfuegbarkeit und Preise bedeutet.
Anleitungen 21. Juni 2026 11 min

macOS 27 Golden Gate: Läuft es auf deinem Mac? Intel-Support endet, Siri AI erklärt

macOS 27 Golden Gate beendet den Support für Intel-Macs. Prüfe die vollständige Kompatibilitätsliste und erfahre, welche Apple-Intelligence- und Siri-AI-Funktionen M1, M2 und M3 wirklich erhalten.
Cloud-KI 17. Juni 2026 8 min

GLM-5.2 auf dem Mac: OpenRouter, 1M Kontext und Grenzen

GLM-5.2 von Z.ai erklärt: 1M Kontext, OpenRouter-Setup, Preise, Benchmarks und warum das Modell für normale Macs eher Cloud- als Lokal-KI ist.
Cloud-KI 14. Juni 2026 2 min

Kimi K2.7 Code auf dem Mac: Cloud-Modell mit lokalem CLI

Kimi K2.7 Code erklärt: 1T MoE, 256K Kontext, MCP-Tools, Ollama Cloud, API-Preise — was das Modell für Coding-Agenten kann.
Cloud-KI 9. Juni 2026 11 min

Claude Fable 5 ist zurück: Status, Preis und Mac-Alternativen

Anthropic gibt Claude Fable 5 nach aufgehobenen US-Exportkontrollen wieder frei. Der aktuelle Stand zu Claude Code, API, Cloud-Anbietern, Preis, Datenschutz und lokalen Mac-Alternativen.
Cloud-KI 9. Juni 2026 10 min

Nex N2 Pro auf dem Mac: Was 397B MoE in der Praxis bedeuten

Nex N2 Pro ist ein offenes 397B-MoE-Agentenmodell. Hier steht, was die 17B aktiven Parameter bedeuten, wie viel Speicher realistisch nötig ist und warum ein normaler Mac nicht das Zielsystem ist.
Lokale Modelle 8. Juni 2026 8 min

Gemma 4 12B auf dem Mac: Das neue lokale Multimodal-Modell für 16 GB?

Gemma 4 12B läuft lokal ab 16 GB, bietet 256K Kontext sowie Bild- und Audioverständnis. Was auf dem Mac mit Ollama und MLX wirklich geht.
Cloud-KI 5. Juni 2026 2 min

NVIDIA Nemotron 3 Ultra auf dem Mac: Cloud-Modell mit Ollama-Interface

NVIDIA Nemotron 3 Ultra erklärt: 550B MoE, Agenten-Workflows und warum es auf dem Mac nur über Cloud läuft.
Cloud-KI 1. Juni 2026 2 min

MiniMax M3 auf dem Mac: 1M Kontext und API-Preise

MiniMax M3 erklärt: 1M Kontext, Sparse Attention, Multimodalität, OpenRouter-Setup und was Mac-Nutzer wissen müssen.
Cloud-KI 29. Mai 2026 11 min

StepFun Step 3.7 Flash auf dem Mac: 198B MoE, 256K Kontext und die lokale Realität

StepFun Step 3.7 Flash erklärt: 198B MoE, 11B aktive Parameter, 256K Kontext, API-Preise, Benchmarks, Mac-RAM-Grenzen und warum normale Macs dafür nicht reichen.
Cloud-KI 28. Mai 2026 5 min

Claude Opus 4.8: Lohnt sich das Upgrade für Mac-Entwickler?

Claude Opus 4.8 im Praxistest auf dem Mac: Was Fast Mode, adaptive Thinking und 1M Context wirklich bringen — und wann sich der Preis lohnt.
Cloud-KI 27. Mai 2026 7 min

Xiaomi MiMo-V2.5-Pro: Preis, Benchmarks und Mac-Realität

Xiaomi MiMo-V2.5 und MiMo-V2.5-Pro im ehrlichen Check: Preise, offizielle Benchmarks, Token Plan, API-Setup und warum offene Gewichte nicht automatisch lokale Mac-KI bedeuten.
Cloud-KI 24. Mai 2026 7 min

MiniMax M2.7 auf dem Mac: 10 % Rabatt und Cloud-KI

MiniMax M2.7 erklärt: Cloud-KI für Coding-Agenten, Benchmarks, Token Plan, 10-%-Referral-Hinweis, Ollama Cloud und lokale Mac-Alternativen.
Cloud-KI 22. Mai 2026 9 min

Kann man Gemini 3.5 Flash lokal mit Ollama nutzen?

Gemini 3.5 Flash läuft nicht lokal in Ollama, LM Studio oder MLX. Was auf dem Mac wirklich geht und welche lokalen Modelle passen.
Cloud-KI 22. Mai 2026 11 min

Qwen3.7 Max: Lohnt sich OpenRouter?

Qwen3.7-Max über OpenRouter: Preise, 1M Kontext, Cache-Kosten, API-Setup und klare Mac-Einordnung.
Cloud-KI 20. Mai 2026 13 min

Gemini 3.5 Flash auf dem Mac: Preise, API und lokale Grenzen

Gemini 3.5 Flash erklärt: API-Setup, 1M Kontext, Preise, Datenschutz, Agenten und warum das Modell nicht lokal in Ollama oder MLX läuft.
Lokale Modelle 17. Mai 2026 2 min

Qwen3-ASR + Qwen3-TTS vs. Grok Voice: Lokal oder Cloud?

Qwen3-ASR, Qwen3-TTS und Grok Voice verglichen: ASR, TTS, Voice Agents, Datenschutz und Preise.
Anleitungen 16. Mai 2026 2 min

Ministral 3 auf dem Mac: 3B, 8B, 14B mit Ollama

Ministral 3 lokal auf Apple Silicon: Ollama, 3B/8B/14B, Vision, Tool Calling und RAM-Grenzen.
Cloud-KI 15. Mai 2026 3 min

Claude Opus 4.7 Fast vs Standard: Lohnt sich der 6x-Aufpreis?

Claude Opus 4.7 Fast Mode im Test: 6x Preis, 2,5x Speed — lohnt sich das für Mac-Entwickler?
Anleitungen 15. Mai 2026 2 min

Moondream2 auf dem Mac: 1,7 GB Vision ohne Cloud

Moondream2 lokal auf Apple Silicon: Ollama-Setup, Bildanalyse und echte Grenzen.
Lokale Modelle 14. Mai 2026 3 min

Gemma 4 vs Qwen3.6 auf dem Mac: Was lohnt sich?

Gemma 4 26B vs Qwen3.6 27B auf Apple Silicon: Erfahrung, Vergleich und Empfehlung für lokale KI.
Lokale Modelle 14. Mai 2026 5 min

Laguna XS.2 auf dem Mac: Coding-Modell, Benchmarks und RAM-Grenzen

Laguna XS.2 von Poolside erreicht 69,9 % auf SWE-bench Verified. Was auf dem Mac lokal geht, welche Ollama-Tags passen und wo Qwen3.6 vorn liegt.
Lokale Modelle 13. Mai 2026 5 min

Gemma 4 vs Qwen3.6 auf dem Mac: Wer lohnt sich?

Gemma 4 26B A4B vs Qwen3.6 27B: Ollama-Größen, echte Benchmarkwerte, Architektur, 256K Kontext, RAM-Grenzen und Mac-Empfehlung.
Cloud-KI 12. Mai 2026 1 min

Perceptron Mk1 auf dem Mac: Video-KI ist Cloud-Only

Perceptron Mk1 erklärt: Video-Reasoning per API, strukturierte Annotationen und lokale Mac-Alternativen.
Lokale Modelle 12. Mai 2026 12 min

Lokale Vision-LLMs auf dem Mac: Welche Modelle lohnen sich wirklich?

Gemma 3, Qwen2.5-VL, Llama 3.2 Vision und Moondream im Praxisvergleich für Apple Silicon: OCR, Screenshots, Dokumente, Benchmarks, RAM und sinnvolle Prompts.
Lokale Modelle 11. Mai 2026 2 min

Kleine LLMs auf dem Mac: Welche lohnen sich?

Kleine lokale LLMs für Apple Silicon: Qwen3, Qwen3.5, Ollama, RAM-Bedarf und sinnvolle Einstellungen.
Anleitungen 10. Mai 2026 3 min

Gemma 3 auf dem Mac: Welche Variante passt zu dir?

Gemma 3 lokal auf Apple Silicon: Welches Modell für welchen Mac, Ollama-Setup und die Wahrheit über Vision und 128K Kontext.
Anleitungen 10. Mai 2026 3 min

Gemma 4 auf dem Mac: Welche Variante passt zu dir?

Gemma 4 lokal auf Apple Silicon: E2B, E4B, 26B oder 31B — welche Variante für welchen Mac sinnvoll ist.
Cloud-KI 9. Mai 2026 13 min

DeepSeek V4 Pro vs Flash auf dem Mac: API-Kosten, 1M Kontext und Cloud-Realität

DeepSeek V4 Pro und Flash realistisch erklärt: 1M Kontext, API-Preise, Thinking-Modi, Benchmarks, Ollama Cloud und warum beide keine normalen lokalen Mac-Modelle sind.
Cloud-KI 9. Mai 2026 7 min

ERNIE 5.1 von Baidu: Was das Modell kann — und warum es nicht auf den Mac kommt

ERNIE 5.1 laut Baidu: AIME26 mit Tools, LMArena Search, Cloud-Zugang und warum Mac-Nutzer es nicht als lokales Modell planen sollten.
Anleitungen 9. Mai 2026 7 min

Qwen3.6 auf dem Mac: 27B, 35B-A3B, Vision und Ollama

Qwen3.6 lokal auf Apple Silicon nutzen: 27B vs. 35B-A3B, Ollama- und MLX-Tags, Vision, Benchmarks und realistische RAM-Grenzen.
Hardware 8. Mai 2026 6 min

Unified Memory: Warum lokale LLMs auf dem Mac laufen

Unified Memory erklärt: Warum Apple Silicon lokalen LLMs hilft, wo Speicherbandbreite zählt und wann Mac mini M4, M4 Pro oder Cloud sinnvoller sind.
Lokale Modelle 7. Mai 2026 11 min

Beste Open-Weight-LLMs für Mac 2026: Qwen3.6, Gemma 4 und Llama 4 realistisch eingeordnet

Qwen3.6, Gemma 4 und Llama 4 Scout im realistischen Mac-Vergleich: Ollama-Tags, Unified-Memory-Empfehlungen, Benchmarks, Kontextfenster und lokale Grenzen.
Hardware 6. Mai 2026 2 min

Mac mini M4 Pro: Welche Modelle sind wirklich schneller?

Ollama, MLX, llama.cpp auf dem Mac mini M4 Pro: RAM-Grenzen und lokale LLM-Tests.
Vergleiche 5. Mai 2026 9 min

Apple Intelligence vs. lokale KI: Datenschutz auf dem Mac

Apple Intelligence, PCC, ChatGPT und lokale KI auf dem Mac: Welche Daten lokal bleiben, wann Cloud greift und wann Ollama privater ist.
Anleitungen 4. Mai 2026 2 min

Whisper lokal auf dem Mac: Transkribieren ohne Cloud

Whisper lokal auf Apple Silicon: mlx-whisper, WhisperKit, Datenschutz und Sprechertrennung.
Vergleiche 3. Mai 2026 3 min

LM Studio vs. Ollama: Was ist besser auf dem Mac?

LM Studio oder Ollama auf Apple Silicon? GUI vs CLI, API, Offline, MLX/GGUF, Datenschutz — ehrlicher Vergleich.
Hardware 3. Mai 2026 2 min

Mac mini M4 als KI-Server: Lohnt sich das?

Mac mini M4 als lokaler KI-Server: RAM-Empfehlung, Ollama im LAN, Sicherheit, Stromkosten und Cloud-Vergleich.
Anleitungen 3. Mai 2026 16 min

Ollama auf dem Mac mini M4 einrichten: lokale KI, RAM-Grenzen und Cloud-Falle erklärt

Ollama auf dem Mac mini M4 richtig einrichten: Installation, Modellwahl für 16/24/32/48/64 GB Unified Memory, lokale API, Open WebUI, Kontextlänge, Cloud-Modelle und Datenschutz.
Hardware 25. Feb. 2025 2 min

Mac mini M4 für lokale KI: Welche RAM-Größe kaufen?

Mac mini M4 für lokale KI: klare RAM-Empfehlung, Ollama, LM Studio, Modellwahl und Datenschutz.

Claude Sonnet 5 auf dem Mac: Agenten, Coding, 1M Kontext und API-Kosten erklärt

Gemini 3.1 Flash Lite Image auf dem Mac: Nano Banana Lite für schnelle KI-Bilder erklärt

ChatGPT 5.6: GPT-5.6 Sol, Terra und Luna erklärt

Sakana Fugu Ultra: KI-Orchestrator mit Agenten-Pool statt lokalem Modell

macOS 27 Golden Gate: Läuft es auf deinem Mac? Intel-Support endet, Siri AI erklärt

GLM-5.2 auf dem Mac: OpenRouter, 1M Kontext und Grenzen

Kimi K2.7 Code auf dem Mac: Cloud-Modell mit lokalem CLI

Claude Fable 5 ist zurück: Status, Preis und Mac-Alternativen

Nex N2 Pro auf dem Mac: Was 397B MoE in der Praxis bedeuten

Gemma 4 12B auf dem Mac: Das neue lokale Multimodal-Modell für 16 GB?

NVIDIA Nemotron 3 Ultra auf dem Mac: Cloud-Modell mit Ollama-Interface

MiniMax M3 auf dem Mac: 1M Kontext und API-Preise

StepFun Step 3.7 Flash auf dem Mac: 198B MoE, 256K Kontext und die lokale Realität

Claude Opus 4.8: Lohnt sich das Upgrade für Mac-Entwickler?

Xiaomi MiMo-V2.5-Pro: Preis, Benchmarks und Mac-Realität

MiniMax M2.7 auf dem Mac: 10 % Rabatt und Cloud-KI

Kann man Gemini 3.5 Flash lokal mit Ollama nutzen?

Qwen3.7 Max: Lohnt sich OpenRouter?

Gemini 3.5 Flash auf dem Mac: Preise, API und lokale Grenzen

Qwen3-ASR + Qwen3-TTS vs. Grok Voice: Lokal oder Cloud?

Ministral 3 auf dem Mac: 3B, 8B, 14B mit Ollama

Claude Opus 4.7 Fast vs Standard: Lohnt sich der 6x-Aufpreis?

Moondream2 auf dem Mac: 1,7 GB Vision ohne Cloud

Gemma 4 vs Qwen3.6 auf dem Mac: Was lohnt sich?

Laguna XS.2 auf dem Mac: Coding-Modell, Benchmarks und RAM-Grenzen

Gemma 4 vs Qwen3.6 auf dem Mac: Wer lohnt sich?

Perceptron Mk1 auf dem Mac: Video-KI ist Cloud-Only

Lokale Vision-LLMs auf dem Mac: Welche Modelle lohnen sich wirklich?

Kleine LLMs auf dem Mac: Welche lohnen sich?

Gemma 3 auf dem Mac: Welche Variante passt zu dir?

Gemma 4 auf dem Mac: Welche Variante passt zu dir?

DeepSeek V4 Pro vs Flash auf dem Mac: API-Kosten, 1M Kontext und Cloud-Realität

ERNIE 5.1 von Baidu: Was das Modell kann — und warum es nicht auf den Mac kommt

Qwen3.6 auf dem Mac: 27B, 35B-A3B, Vision und Ollama

Unified Memory: Warum lokale LLMs auf dem Mac laufen

Beste Open-Weight-LLMs für Mac 2026: Qwen3.6, Gemma 4 und Llama 4 realistisch eingeordnet

Mac mini M4 Pro: Welche Modelle sind wirklich schneller?

Apple Intelligence vs. lokale KI: Datenschutz auf dem Mac

Whisper lokal auf dem Mac: Transkribieren ohne Cloud

LM Studio vs. Ollama: Was ist besser auf dem Mac?

Mac mini M4 als KI-Server: Lohnt sich das?

Ollama auf dem Mac mini M4 einrichten: lokale KI, RAM-Grenzen und Cloud-Falle erklärt

Mac mini M4 für lokale KI: Welche RAM-Größe kaufen?