Lokale KI auf Apple Silicon

Alle Artikel

43 Artikel

  1. Claude Sonnet 5 auf dem Mac: Agenten, Coding, 1M Kontext und API-Kosten erklärt

    Claude Sonnet 5 erklärt: offizieller Modellname, 1M Kontext, 128K Output, adaptive Thinking, Preise, Claude Code, OpenRouter-Schreibweise und warum es nicht lokal auf dem Mac läuft.

  2. Gemini 3.1 Flash Lite Image auf dem Mac: Nano Banana Lite für schnelle KI-Bilder erklärt

    Gemini 3.1 Flash Lite Image, auch Nano Banana Lite, ist Googles schnelles und günstiges Bildmodell für Text-zu-Bild und Bildbearbeitung. Hier erfährst du Preise, Limits, Mac-Workflow und warum es kein lokales Ollama-Modell ist.

  3. ChatGPT 5.6: GPT-5.6 Sol, Terra und Luna erklärt

    OpenAI startet GPT-5.6 als limitierte Preview. Was Sol, Terra und Luna können, was sie kosten und warum der Launch kontrovers ist.

  4. Sakana Fugu Ultra: KI-Orchestrator mit Agenten-Pool statt lokalem Modell

    Sakana Fugu Ultra ist kein lokales LLM, sondern ein Cloud-Orchestrator mit mehreren Agenten. Was das fuer Mac-Nutzer, EU-Verfuegbarkeit und Preise bedeutet.

  5. macOS 27 Golden Gate: Läuft es auf deinem Mac? Intel-Support endet, Siri AI erklärt

    macOS 27 Golden Gate beendet den Support für Intel-Macs. Prüfe die vollständige Kompatibilitätsliste und erfahre, welche Apple-Intelligence- und Siri-AI-Funktionen M1, M2 und M3 wirklich erhalten.

  6. GLM-5.2 auf dem Mac: OpenRouter, 1M Kontext und Grenzen

    GLM-5.2 von Z.ai erklärt: 1M Kontext, OpenRouter-Setup, Preise, Benchmarks und warum das Modell für normale Macs eher Cloud- als Lokal-KI ist.

  7. Kimi K2.7 Code auf dem Mac: Cloud-Modell mit lokalem CLI

    Kimi K2.7 Code erklärt: 1T MoE, 256K Kontext, MCP-Tools, Ollama Cloud, API-Preise — was das Modell für Coding-Agenten kann.

  8. Claude Fable 5 ist zurück: Status, Preis und Mac-Alternativen

    Anthropic gibt Claude Fable 5 nach aufgehobenen US-Exportkontrollen wieder frei. Der aktuelle Stand zu Claude Code, API, Cloud-Anbietern, Preis, Datenschutz und lokalen Mac-Alternativen.

  9. Nex N2 Pro auf dem Mac: Was 397B MoE in der Praxis bedeuten

    Nex N2 Pro ist ein offenes 397B-MoE-Agentenmodell. Hier steht, was die 17B aktiven Parameter bedeuten, wie viel Speicher realistisch nötig ist und warum ein normaler Mac nicht das Zielsystem ist.

  10. Gemma 4 12B auf dem Mac: Das neue lokale Multimodal-Modell für 16 GB?

    Gemma 4 12B läuft lokal ab 16 GB, bietet 256K Kontext sowie Bild- und Audioverständnis. Was auf dem Mac mit Ollama und MLX wirklich geht.

  11. NVIDIA Nemotron 3 Ultra auf dem Mac: Cloud-Modell mit Ollama-Interface

    NVIDIA Nemotron 3 Ultra erklärt: 550B MoE, Agenten-Workflows und warum es auf dem Mac nur über Cloud läuft.

  12. MiniMax M3 auf dem Mac: 1M Kontext und API-Preise

    MiniMax M3 erklärt: 1M Kontext, Sparse Attention, Multimodalität, OpenRouter-Setup und was Mac-Nutzer wissen müssen.

  13. StepFun Step 3.7 Flash auf dem Mac: 198B MoE, 256K Kontext und die lokale Realität

    StepFun Step 3.7 Flash erklärt: 198B MoE, 11B aktive Parameter, 256K Kontext, API-Preise, Benchmarks, Mac-RAM-Grenzen und warum normale Macs dafür nicht reichen.

  14. Claude Opus 4.8: Lohnt sich das Upgrade für Mac-Entwickler?

    Claude Opus 4.8 im Praxistest auf dem Mac: Was Fast Mode, adaptive Thinking und 1M Context wirklich bringen — und wann sich der Preis lohnt.

  15. Xiaomi MiMo-V2.5-Pro: Preis, Benchmarks und Mac-Realität

    Xiaomi MiMo-V2.5 und MiMo-V2.5-Pro im ehrlichen Check: Preise, offizielle Benchmarks, Token Plan, API-Setup und warum offene Gewichte nicht automatisch lokale Mac-KI bedeuten.

  16. MiniMax M2.7 auf dem Mac: 10 % Rabatt und Cloud-KI

    MiniMax M2.7 erklärt: Cloud-KI für Coding-Agenten, Benchmarks, Token Plan, 10-%-Referral-Hinweis, Ollama Cloud und lokale Mac-Alternativen.

  17. Kann man Gemini 3.5 Flash lokal mit Ollama nutzen?

    Gemini 3.5 Flash läuft nicht lokal in Ollama, LM Studio oder MLX. Was auf dem Mac wirklich geht und welche lokalen Modelle passen.

  18. Qwen3.7 Max: Lohnt sich OpenRouter?

    Qwen3.7-Max über OpenRouter: Preise, 1M Kontext, Cache-Kosten, API-Setup und klare Mac-Einordnung.

  19. Gemini 3.5 Flash auf dem Mac: Preise, API und lokale Grenzen

    Gemini 3.5 Flash erklärt: API-Setup, 1M Kontext, Preise, Datenschutz, Agenten und warum das Modell nicht lokal in Ollama oder MLX läuft.

  20. Qwen3-ASR + Qwen3-TTS vs. Grok Voice: Lokal oder Cloud?

    Qwen3-ASR, Qwen3-TTS und Grok Voice verglichen: ASR, TTS, Voice Agents, Datenschutz und Preise.

  21. Ministral 3 auf dem Mac: 3B, 8B, 14B mit Ollama

    Ministral 3 lokal auf Apple Silicon: Ollama, 3B/8B/14B, Vision, Tool Calling und RAM-Grenzen.

  22. Claude Opus 4.7 Fast vs Standard: Lohnt sich der 6x-Aufpreis?

    Claude Opus 4.7 Fast Mode im Test: 6x Preis, 2,5x Speed — lohnt sich das für Mac-Entwickler?

  23. Moondream2 auf dem Mac: 1,7 GB Vision ohne Cloud

    Moondream2 lokal auf Apple Silicon: Ollama-Setup, Bildanalyse und echte Grenzen.

  24. Gemma 4 vs Qwen3.6 auf dem Mac: Was lohnt sich?

    Gemma 4 26B vs Qwen3.6 27B auf Apple Silicon: Erfahrung, Vergleich und Empfehlung für lokale KI.

  25. Laguna XS.2 auf dem Mac: Coding-Modell, Benchmarks und RAM-Grenzen

    Laguna XS.2 von Poolside erreicht 69,9 % auf SWE-bench Verified. Was auf dem Mac lokal geht, welche Ollama-Tags passen und wo Qwen3.6 vorn liegt.

  26. Gemma 4 vs Qwen3.6 auf dem Mac: Wer lohnt sich?

    Gemma 4 26B A4B vs Qwen3.6 27B: Ollama-Größen, echte Benchmarkwerte, Architektur, 256K Kontext, RAM-Grenzen und Mac-Empfehlung.

  27. Perceptron Mk1 auf dem Mac: Video-KI ist Cloud-Only

    Perceptron Mk1 erklärt: Video-Reasoning per API, strukturierte Annotationen und lokale Mac-Alternativen.

  28. Lokale Vision-LLMs auf dem Mac: Welche Modelle lohnen sich wirklich?

    Gemma 3, Qwen2.5-VL, Llama 3.2 Vision und Moondream im Praxisvergleich für Apple Silicon: OCR, Screenshots, Dokumente, Benchmarks, RAM und sinnvolle Prompts.

  29. Kleine LLMs auf dem Mac: Welche lohnen sich?

    Kleine lokale LLMs für Apple Silicon: Qwen3, Qwen3.5, Ollama, RAM-Bedarf und sinnvolle Einstellungen.

  30. Gemma 3 auf dem Mac: Welche Variante passt zu dir?

    Gemma 3 lokal auf Apple Silicon: Welches Modell für welchen Mac, Ollama-Setup und die Wahrheit über Vision und 128K Kontext.

  31. Gemma 4 auf dem Mac: Welche Variante passt zu dir?

    Gemma 4 lokal auf Apple Silicon: E2B, E4B, 26B oder 31B — welche Variante für welchen Mac sinnvoll ist.

  32. DeepSeek V4 Pro vs Flash auf dem Mac: API-Kosten, 1M Kontext und Cloud-Realität

    DeepSeek V4 Pro und Flash realistisch erklärt: 1M Kontext, API-Preise, Thinking-Modi, Benchmarks, Ollama Cloud und warum beide keine normalen lokalen Mac-Modelle sind.

  33. ERNIE 5.1 von Baidu: Was das Modell kann — und warum es nicht auf den Mac kommt

    ERNIE 5.1 laut Baidu: AIME26 mit Tools, LMArena Search, Cloud-Zugang und warum Mac-Nutzer es nicht als lokales Modell planen sollten.

  34. Qwen3.6 auf dem Mac: 27B, 35B-A3B, Vision und Ollama

    Qwen3.6 lokal auf Apple Silicon nutzen: 27B vs. 35B-A3B, Ollama- und MLX-Tags, Vision, Benchmarks und realistische RAM-Grenzen.

  35. Unified Memory: Warum lokale LLMs auf dem Mac laufen

    Unified Memory erklärt: Warum Apple Silicon lokalen LLMs hilft, wo Speicherbandbreite zählt und wann Mac mini M4, M4 Pro oder Cloud sinnvoller sind.

  36. Beste Open-Weight-LLMs für Mac 2026: Qwen3.6, Gemma 4 und Llama 4 realistisch eingeordnet

    Qwen3.6, Gemma 4 und Llama 4 Scout im realistischen Mac-Vergleich: Ollama-Tags, Unified-Memory-Empfehlungen, Benchmarks, Kontextfenster und lokale Grenzen.

  37. Mac mini M4 Pro: Welche Modelle sind wirklich schneller?

    Ollama, MLX, llama.cpp auf dem Mac mini M4 Pro: RAM-Grenzen und lokale LLM-Tests.

  38. Apple Intelligence vs. lokale KI: Datenschutz auf dem Mac

    Apple Intelligence, PCC, ChatGPT und lokale KI auf dem Mac: Welche Daten lokal bleiben, wann Cloud greift und wann Ollama privater ist.

  39. Whisper lokal auf dem Mac: Transkribieren ohne Cloud

    Whisper lokal auf Apple Silicon: mlx-whisper, WhisperKit, Datenschutz und Sprechertrennung.

  40. LM Studio vs. Ollama: Was ist besser auf dem Mac?

    LM Studio oder Ollama auf Apple Silicon? GUI vs CLI, API, Offline, MLX/GGUF, Datenschutz — ehrlicher Vergleich.

  41. Mac mini M4 als KI-Server: Lohnt sich das?

    Mac mini M4 als lokaler KI-Server: RAM-Empfehlung, Ollama im LAN, Sicherheit, Stromkosten und Cloud-Vergleich.

  42. Ollama auf dem Mac mini M4 einrichten: lokale KI, RAM-Grenzen und Cloud-Falle erklärt

    Ollama auf dem Mac mini M4 richtig einrichten: Installation, Modellwahl für 16/24/32/48/64 GB Unified Memory, lokale API, Open WebUI, Kontextlänge, Cloud-Modelle und Datenschutz.

  43. Mac mini M4 für lokale KI: Welche RAM-Größe kaufen?

    Mac mini M4 für lokale KI: klare RAM-Empfehlung, Ollama, LM Studio, Modellwahl und Datenschutz.