Claude Sonnet 5 auf dem Mac: Agenten, Coding, 1M Kontext und API-Kosten erklärt
Claude Sonnet 5 erklärt: offizieller Modellname, 1M Kontext, 128K Output, adaptive Thinking, Preise, Claude Code, OpenRouter-Schreibweise und warum es nicht lokal auf dem Mac läuft.
NEUGemini 3.1 Flash Lite Image auf dem Mac: Nano Banana Lite für schnelle KI-Bilder erklärt
Gemini 3.1 Flash Lite Image, auch Nano Banana Lite, ist Googles schnelles und günstiges Bildmodell für Text-zu-Bild und Bildbearbeitung. Hier erfährst du Preise, Limits, Mac-Workflow und warum es kein lokales Ollama-Modell ist.
Sakana Fugu Ultra: KI-Orchestrator mit Agenten-Pool statt lokalem Modell
Sakana Fugu Ultra ist kein lokales LLM, sondern ein Cloud-Orchestrator mit mehreren Agenten. Was das fuer Mac-Nutzer, EU-Verfuegbarkeit und Preise bedeutet.
GLM-5.2 auf dem Mac: OpenRouter, 1M Kontext und Grenzen
GLM-5.2 von Z.ai erklärt: 1M Kontext, OpenRouter-Setup, Preise, Benchmarks und warum das Modell für normale Macs eher Cloud- als Lokal-KI ist.
Claude Fable 5 ist zurück: Status, Preis und Mac-Alternativen
Anthropic gibt Claude Fable 5 nach aufgehobenen US-Exportkontrollen wieder frei. Der aktuelle Stand zu Claude Code, API, Cloud-Anbietern, Preis, Datenschutz und lokalen Mac-Alternativen.
Nex N2 Pro auf dem Mac: Was 397B MoE in der Praxis bedeuten
Nex N2 Pro ist ein offenes 397B-MoE-Agentenmodell. Hier steht, was die 17B aktiven Parameter bedeuten, wie viel Speicher realistisch nötig ist und warum ein normaler Mac nicht das Zielsystem ist.
NVIDIA Nemotron 3 Ultra auf dem Mac: Cloud-Modell mit Ollama-Interface
NVIDIA Nemotron 3 Ultra erklärt: 550B MoE, Agenten-Workflows und warum es auf dem Mac nur über Cloud läuft.
MiniMax M3 auf dem Mac: 1M Kontext und API-Preise
MiniMax M3 erklärt: 1M Kontext, Sparse Attention, Multimodalität, OpenRouter-Setup und was Mac-Nutzer wissen müssen.
StepFun Step 3.7 Flash auf dem Mac: 198B MoE, 256K Kontext und die lokale Realität
StepFun Step 3.7 Flash erklärt: 198B MoE, 11B aktive Parameter, 256K Kontext, API-Preise, Benchmarks, Mac-RAM-Grenzen und warum normale Macs dafür nicht reichen.
Claude Opus 4.8: Lohnt sich das Upgrade für Mac-Entwickler?
Claude Opus 4.8 im Praxistest auf dem Mac: Was Fast Mode, adaptive Thinking und 1M Context wirklich bringen — und wann sich der Preis lohnt.
MiniMax M2.7 auf dem Mac: 10 % Rabatt und Cloud-KI
MiniMax M2.7 erklärt: Cloud-KI für Coding-Agenten, Benchmarks, Token Plan, 10-%-Referral-Hinweis, Ollama Cloud und lokale Mac-Alternativen.
Kann man Gemini 3.5 Flash lokal mit Ollama nutzen?
Gemini 3.5 Flash läuft nicht lokal in Ollama, LM Studio oder MLX. Was auf dem Mac wirklich geht und welche lokalen Modelle passen.
Claude Opus 4.7 Fast vs Standard: Lohnt sich der 6x-Aufpreis?
Claude Opus 4.7 Fast Mode im Test: 6x Preis, 2,5x Speed — lohnt sich das für Mac-Entwickler?
DeepSeek V4 Pro vs Flash auf dem Mac: API-Kosten, 1M Kontext und Cloud-Realität
DeepSeek V4 Pro und Flash realistisch erklärt: 1M Kontext, API-Preise, Thinking-Modi, Benchmarks, Ollama Cloud und warum beide keine normalen lokalen Mac-Modelle sind.
ERNIE 5.1 von Baidu: Was das Modell kann — und warum es nicht auf den Mac kommt
ERNIE 5.1 laut Baidu: AIME26 mit Tools, LMArena Search, Cloud-Zugang und warum Mac-Nutzer es nicht als lokales Modell planen sollten.