Kategorie 8 Artikel

Lokale Modelle

Lokale Sprach-, Vision- und Audio-Modelle auf Apple Silicon: Qwen3, Gemma3, Llama, Mistral und mehr — Benchmarks und RAM-Anforderungen für M1–M4 Macs.

8 Artikel

Zuletzt veröffentlicht Gemma 4 12B auf dem Mac: Das neue lokale…

Themen 20

Passendes Modell finden
Setup pro Modell
Benchmark-Vergleiche
RAM-Anforderungen

#gemma #gemma4 #gemma-4-12b #google #ollama #mlx #apple-silicon #multimodal #vision #audio #local-ai #benchmark #qwen3-asr #qwen3-tts #grok-voice #asr #tts #qwen #llm #coding

Was zählt als lokales Modell?

Läuft auf deinem Mac

Die Modellgewichte werden heruntergeladen und die Inferenz läuft lokal über Ollama, LM Studio, MLX, llama.cpp oder eine ähnliche Runtime.

Open Weights heißt nicht immer Open Source

Viele lokale Modelle sind Open-Weight, aber ihre Lizenz kann kommerzielle Nutzung, Weiterverteilung oder Fine-Tuning trotzdem einschränken.

Speicher entscheidet

Modellgröße ist nicht gleich Speicherbedarf. Kontextlänge, KV-Cache, Quantisierung, Vision-Input und andere Apps beeinflussen Unified Memory ebenfalls.

Datenschutz hängt von der Konfiguration ab

Lokale Inferenz kann Prompts auf deinem Mac halten, aber Downloads, Plugins, Cloud-Funktionen, freigegebene lokale Server und Backups können trotzdem Datenpfade erzeugen.

Einstieg in lokale Modelle

⚙️ Runtime wählen Vergleiche LM Studio und Ollama, bevor du dein lokales KI-Setup aufbaust. → 📦 Erstes Modell installieren Richte Ollama ein und starte dein erstes lokales Modell auf Apple Silicon. → 💾 Speicher verstehen Verstehe, warum Unified Memory, Modellgröße und Kontextlänge entscheidend sind. → 📊 Modellfamilien vergleichen Vergleiche Qwen, Gemma, Llama und andere Open-Weight-Modelle für Mac-Workflows. →

Checkliste für lokale Modelle

Ist das Modell wirklich herunterladbar?
Gibt es Ollama-, GGUF-, MLX- oder LM-Studio-Unterstützung?
Ist es text-only, vision-fähig, audio-fähig oder multimodal?
Welche Lizenz gilt: Open Source, Open Weights, Research-only oder kommerziell?
Wie viel Unified Memory ist realistisch nach Kontext und KV-Cache?
Braucht es Cloud-Funktionen, API-Aufrufe oder Online-Tools?
Kannst du es nach dem Download offline nutzen?
Passt es besser zu deiner Aufgabe als ein kleineres Modell?

Wie Empfehlungen für lokale Modelle entstehen

Empfehlungen für lokale Modelle auf AI on Mac sollen Modellgröße, Quantisierung, Runtime, Kontextlänge, Apple-Silicon-Generation und Unified Memory getrennt betrachten. Ein Modell, das auf einem 48-GB-Mac-Studio funktioniert, kann auf einem 8-GB-MacBook-Air unrealistisch sein. Die Artikel in dieser Kategorie sollen außerdem zwischen Open Source, Open Weights, Cloud-only-APIs und hybriden Tools unterscheiden.

Lokale Modelle

Was zählt als lokales Modell?

Läuft auf deinem Mac

Open Weights heißt nicht immer Open Source

Speicher entscheidet

Datenschutz hängt von der Konfiguration ab

Einstieg in lokale Modelle

Checkliste für lokale Modelle

Gemma 4 12B auf dem Mac: Das neue lokale Multimodal-Modell für 16 GB?

Qwen3-ASR + Qwen3-TTS vs. Grok Voice: Lokal oder Cloud?

Gemma 4 vs Qwen3.6 auf dem Mac: Was lohnt sich?

Laguna XS.2 auf dem Mac: Coding-Modell, Benchmarks und RAM-Grenzen

Gemma 4 vs Qwen3.6 auf dem Mac: Wer lohnt sich?

Lokale Vision-LLMs auf dem Mac: Welche Modelle lohnen sich wirklich?

Kleine LLMs auf dem Mac: Welche lohnen sich?

Beste Open-Weight-LLMs für Mac 2026: Qwen3.6, Gemma 4 und Llama 4 realistisch eingeordnet

Wie Empfehlungen für lokale Modelle entstehen