Lokale Modelle 5 Min. Lesezeit

Laguna XS.2 auf dem Mac: Coding-Modell, Benchmarks und RAM-Grenzen

Laguna XS.2 von Poolside erreicht 69,9 % auf SWE-bench Verified. Was auf dem Mac lokal geht, welche Ollama-Tags passen und wo Qwen3.6 vorn liegt.

Technische Recherche und redaktionelle Prüfung. Eigene Messungen werden im Artikel ausdrücklich gekennzeichnet.

Veröffentlicht: 14. Mai 2026 Aktualisiert: 29. Mai 2026

Redaktionelle Methode

Laguna XS.2 — Fakten zuerst

Veröffentlicht: 28. April 2026 Parameter: 33B (3B aktiviert pro Token) Architektur: Mixture-of-Experts (MoE), 256+1 Experten, 40 Layer Kontextfenster: Hugging Face nennt 262.144 Tokens; Ollama listet die verfügbaren Tags mit 128K Kontext Lizenz: Apache 2.0 Download: Hugging Face | Ollama

Laguna XS.2 von Poolside erreicht laut aktueller Model Card 69,9 % auf SWE-bench Verified und ist ab etwa 36 GB gemeinsamem Arbeitsspeicher lokal auf dem Mac nutzbar. Das macht es für Apple-Silicon-Nutzer mit großer Unified-Memory-Konfiguration interessant — aber nicht automatisch zum stärksten Modell in jeder Benchmark-Kategorie.

Die Modellkarte und die Ollama-Tags zeigen: 36 GB als Einstiegspunkt liegen bereits über den 32 GB eines üblichen Mac mini M4. Für den Einstieg sind kleinere Modelle sinnvoller, bevor ein System dieser Größenklasse ausgelastet wird.

Laguna XS.2 Benchmark-Einordnung: lokale Nutzbarkeit und Mac-Grenzen

Grafik auf Basis der Laguna-XS.2-Model-Card, des Poolside-Blogposts und der Ollama-Modellseite. Quellen: Hugging Face Model Card, Poolside Blog, Ollama Laguna XS.2. Geprüft am 27. Mai 2026.


Benchmark-Vergleich: Die offiziellen Zahlen

Offizielle Vergleichswerte aus der Laguna XS.2-Model-Card.

BenchmarkLaguna XS.2 (33B-A3B)Qwen3.6-35B-A3BClaude Haiku 4.5
SWE-bench Verified69,9 %73,4 %73,3 %
SWE-bench Multilingual57,7 %67,2 %
SWE-bench Pro46,3 %49,5 %39,5 %
Terminal-Bench 2.035,7 %51,5 %29,8 %

Quellen: Hugging Face Model Card, Poolside Blog — geprüft am 27. Mai 2026.

Die Tabelle zeigt: Laguna XS.2 ist als lokales offenes Coding-Modell konkurrenzfähig. Qwen3.6-35B-A3B liegt in den Vergleichswerten bei SWE-bench Verified, SWE-bench Multilingual, SWE-bench Pro und Terminal-Bench vor Laguna XS.2.

Wichtig zur Methodik: Poolside nutzt für Laguna XS.2 den Harbor-Framework-Agent-Harness mit mehreren Runs je Benchmark. Die Vergleichswerte stammen teils aus offiziellen Releases anderer Anbieter oder Leaderboards.


Das technische Rezept

Mixture-of-Experts mit 256+1 Experten: Jeder Forward-Pass aktiviert nur 3B der 33B Parameter. Das macht den Speicherbedarf handhabbar, während die Gesamtkapazität des 33B-Modells für komplexe Reasoning-Aufgaben erhalten bleibt.

Sliding Window Attention mit per-head Gating: 30 der 40 Layer nutzen Sliding Window Attention (512-Token-Fenster), 10 Layer nutzen globale Attention. Das reduziert den KV-Cache massiv. In Kombination mit MoE ergibt sich eine Architektur mit niedrigem KV-Cache-Bedarf, die auf Macs mit ≥32 GB Unified Memory läuft.

Native Reasoning + Tool-Calling: Laguna XS.2 unterstützt Thought-Generation direkt im Output. Das Modell kann Reasoning-Schritte interleaved mit Tool-Aufrufen ausführen — wichtig für Agentic-Use-Cases wie SWE-bench, wo Code geschrieben, getestet und iteriert werden muss.

FP8 KV-Cache: Der KV-Cache wird in FP8 gespeichert, was den Speicher pro Token weiter reduziert. Hugging Face nennt für das Modell 262.144 Tokens Kontext, während die Ollama-Tags aktuell mit 128K Kontext gelistet sind. Für Mac-Nutzer zählt deshalb der konkrete Runtime-/Tag-Kontext, nicht nur die theoretische Model-Card-Angabe.


Speicherbedarf: 36 GB als Einstiegspunkt

36 GB sind als Einstiegspunkt zu verstehen. Die Ollama Library listet unter anderem latest mit 23 GB, nvfp4 mit 22 GB, mxfp4 mit 36 GB und BF16-Varianten mit 67 GB. Der reale Unified-Memory-Bedarf liegt über der Paketgröße, weil Kontext, KV-Cache, Runtime und andere Apps dazukommen.


Einordnung: Wo Laguna XS.2 steht

Lokale Modelle (Mac-tauglich): Mit 33B MoE (3B aktiv) ist Laguna XS.2 ein ungewöhnliches Open-Weight-Coding-Modell im lokalen Ökosystem. Sein Hauptvorteil liegt nicht darin, jede Benchmark zu gewinnen, sondern Coding-Leistung lokal auf geeigneter Apple-Silicon-Hardware verfügbar zu machen.

Offene Lizenz: Die Apache-2.0-Lizenz erlaubt auch kommerzielle Nutzung und senkt die Einstiegshürde gegenüber API-only-Modellen. Trotzdem bleiben Sicherheitsprüfung, Einsatzkontext und die Poolside-Nutzungshinweise relevant.

Coding-Fokus: Der Fokus auf agentisches Coding zeigt sich in den aktuellen Werten der Model Card: SWE-bench Verified liegt bei 69,9 %, SWE-bench Pro bei 46,3 % und Terminal-Bench 2.0 bei 35,7 %.


Für Mac-Nutzer konkret

Was läuft:

  • Ollama: ollama run laguna-xs.2 — Modell ist in der Ollama Library verfügbar
  • 36 GB Unified Memory als lokaler Einstiegspunkt laut Poolside — damit wird es eher ein Thema für MacBook-Pro- oder Mac-Studio-Konfigurationen mit großer Unified Memory; Mac mini mit 16 oder 24 GB ist keine stabile Standardempfehlung
  • Auf Apple Silicon sind lokale Runtimes wie Ollama, MLX oder andere Metal-nahe Setups die realistischere Richtung. eGPU-Setups sind für moderne Apple-Silicon-Macs keine normale Empfehlung.

Was nicht läuft:

  • Mac mini mit 16 GB — deutlich unterhalb der offiziellen lokalen Einordnung
  • MacBook Air oder MacBook Pro mit 24 GB — unterhalb der offiziellen Empfehlung; höchstens experimentell mit kleinen Quantisierungen und begrenztem Kontext

Empfehlung: Laguna XS.2 ist vor allem für MacBook-Pro- und Mac-Studio-Konfigurationen mit mindestens 36 GB gemeinsamem Arbeitsspeicher interessant. Geräte mit 16 GB oder 24 GB liegen unterhalb der offiziellen Empfehlung. Wer einen Mac mit ausreichend Unified Memory hat und lokale Coding-Modelle testen will, bekommt mit Laguna XS.2 ein offenes Apache-2.0-Modell mit 33B MoE für Coding.

Was mir auffällt: Die 33B-Modellgröße ist für die meisten lokalen Mac-Setups immer noch zu groß — es sei denn, du hast ein Mac Studio oder MacBook Pro mit 64+ GB. Wer ein Coding-Modell lokal testen will, ist mit Qwen3.6-35B-A3B wahrscheinlich besser bedient, weil die Benchmarks dort besser aussehen.

Wenn du maximale Coding-Benchmarkwerte suchst, ist Qwen3.6-35B-A3B in den offiziellen Vergleichszahlen stärker. Wenn du dagegen ein explizit lokal positioniertes Coding-Modell mit Apache-2.0-Lizenz und Ollama-Tags testen willst, ist Laguna XS.2 genau der interessantere Kandidat.

Ohne mindestens 36 GB Unified Memory ist der Versuch wenig sinnvoll. Kleinere Qwen- oder Mistral-Modelle sind für typische lokale Setups realistischer.


Häufig gestellte Fragen

Kann Laguna XS.2 auf einem Mac mit 36 GB RAM laufen?

Ja, Poolside ordnet das Modell als lokal lauffähig auf Rechnern mit etwa 36 GB gemeinsamem Arbeitsspeicher ein. Das ist ein Einstiegspunkt, kein Garant für lange Kontexte oder hohe Präzision.

Was macht Laguna XS.2 besonders für Coding?

Laguna XS.2 kombiniert 33B Gesamtparameter, 3B aktivierte Parameter pro Token, Apache-2.0-Lizenz und lokale Einordnung. Die aktuellen Model-Card-Werte sind stark, aber Qwen3.6-35B-A3B liegt in mehreren Coding-Benchmarks davor.

Ist Laguna XS.2 kostenlos nutzbar?

Die Modellgewichte sind unter Apache 2.0 verfügbar. Das erlaubt auch kommerzielle Nutzung, ersetzt aber nicht die Verantwortung für passende Sicherheits- und Lizenzprüfung im eigenen Einsatz.

Läuft Laguna XS.2 auf einem Mac mit 16 GB RAM?

Nicht als sinnvolle Standardempfehlung. Die offizielle Einordnung nennt etwa 36 GB gemeinsamen Arbeitsspeicher als lokalen Einstiegspunkt. Mit 16 GB liegt ein Mac deutlich darunter.

Reichen 24 GB Unified Memory für Laguna XS.2?

24 GB können je nach Quantisierung und Runtime experimentell interessant sein, liegen aber unterhalb der offiziellen 36-GB-Empfehlung. Für einen stabilen lokalen Einsatz sollte mit 36 GB oder mehr geplant werden.

Ist Laguna XS.2 besser als Qwen3.6-35B-A3B?

Nicht pauschal. In Poolside/Model-Card-Vergleichswerten liegt Qwen3.6-35B-A3B bei mehreren Coding-Benchmarks vor Laguna XS.2. Laguna XS.2 bleibt wegen lokaler Nutzbarkeit, offener Lizenz und Coding-Fokus interessant.

Wie starte ich Laguna XS.2 mit Ollama?

Mit Ollama lautet der Befehl: `ollama run laguna-xs.2`. Die Library listet mehrere Tags von etwa 22 GB bis 67 GB; der tatsächliche Speicherbedarf hängt von Quantisierung, Kontextlänge, KV-Cache und Runtime ab.