MiniMax M3 auf dem Mac: 1M Kontext und API-Preise
MiniMax M3 erklärt: 1M Kontext, Sparse Attention, Multimodalität, OpenRouter-Setup und was Mac-Nutzer wissen müssen.
MiniMax M3 ist mir aufgefallen, weil es 1M Kontext und offene Gewichte anbietet. Aber mit 428B Gesamtparametern ist es kein lokales Mac-Modell — es ist ein Cloud-/API-Modell mit starken Features.
Was MiniMax M3 kann
Das Modell unterstützt bis zu 1M Tokens Kontext, Text-, Bild- und Video-Eingaben. Die Besonderheit ist Sparse Attention (MSA): Statt jeden Kontext-Position gleich zu behandeln, werden relevante KV-Blöcke ausgewählt. Laut MiniMax braucht M3 bei 1M Kontext nur 1/20 der Rechenleistung der Vorgängergeneration.
Die Benchmarks zeigen Stärken bei Coding, Agenten und Multimodalität. Aber: Das sind Vendor-Benchmarks, keine unabhängigen Tests.
Preis und Zugang
Über OpenRouter: minimax/minimax-m3. Über MiniMax API: direkt mit API-Key.
Die Preise sind fair: $0,30/M Input, $1,20/M Output (mit 50% Rabatt). Über 512K Tokens wird es teurer.
Wann lohnt es sich?
Lohnt sich wenn:
- Du 1M Kontext brauchst
- Du Coding-Agenten mit langem Kontext nutzt
- Du Multimodalität (Bild+Video) brauchst
- Cloud-Verarbeitung kein Problem ist
Lohnt sich nicht wenn:
- Du lokale KI willst (ist kein lokales Modell)
- Du kurze Fragen stellst
- Datenschutz kritisch ist
Mein Fazit
MiniMax M3 ist ein starkes Cloud-Modell mit 1M Kontext. Für lokale Mac-Nutzer relevant als API-Option, nicht als lokales Modell. Wer 1M Kontext braucht, ist mit MiniMax M3 gut bedient.
Getestet Juni 2026 über OpenRouter auf Mac Mini M4 mit 32 GB.
Transparenz
Quellen und Prüfgrundlage
Diese Primär- und Referenzquellen bilden die Grundlage der technischen Einordnung. Herstellerangaben und externe Benchmarks werden im Artikel als solche gekennzeichnet.