Ist MiniMax M3 unified?

Ja. MiniMax M3 ist nahtlos einsetzbar für OpenAIs /v1/chat/completions — dieselbe Anfrageform, dasselbe `messages`-Array, dieselben Parameter `stream` / `temperature` / `max_tokens`, dasselbe SSE-Wire-Format. Die meisten Teams migrieren, indem sie die Base URL auf https://api.reapi.ai/v1 ändern, den API key austauschen und `model` auf `minimax/minimax-m3` setzen.

Wie groß sind Kontextfenster und maximale Ausgabe von MiniMax M3?

MiniMax M3 nutzt standardmäßig ein Kontextfenster von 1M Token (mit einem garantierten Minimum von 512K) und unterstützt bis zu 512K Ausgabe-Token pro Antwort, mit empfohlenen 128K. MiniMax Sparse Attention hält die Long-Context-Inferenz effizient, sodass du ganze Repositories und lange Dokumente ohne Chunking einspeisen kannst.

Ist MiniMax M3 ein Reasoning-Modell?

Ja. MiniMax M3 ist ein natives Denkmodell, das schlussfolgert, bevor es antwortet, und verschränktes Denken während der Tool-Nutzung unterstützt. Das Denken ist standardmäßig adaptiv — das Modell schlussfolgert bei schweren Aufgaben und antwortet direkt bei einfachen — und du kannst es für die schnellsten, günstigsten Antworten deaktivieren. Die Modell-ID bleibt in beiden Fällen dieselbe.

Unterstützt MiniMax M3 Vision und Tool-Nutzung?

Ja. MiniMax M3 ist nativ multimodal: es akzeptiert Bild- und Videoeingaben zusammen mit Text im selben Aufruf, und es unterstützt Function Calling / Tool-Nutzung mit JSON-Ausgabe. Es ist auf agentische, mehrstufige Workflows abgestimmt, die Vision, Retrieval und Code vermischen.

Wie schneidet MiniMax M3 im Vergleich zu DeepSeek V4 und anderen Frontier-Modellen ab?

MiniMax M3 und DeepSeek V4 sind beide Open-Weight-Modelle zum Value-Preis mit 1M Kontext, Denken und Tool-Nutzung. MiniMax positioniert M3 rund um Frontier-Coding und agentische Benchmarks sowie native Bild-und-Video-Multimodalität; MiniMax berichtet M3 in Reichweite der besten Closed-Source-Modelle bei Software-Engineering-Aufgaben. Die Vergleichstabelle auf dieser Seite schlüsselt die Unterschiede auf. Alles auf einem api.reapi.ai-Key, sodass du sie pro Anfrage A/B-testen kannst.

Unterstützt MiniMax M3 Prompt-Caching?

Ja. MiniMax M3 cached stabile Prompt-Präfixe, und Cache-Lesevorgänge werden zu einem kleinen Bruchteil des Standard-Eingabetarifs abgerechnet. Verwende denselben System-Prompt und dieselben Tool-Schemas über Aufrufe hinweg wieder, und der Rabatt gilt automatisch für die wiederholten Token — eine große Ersparnis für Long-Context-Agenten und Chatbots.

Wo erstelle ich einen API key und kaufe Token?

Beides geschieht auf api.reapi.ai — der Chat-Workspace läuft als eigene Plattform, getrennt vom Bild-/Video-Task-Gateway auf reapi.ai. Registriere dich auf api.reapi.ai, generiere einen Key unter API Keys und lade unter Top Up auf. Ein reapi.ai/settings/apikeys-Key authentifiziert sich nicht gegenüber dem MiniMax-M3-Chat-Endpunkt.

MiniMax M3 — Frontier-Coding, 1M Kontext

MiniMax M3 ist ein Open-Weight-Modell, das Frontier-Coding und agentische Benchmarks mit einem Kontextfenster von 1M Token und nativer multimodaler Eingabe verbindet. MiniMax M3 denkt nach, bevor es antwortet, ruft Tools über langläufige Durchläufe hinweg auf und liest Bilder und Video im selben Aufruf — bereitgestellt auf api.reapi.ai als nahtloser, unified Endpunkt. Pay-as-you-go in USD zu einem Bruchteil der Tarife von Closed-Source-Frontier-Modellen.

MiniMax M3modelminimax/minimax-m3

MiniMax M3 playground

Open the chat playground to run MiniMax M3 through the standard chat completions surface with your api.reapi.ai key.

Open chat playground

Was du mit diesem Modell bauen kannst

Echte Workflows und produktionsreife Use Cases, die du mit diesem Modell bauen und ausliefern kannst.

MiniMax M3 steuert eine langläufige agentische Coding-Sitzung

Langläufiges agentisches Coding und Software-Engineering

Agentisches Coding ist das Aushängeschild von MiniMax M3. MiniMax berichtet Frontier-Ergebnisse auf Software-Engineering-Benchmarks — 59.0% auf SWE-Bench Pro und 66.0% auf Terminal-Bench 2.1 — und bringt MiniMax M3 damit in Reichweite der besten Closed-Source-Coding-Modelle, während es Open-Weight bleibt. Richte einen Coding-Agenten auf MiniMax M3 aus, und er steckt die Aufgabe ab, ruft Tools auf, schlussfolgert über mehrstufige Arbeit und korrigiert sich selbst über einen langen Durchlauf hinweg — alles in einer Sitzung.

API docs lesen

MiniMax M3 schlussfolgert über ein Analysepaket mit einer Million Token

Codebasis- und Dokumentanalyse mit einer Million Token

MiniMax M3 nutzt standardmäßig ein Kontextfenster von 1M Token — genug, um ein ganzes mittelgroßes Repository, ein langes Recherchepaket oder eine mehrteilige Agenten-Trace in einem einzigen Aufruf zu laden. MiniMax Sparse Attention hält die Long-Context-Inferenz effizient, sodass MiniMax-M3-Workloads wie Architektur-Reviews, Dependency-Audits und Migrationsplanung selten Chunking benötigen. Stabile Prompt-Präfixe erreichen bei jeder Wiederholung den niedrigen Cache-Lese-Tarif.

MiniMax M3 kombiniert Bild, Video und Tool-Nutzung in einem Aufruf

Natives multimodales Verständnis und Tool-Nutzung

MiniMax M3 ist von Grund auf multimodal: sende Bilder und Video zusammen mit Text im selben Chat-Completions-Aufruf — Screenshots, Diagramme, Dokument-Scans und Clips — und das Modell schlussfolgert über all das. Kombiniert mit zuverlässigem Function Calling und JSON-Ausgabe steuert MiniMax M3 Browser-Agenten, Dokument-Pipelines und Tool-nutzende Workflows, die Vision, Retrieval und Code vermischen.

Preise

Credit-basiert — 1 Credit = 0,001 USD. Du zahlst nur für erfolgreich abgeschlossene Generierungen.

Kategorie	Einheit	Preis
Token-Preise
Eingabe	1M tokens	$0.6
Ausgabe	1M tokens	$2.4
Cache-Lesevorgang	1M tokens	$0.12

Warum reAPI

unified und nahtlos einsetzbar

MiniMax M3 spricht OpenAI Chat Completions wortgetreu. Eine bestehende OpenAI-Integration auf MiniMax M3 umzustellen ist eine Sache von Base URL, API key und einer Änderung des Modell-Strings — `minimax/minimax-m3` — kein Plattform-Rewrite. Dasselbe `messages`-Array, dasselbe Streaming-Format, dieselbe Form des Tool-Callings.

Frontier-Coding zum Value-Preis

MiniMax M3 ist Open-Weight und entsprechend bepreist. Es erzielt Frontier-Coding- und agentische Benchmarks und kostet dabei pro Token einen Bruchteil von Closed-Source-Modellen — und Prompt-Caching senkt den Preis bei wiederholtem Kontext noch einmal. Führe Premium-Agentik-Arbeit ohne Premium-Rechnungen pro Token aus.

Ein Key für MiniMax, GPT, Claude und Gemini

Ein einziger api.reapi.ai-Key schaltet MiniMax M3 frei — zusammen mit GPT-5.5, Claude Opus 4.8, DeepSeek V4, Gemini und jedem anderen Frontier-Chat-Modell auf der Plattform. Vergleiche Anbieter, füge Fallbacks hinzu und leite Traffic pro Aufruf um — mit einer Konfigurationsänderung statt eines Integrationsprojekts.

MiniMax M3 vs DeepSeek V4

MiniMax M3 und DeepSeek V4 sind beide Open-Weight-Modelle zum Value-Preis mit einem Kontextfenster von 1M Token, Denken und Tool-Nutzung. So ist MiniMax M3 gegenüber DeepSeek V4 in den Dimensionen positioniert, die für agentische und Coding-Arbeit zählen.

Fähigkeit

MiniMax M3 auf reAPI

DeepSeek V4

Positionierung

Einzelnes Open-Weight-Modell, abgestimmt auf Frontier-Coding, langläufige Agenten und native Multimodalität.

Zwei Open-Weight-Varianten — Flash (schnell / niedrige Kosten) und Pro (Flaggschiff-Reasoning).

Kontextfenster

1M Token standardmäßig, mit garantiertem Minimum von 512K und MiniMax Sparse Attention für effizienten langen Kontext.

Kontextfenster von 1M Token mit DeepSeek Sparse Attention.

Maximale Ausgabe

Bis zu 512K Ausgabe-Token pro Antwort (128K empfohlen).

Bis zu 384K Ausgabe-Token pro Antwort.

Denken

Natives Denken mit verschränktem Reasoning während der Tool-Nutzung; standardmäßig adaptiv, deaktivierbar.

Denkmodus standardmäßig aktiviert, mit einem dualen Schalter für Denken / Nicht-Denken.

Multimodale Eingabe

Natives Bild- und Videoverständnis im selben Chat-Completions-Aufruf.

Bildeingabe unterstützt (Beta); Text-und-Bild.

Agentik- und Coding-Fokus

Vom Anbieter berichtete Frontier-Ergebnisse auf SWE-Bench Pro, Terminal-Bench und Agenten-Benchmarks; abgestimmt auf langläufige Coding-Agenten.

Dedizierte agentische Optimierungen; laut DeepSeek Open-Source-SOTA bei agentischem Coding.

Der Vergleich spiegelt das öffentlich dokumentierte Verhalten aus den Release Notes von MiniMax zu M3 und der V4-Dokumentation von DeepSeek zum Zeitpunkt der Erstellung wider. Benchmark-Zahlen sind vom Anbieter berichtet. Modellverhalten und Preise können sich ändern; prüfe die Preiskarte oben und die API docs für aktuelle Werte.

MiniMax M3 in drei Schritten ausliefern

step 01
Konto und Key auf api.reapi.ai erstellen
Registriere dich auf api.reapi.ai, öffne die Konsole, generiere einen API key unter API Keys und lade Token unter Top Up auf. Der Chat-Workspace ist vom Bild-/Video-Gateway auf reapi.ai getrennt — Keys sind nicht übergreifend gültig.
Öffnen
step 02
Erste Anfrage senden
POST https://api.reapi.ai/v1/chat/completions mit `model` gesetzt auf `minimax/minimax-m3`, deinem `messages`-Array und `max_tokens`. Der MiniMax-M3-Endpunkt ist unified, einschließlich gestreamter Antworten, sodass die meisten SDKs allein mit einer Änderung der Base URL funktionieren.
Öffnen
step 03
Für Reasoning und Kosten optimieren
MiniMax M3 denkt adaptiv — es schlussfolgert, wenn eine Aufgabe schwer ist, und antwortet direkt, wenn nicht. Verwende stabile System-Prompts und Tool-Schemas über Aufrufe hinweg wieder, um den niedrigen Cache-Lese-Tarif zu erreichen, und setze `max_tokens` hoch genug, um die Gedankenkette bei reasoning-intensiver Arbeit unterzubringen.
Öffnen

Häufig gestellte Fragen

Häufige Fragen zu diesem Modell.

MiniMax M3 wird Pay-as-you-go in USD gegen dein api.reapi.ai-Token-Guthaben abgerechnet. Die Preiskarte auf dieser Seite zeigt die aktuellen Tarife pro 1M Token für Eingabe, Ausgabe und Cache-Lesevorgang. Cache-Lesevorgänge sind drastisch günstiger, als dieselben Token erneut zu senden, und fehlgeschlagene Anfragen werden nicht berechnet.

Bereit zum Start?

Probiere es im Playground aus oder hol dir einen API-Key, um direkt loszulegen.

API key erhalten API docs ansehen

MiniMax M3 — Frontier-Coding, 1M Kontext

Was du mit diesem Modell bauen kannst

Echte Workflows und produktionsreife Use Cases, die du mit diesem Modell bauen und ausliefern kannst.

Langläufiges agentisches Coding und Software-Engineering

API docs lesen

Codebasis- und Dokumentanalyse mit einer Million Token

Natives multimodales Verständnis und Tool-Nutzung

Kategorie	Einheit	Preis
Token-Preise
Eingabe	1M tokens	$0.6
Ausgabe	1M tokens	$2.4
Cache-Lesevorgang	1M tokens	$0.12

Kategorie

Einheit

Preis

Token-Preise

Eingabe

1M tokens

$0.6

Ausgabe

1M tokens

$2.4

Cache-Lesevorgang

1M tokens

$0.12

Warum reAPI

unified und nahtlos einsetzbar

Frontier-Coding zum Value-Preis

Ein Key für MiniMax, GPT, Claude und Gemini

MiniMax M3 vs DeepSeek V4

Fähigkeit

MiniMax M3 auf reAPI

DeepSeek V4

Positionierung

Einzelnes Open-Weight-Modell, abgestimmt auf Frontier-Coding, langläufige Agenten und native Multimodalität.

Zwei Open-Weight-Varianten — Flash (schnell / niedrige Kosten) und Pro (Flaggschiff-Reasoning).

Kontextfenster

1M Token standardmäßig, mit garantiertem Minimum von 512K und MiniMax Sparse Attention für effizienten langen Kontext.

Kontextfenster von 1M Token mit DeepSeek Sparse Attention.

Maximale Ausgabe

Bis zu 512K Ausgabe-Token pro Antwort (128K empfohlen).

Bis zu 384K Ausgabe-Token pro Antwort.

Denken

Natives Denken mit verschränktem Reasoning während der Tool-Nutzung; standardmäßig adaptiv, deaktivierbar.

Denkmodus standardmäßig aktiviert, mit einem dualen Schalter für Denken / Nicht-Denken.

Multimodale Eingabe

Natives Bild- und Videoverständnis im selben Chat-Completions-Aufruf.

Bildeingabe unterstützt (Beta); Text-und-Bild.

Agentik- und Coding-Fokus

Vom Anbieter berichtete Frontier-Ergebnisse auf SWE-Bench Pro, Terminal-Bench und Agenten-Benchmarks; abgestimmt auf langläufige Coding-Agenten.

Dedizierte agentische Optimierungen; laut DeepSeek Open-Source-SOTA bei agentischem Coding.

MiniMax M3 in drei Schritten ausliefern

step 01
Konto und Key auf api.reapi.ai erstellen
Registriere dich auf api.reapi.ai, öffne die Konsole, generiere einen API key unter API Keys und lade Token unter Top Up auf. Der Chat-Workspace ist vom Bild-/Video-Gateway auf reapi.ai getrennt — Keys sind nicht übergreifend gültig.
Öffnen
step 02
Erste Anfrage senden
POST https://api.reapi.ai/v1/chat/completions mit `model` gesetzt auf `minimax/minimax-m3`, deinem `messages`-Array und `max_tokens`. Der MiniMax-M3-Endpunkt ist unified, einschließlich gestreamter Antworten, sodass die meisten SDKs allein mit einer Änderung der Base URL funktionieren.
Öffnen
step 03
Für Reasoning und Kosten optimieren
MiniMax M3 denkt adaptiv — es schlussfolgert, wenn eine Aufgabe schwer ist, und antwortet direkt, wenn nicht. Verwende stabile System-Prompts und Tool-Schemas über Aufrufe hinweg wieder, um den niedrigen Cache-Lese-Tarif zu erreichen, und setze `max_tokens` hoch genug, um die Gedankenkette bei reasoning-intensiver Arbeit unterzubringen.
Öffnen

MiniMax M3 — Frontier-Coding, 1M Kontext

MiniMax M3 playground

Was du mit diesem Modell bauen kannst

Langläufiges agentisches Coding und Software-Engineering

Codebasis- und Dokumentanalyse mit einer Million Token

Natives multimodales Verständnis und Tool-Nutzung

Preise

Warum reAPI

unified und nahtlos einsetzbar

Frontier-Coding zum Value-Preis

Ein Key für MiniMax, GPT, Claude und Gemini

MiniMax M3 vs DeepSeek V4

MiniMax M3 in drei Schritten ausliefern

Konto und Key auf api.reapi.ai erstellen

Erste Anfrage senden

Für Reasoning und Kosten optimieren

Häufig gestellte Fragen

Wie viel kostet MiniMax M3?

Ist MiniMax M3 unified?

Wie groß sind Kontextfenster und maximale Ausgabe von MiniMax M3?

Ist MiniMax M3 ein Reasoning-Modell?

Unterstützt MiniMax M3 Vision und Tool-Nutzung?

Wie schneidet MiniMax M3 im Vergleich zu DeepSeek V4 und anderen Frontier-Modellen ab?

Unterstützt MiniMax M3 Prompt-Caching?

Wo erstelle ich einen API key und kaufe Token?

Verwandte Modelle

DeepSeek V4

GPT-5.4

Claude Opus 4.7

Claude Sonnet 4.6

Bereit zum Start?

MiniMax M3 — Frontier-Coding, 1M Kontext

MiniMax M3 playground

Was du mit diesem Modell bauen kannst

Langläufiges agentisches Coding und Software-Engineering

Codebasis- und Dokumentanalyse mit einer Million Token

Natives multimodales Verständnis und Tool-Nutzung

Preise

Warum reAPI

unified und nahtlos einsetzbar

Frontier-Coding zum Value-Preis

Ein Key für MiniMax, GPT, Claude und Gemini

MiniMax M3 vs DeepSeek V4

MiniMax M3 in drei Schritten ausliefern

Konto und Key auf api.reapi.ai erstellen

Erste Anfrage senden

Für Reasoning und Kosten optimieren

Häufig gestellte Fragen

Wie viel kostet MiniMax M3?

Ist MiniMax M3 unified?

Wie groß sind Kontextfenster und maximale Ausgabe von MiniMax M3?

Ist MiniMax M3 ein Reasoning-Modell?

Unterstützt MiniMax M3 Vision und Tool-Nutzung?

Wie schneidet MiniMax M3 im Vergleich zu DeepSeek V4 und anderen Frontier-Modellen ab?

Unterstützt MiniMax M3 Prompt-Caching?

Wo erstelle ich einen API key und kaufe Token?

Verwandte Modelle

DeepSeek V4

GPT-5.4

Claude Opus 4.7

Claude Sonnet 4.6

Bereit zum Start?