Was ist der Unterschied zwischen DeepSeek V4 Flash und Pro?

Beide gehören zur DeepSeek V4 API und teilen sich ein Kontextfenster von 1M, bis zu 384K Output, Thinking-Modus und Tool-Nutzung. Flash (284 Mrd. / 13 Mrd. aktiv) ist der schnelle, günstige Standard für Autocomplete, Batch-Analysen und Chat-Backends; Pro (1,6 Bio. / 49 Mrd. aktiv) ist das Flaggschiff für tiefes Reasoning, komplexes Debugging und agentisches Coding. Sie teilen sich einen DeepSeek-V4-API-Key — mische sie pro Anfrage.

Ist die DeepSeek V4 API OpenAI-kompatibel?

Ja. Die DeepSeek V4 API ist ein Drop-in für OpenAIs /v1/chat/completions — gleiche Request-Form, gleiches `messages`-Array, gleiche Parameter `stream` / `temperature` / `max_tokens`, gleiches SSE-Wire-Format. Die meisten Teams migrieren, indem sie die Base-URL auf https://api.reapi.ai/v1 umstellen, den API-Key tauschen und `model` auf `deepseek-v4-flash` oder `deepseek-v4-pro` setzen.

Wie groß ist das Kontextfenster von DeepSeek V4?

Beide Modelle der DeepSeek V4 API arbeiten standardmäßig mit einem Kontextfenster von 1M Tokens und unterstützen bis zu 384K Output-Tokens pro Antwort. DeepSeek Sparse Attention hält die Inferenz bei langem Kontext effizient, sodass du ganze Repositories und lange Dokumente ohne Chunking einspeisen kannst.

Wie funktioniert der Thinking-Modus, und kann ich ihn abschalten?

DeepSeek V4 läuft standardmäßig im Thinking-Modus: Es erzeugt eine Gedankenkette vor der finalen Antwort und gibt sie in einem `reasoning_content`-Feld neben `content` zurück. Für latenzkritische oder einfache Aufrufe kannst du in den Non-Thinking-Modus wechseln und so schnellere, günstigere Antworten erhalten — die Model-ID bleibt dieselbe.

Unterstützt die DeepSeek V4 API Vision und Tool-Nutzung?

Ja. Die DeepSeek V4 API akzeptiert Bildeingaben (Beta) neben Text im selben Aufruf und unterstützt Function Calling / Tool-Nutzung sowie JSON-Output. Sie ist auf agentische, mehrstufige Workflows abgestimmt und integriert mit führenden Coding-Agent-Harnesses.

Wie unterscheidet sich DeepSeek V4 von DeepSeek V3.2?

Die DeepSeek V4 API hebt das Standard-Kontextfenster auf 1M Tokens an (von 128K), teilt sich statt in eines in zwei Varianten (Flash und Pro), schaltet Thinking standardmäßig an mit einem dualen Thinking-/Non-Thinking-Modus, ergänzt Bildeingabe und bringt dedizierte agentische Optimierungen mit. Pro misst sich bei Reasoning und Coding mit führenden Closed-Source-Modellen und bleibt dabei Open-Weight.

Wo erstelle ich einen API-Key und kaufe Tokens?

Beides läuft auf api.reapi.ai — der Chat-Workspace ist eine eigene Plattform, getrennt vom Gateway für Bild-/Video-Tasks auf reapi.ai. Registriere dich auf api.reapi.ai, erzeuge unter API Keys einen Key und lade unter Top Up auf. Ein Key von reapi.ai/settings/apikeys authentifiziert sich nicht gegen den Chat-Endpoint.

DeepSeek V4 API — Flash & Pro, 1M Kontext

Die DeepSeek V4 API liefert zwei Open-Weight-Modelle über einen OpenAI-kompatiblen Endpoint — Flash für schnelle, günstige Alltagsaufgaben und Pro für Spitzen-Reasoning, agentisches Coding und STEM. Beide bieten ein Kontextfenster von 1M Tokens, bis zu 384K Output, standardmäßig aktivierten Thinking-Modus, Bildeingabe, Tool-Nutzung und Context-Caching. Abrechnung nach Verbrauch in USD.

DeepSeek V4modeldeepseek-v4-flash

DeepSeek V4 playground

Open the chat playground to run DeepSeek V4 through the standard chat completions surface with your api.reapi.ai key.

Open chat playground

Was du mit diesem Modell bauen kannst

Echte Workflows und produktionsreife Use Cases, die du mit diesem Modell bauen und ausliefern kannst.

DeepSeek V4 Pro steuert eine langfristige agentische Coding-Session

Langfristiges agentisches Coding mit DeepSeek V4 Pro

DeepSeek V4 Pro ist das Flaggschiff der DeepSeek V4 API — ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern (49 Mrd. aktiv), abgestimmt auf agentisches Coding, komplexes Reasoning und STEM. DeepSeek meldet Open-Source-Spitzenwerte auf Benchmarks für agentisches Coding, und V4 ist in Agent-Harnesses wie Claude Code, OpenClaw und OpenCode integriert. Richte einen Coding-Agenten auf die DeepSeek V4 API, und er grenzt die Aufgabe ab, ruft Tools auf und durchdenkt mehrstufige Arbeit in einem einzigen Durchlauf.

API-Doku lesen

DeepSeek V4 Flash treibt Coding mit hohem Durchsatz und Batch-Jobs an

Hoher Durchsatz und niedrige Kosten mit DeepSeek V4 Flash

DeepSeek V4 Flash ist die Überholspur der DeepSeek V4 API — 284 Mrd. Parameter (13 Mrd. aktiv), deren Reasoning dem von Pro zu einem Bruchteil der Kosten sehr nahekommt. Nutze die DeepSeek V4 API für Autocomplete in der IDE, Inline-Vorschläge, Code-Review in der CI-Stufe, Bulk-Zusammenfassungen und Chat-Backends. Context-Caching senkt wiederkehrende System-Prompts und Tool-Schemas auf die niedrige Cache-Hit-Rate, sodass Agent-Loops und Traffic mit hohem Volumen günstig bleiben.

DeepSeek V4 beim Reasoning über ein Analysepaket mit einer Million Tokens

Analyse von Million-Token-Codebasen und -Dokumenten

Beide Modelle der DeepSeek V4 API arbeiten standardmäßig mit einem Kontextfenster von 1M Tokens — genug, um ein komplettes mittelgroßes Repository, ein langes Recherchepaket oder einen mehrstufigen Agent-Trace in einem einzigen Aufruf zu laden. DeepSeek Sparse Attention hält die Inferenz bei langem Kontext effizient, sodass DeepSeek-V4-API-Workloads wie Architektur-Reviews, Dependency-Audits und Migrationsplanung selten Chunking brauchen.

Preise

Credit-basiert — 1 Credit = 0,001 USD. Du zahlst nur für erfolgreich abgeschlossene Generierungen.

Kategorie	Einheit	Preis
DeepSeek V4 Flash
Input (Cache-Miss)	1M tokens	$0.14
Input (Cache-Hit)	1M tokens	$0.0028
Output	1M tokens	$0.28
DeepSeek V4 Pro
Input (Cache-Miss)	1M tokens	$1.74
Input (Cache-Hit)	1M tokens	$0.0145
Output	1M tokens	$3.48

Warum reAPI

OpenAI-kompatibler Drop-in — plus eine Anthropic-Oberfläche

Die DeepSeek V4 API spricht OpenAI Chat Completions wortgetreu. Eine bestehende OpenAI-Integration auf die DeepSeek V4 API umzustellen, bedeutet eine Base-URL, einen API-Key und eine Änderung des Model-Strings — `deepseek-v4-flash` oder `deepseek-v4-pro` — und keinen Plattform-Umbau. Dasselbe `messages`-Array, dasselbe Streaming-Format und eine native Oberfläche im Anthropic-Stil für SDK-Aufrufer, die sie bevorzugen.

Spitzen-Reasoning zu fairem Preis

Die DeepSeek V4 API ist Open-Weight und entsprechend bepreist. Pro misst sich bei Reasoning, Mathematik und Coding mit führenden Closed-Source-Modellen und kostet dabei pro Token nur einen Bruchteil davon; Flash drückt den Preis für Alltags-Traffic um eine weitere Größenordnung. Lass Premium-Arbeit auf Pro laufen und leite Aufrufe mit hohem Volumen über denselben Key an Flash.

Ein Key für DeepSeek, GPT, Claude und Gemini

Ein einziger api.reapi.ai-Key schaltet die DeepSeek V4 API zusammen mit GPT-5.5, Claude Opus 4.8, Gemini und jedem anderen Spitzen-Chatmodell der Plattform frei. Vergleiche Anbieter, ergänze Fallbacks und steuere Traffic pro Aufruf mit einer Konfigurationsänderung statt eines Integrationsprojekts.

DeepSeek V4 vs. DeepSeek V3.2

Die DeepSeek V4 API ist ein Generationssprung gegenüber V3.2 — ein größeres Kontextfenster, zwei Modell-Stufen, Thinking standardmäßig an, Vision und agentenfokussierte Abstimmung. Das hat sich zwischen beiden geändert.

Fähigkeit

DeepSeek V4 API auf reAPI

DeepSeek V3.2

Modell-Aufstellung

Zwei Varianten — Flash (284 Mrd. / 13 Mrd. aktiv) und Pro (1,6 Bio. / 49 Mrd. aktiv) — auf demselben API-Key.

Eine einzelne Chat-/Reasoner-Modellreihe.

Kontextfenster

1M Tokens standardmäßig, mit DeepSeek Sparse Attention für effizienten langen Kontext.

Kontextfenster von 128K Tokens.

Maximaler Output

Bis zu 384K Output-Tokens pro Antwort.

Deutlich kleinere Output-Obergrenze.

Thinking-Modus

Standardmäßig an, mit dualem Thinking-/Non-Thinking-Schalter und Gedankenkette in `reasoning_content`.

Reasoning über ein separates Reasoner-Modell verfügbar.

Bildeingabe

Bildeingabe unterstützt (Beta) am selben Endpoint.

Nur Text.

Agentische Abstimmung

Dedizierte Agent-Optimierungen; integriert mit führenden Coding-Agent-Harnesses; laut DeepSeek Open-Source-SOTA bei agentischem Coding.

Leistungsfähiges Allzweckmodell ohne die agentenspezifische Abstimmung von V4.

Der Vergleich spiegelt das öffentlich dokumentierte Verhalten aus DeepSeeks V4-Release-Notes und der Modelldokumentation zum Zeitpunkt der Erstellung wider. Einige Benchmark-Angaben stammen vom Anbieter. Modellverhalten und Preise können sich ändern; prüfe die Preiskarte oben und die API-Doku auf aktuelle Werte.

Die DeepSeek V4 API in drei Schritten live schalten

step 01
Konto und Key auf api.reapi.ai anlegen
Registriere dich auf api.reapi.ai, öffne die Konsole, erzeuge unter API Keys einen API-Key und lade unter Top Up Tokens auf. Der Chat-Workspace ist vom Bild-/Video-Gateway auf reapi.ai getrennt — Keys sind nicht übergreifend gültig.
Öffnen
step 02
Sende deine erste Anfrage
POST an https://api.reapi.ai/v1/chat/completions mit `model` gesetzt auf `deepseek-v4-flash` (oder `deepseek-v4-pro`), deinem `messages`-Array und `max_tokens`. Der Endpoint der DeepSeek V4 API ist OpenAI-kompatibel, inklusive gestreamter Antworten; wechsle das Modell mit einer einzeiligen Änderung.
Öffnen
step 03
Auf Kosten und Reasoning abstimmen
Greife in der DeepSeek V4 API bei latenzkritischer Arbeit mit hohem Durchsatz zu Flash und bei Aufgaben mit tiefem Reasoning zu Pro. Verwende stabile System-Prompts wieder, um die niedrige Cache-Read-Rate zu treffen, und schalte den Thinking-Modus für die schnellsten, günstigsten Antworten aus.
Öffnen

Häufig gestellte Fragen

Häufige Fragen zu diesem Modell.

Die DeepSeek V4 API wird nach Verbrauch in USD gegen dein api.reapi.ai-Token-Guthaben abgerechnet. Die Preiskarte auf dieser Seite zeigt die aktuellen Input- und Output-Raten pro 1M Tokens für Flash und Pro sowie die Cache-Hit-Rate. Cache-Hits sind dramatisch günstiger, als dieselben Tokens erneut zu senden, und fehlgeschlagene Anfragen werden nicht berechnet.

Bereit zum Start?

Probiere es im Playground aus oder hol dir einen API-Key, um direkt loszulegen.

API-Key holen API-Doku ansehen

DeepSeek V4 API — Flash & Pro, 1M Kontext

Was du mit diesem Modell bauen kannst

Echte Workflows und produktionsreife Use Cases, die du mit diesem Modell bauen und ausliefern kannst.

Langfristiges agentisches Coding mit DeepSeek V4 Pro

API-Doku lesen

Hoher Durchsatz und niedrige Kosten mit DeepSeek V4 Flash

Analyse von Million-Token-Codebasen und -Dokumenten

Preise

Credit-basiert — 1 Credit = 0,001 USD. Du zahlst nur für erfolgreich abgeschlossene Generierungen.

Kategorie	Einheit	Preis
DeepSeek V4 Flash
Input (Cache-Miss)	1M tokens	$0.14
Input (Cache-Hit)	1M tokens	$0.0028
Output	1M tokens	$0.28
DeepSeek V4 Pro
Input (Cache-Miss)	1M tokens	$1.74
Input (Cache-Hit)	1M tokens	$0.0145
Output	1M tokens	$3.48

Warum reAPI

OpenAI-kompatibler Drop-in — plus eine Anthropic-Oberfläche

Spitzen-Reasoning zu fairem Preis

Ein Key für DeepSeek, GPT, Claude und Gemini

DeepSeek V4 vs. DeepSeek V3.2

Fähigkeit

DeepSeek V4 API auf reAPI

DeepSeek V3.2

Modell-Aufstellung

Zwei Varianten — Flash (284 Mrd. / 13 Mrd. aktiv) und Pro (1,6 Bio. / 49 Mrd. aktiv) — auf demselben API-Key.

Eine einzelne Chat-/Reasoner-Modellreihe.

Kontextfenster

1M Tokens standardmäßig, mit DeepSeek Sparse Attention für effizienten langen Kontext.

Kontextfenster von 128K Tokens.

Maximaler Output

Bis zu 384K Output-Tokens pro Antwort.

Deutlich kleinere Output-Obergrenze.

Thinking-Modus

Standardmäßig an, mit dualem Thinking-/Non-Thinking-Schalter und Gedankenkette in `reasoning_content`.

Reasoning über ein separates Reasoner-Modell verfügbar.

Bildeingabe

Bildeingabe unterstützt (Beta) am selben Endpoint.

Nur Text.

Agentische Abstimmung

Dedizierte Agent-Optimierungen; integriert mit führenden Coding-Agent-Harnesses; laut DeepSeek Open-Source-SOTA bei agentischem Coding.

Leistungsfähiges Allzweckmodell ohne die agentenspezifische Abstimmung von V4.

Die DeepSeek V4 API in drei Schritten live schalten

step 01
Konto und Key auf api.reapi.ai anlegen
Registriere dich auf api.reapi.ai, öffne die Konsole, erzeuge unter API Keys einen API-Key und lade unter Top Up Tokens auf. Der Chat-Workspace ist vom Bild-/Video-Gateway auf reapi.ai getrennt — Keys sind nicht übergreifend gültig.
Öffnen
step 02
Sende deine erste Anfrage
POST an https://api.reapi.ai/v1/chat/completions mit `model` gesetzt auf `deepseek-v4-flash` (oder `deepseek-v4-pro`), deinem `messages`-Array und `max_tokens`. Der Endpoint der DeepSeek V4 API ist OpenAI-kompatibel, inklusive gestreamter Antworten; wechsle das Modell mit einer einzeiligen Änderung.
Öffnen
step 03
Auf Kosten und Reasoning abstimmen
Greife in der DeepSeek V4 API bei latenzkritischer Arbeit mit hohem Durchsatz zu Flash und bei Aufgaben mit tiefem Reasoning zu Pro. Verwende stabile System-Prompts wieder, um die niedrige Cache-Read-Rate zu treffen, und schalte den Thinking-Modus für die schnellsten, günstigsten Antworten aus.
Öffnen

DeepSeek V4 API — Flash & Pro, 1M Kontext

DeepSeek V4 playground

Was du mit diesem Modell bauen kannst

Langfristiges agentisches Coding mit DeepSeek V4 Pro

Hoher Durchsatz und niedrige Kosten mit DeepSeek V4 Flash

Analyse von Million-Token-Codebasen und -Dokumenten

Preise

Warum reAPI

OpenAI-kompatibler Drop-in — plus eine Anthropic-Oberfläche

Spitzen-Reasoning zu fairem Preis

Ein Key für DeepSeek, GPT, Claude und Gemini

DeepSeek V4 vs. DeepSeek V3.2

Die DeepSeek V4 API in drei Schritten live schalten

Konto und Key auf api.reapi.ai anlegen

Sende deine erste Anfrage

Auf Kosten und Reasoning abstimmen

Häufig gestellte Fragen

Wie viel kostet die DeepSeek V4 API?

Was ist der Unterschied zwischen DeepSeek V4 Flash und Pro?

Ist die DeepSeek V4 API OpenAI-kompatibel?

Wie groß ist das Kontextfenster von DeepSeek V4?

Wie funktioniert der Thinking-Modus, und kann ich ihn abschalten?

Unterstützt die DeepSeek V4 API Vision und Tool-Nutzung?

Wie unterscheidet sich DeepSeek V4 von DeepSeek V3.2?

Wo erstelle ich einen API-Key und kaufe Tokens?

Verwandte Modelle

MiniMax M3

GPT-5.4

Claude Opus 4.7

Claude Sonnet 4.6

Bereit zum Start?

DeepSeek V4 API — Flash & Pro, 1M Kontext

DeepSeek V4 playground

Was du mit diesem Modell bauen kannst

Langfristiges agentisches Coding mit DeepSeek V4 Pro

Hoher Durchsatz und niedrige Kosten mit DeepSeek V4 Flash

Analyse von Million-Token-Codebasen und -Dokumenten

Preise

Warum reAPI

OpenAI-kompatibler Drop-in — plus eine Anthropic-Oberfläche

Spitzen-Reasoning zu fairem Preis

Ein Key für DeepSeek, GPT, Claude und Gemini

DeepSeek V4 vs. DeepSeek V3.2

Die DeepSeek V4 API in drei Schritten live schalten

Konto und Key auf api.reapi.ai anlegen

Sende deine erste Anfrage

Auf Kosten und Reasoning abstimmen

Häufig gestellte Fragen

Wie viel kostet die DeepSeek V4 API?

Was ist der Unterschied zwischen DeepSeek V4 Flash und Pro?

Ist die DeepSeek V4 API OpenAI-kompatibel?

Wie groß ist das Kontextfenster von DeepSeek V4?

Wie funktioniert der Thinking-Modus, und kann ich ihn abschalten?

Unterstützt die DeepSeek V4 API Vision und Tool-Nutzung?

Wie unterscheidet sich DeepSeek V4 von DeepSeek V3.2?

Wo erstelle ich einen API-Key und kaufe Tokens?

Verwandte Modelle

MiniMax M3

GPT-5.4

Claude Opus 4.7

Claude Sonnet 4.6

Bereit zum Start?