ChatOpenAI
GPT-5.4
OpenAIs GPT-5.4 mit 1M Kontext und 128K maximaler Ausgabe — die kostengünstige GPT-Route.
Die DeepSeek V4 API liefert zwei Open-Weight-Modelle über einen OpenAI-kompatiblen Endpoint — Flash für schnelle, günstige Alltagsaufgaben und Pro für Spitzen-Reasoning, agentisches Coding und STEM. Beide bieten ein Kontextfenster von 1M Tokens, bis zu 384K Output, standardmäßig aktivierten Thinking-Modus, Bildeingabe, Tool-Nutzung und Context-Caching. Abrechnung nach Verbrauch in USD.
Echte Workflows, die mit diesem Modell laufen.

DeepSeek V4 Pro ist das Flaggschiff der DeepSeek V4 API — ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern (49 Mrd. aktiv), abgestimmt auf agentisches Coding, komplexes Reasoning und STEM. DeepSeek meldet Open-Source-Spitzenwerte auf Benchmarks für agentisches Coding, und V4 ist in Agent-Harnesses wie Claude Code, OpenClaw und OpenCode integriert. Richte einen Coding-Agenten auf die DeepSeek V4 API, und er grenzt die Aufgabe ab, ruft Tools auf und durchdenkt mehrstufige Arbeit in einem einzigen Durchlauf.
API-Doku lesen
DeepSeek V4 Flash ist die Überholspur der DeepSeek V4 API — 284 Mrd. Parameter (13 Mrd. aktiv), deren Reasoning dem von Pro zu einem Bruchteil der Kosten sehr nahekommt. Nutze die DeepSeek V4 API für Autocomplete in der IDE, Inline-Vorschläge, Code-Review in der CI-Stufe, Bulk-Zusammenfassungen und Chat-Backends. Context-Caching senkt wiederkehrende System-Prompts und Tool-Schemas auf die niedrige Cache-Hit-Rate, sodass Agent-Loops und Traffic mit hohem Volumen günstig bleiben.

Beide Modelle der DeepSeek V4 API arbeiten standardmäßig mit einem Kontextfenster von 1M Tokens — genug, um ein komplettes mittelgroßes Repository, ein langes Recherchepaket oder einen mehrstufigen Agent-Trace in einem einzigen Aufruf zu laden. DeepSeek Sparse Attention hält die Inferenz bei langem Kontext effizient, sodass DeepSeek-V4-API-Workloads wie Architektur-Reviews, Dependency-Audits und Migrationsplanung selten Chunking brauchen.
Credit-basiert — 1 Credit = 0,001 USD. Du zahlst nur für erfolgreich abgeschlossene Generierungen.
| Kategorie | Einheit | Preis |
|---|---|---|
| DeepSeek V4 Flash | ||
| Input (Cache-Miss) | 1M tokens | $0.14 |
| Input (Cache-Hit) | 1M tokens | $0.0028 |
| Output | 1M tokens | $0.28 |
| DeepSeek V4 Pro | ||
| Input (Cache-Miss) | 1M tokens | $1.74 |
| Input (Cache-Hit) | 1M tokens | $0.0145 |
| Output | 1M tokens | $3.48 |
Die DeepSeek V4 API spricht OpenAI Chat Completions wortgetreu. Eine bestehende OpenAI-Integration auf die DeepSeek V4 API umzustellen, bedeutet eine Base-URL, einen API-Key und eine Änderung des Model-Strings — `deepseek-v4-flash` oder `deepseek-v4-pro` — und keinen Plattform-Umbau. Dasselbe `messages`-Array, dasselbe Streaming-Format und eine native Oberfläche im Anthropic-Stil für SDK-Aufrufer, die sie bevorzugen.
Die DeepSeek V4 API ist Open-Weight und entsprechend bepreist. Pro misst sich bei Reasoning, Mathematik und Coding mit führenden Closed-Source-Modellen und kostet dabei pro Token nur einen Bruchteil davon; Flash drückt den Preis für Alltags-Traffic um eine weitere Größenordnung. Lass Premium-Arbeit auf Pro laufen und leite Aufrufe mit hohem Volumen über denselben Key an Flash.
Ein einziger api.reapi.ai-Key schaltet die DeepSeek V4 API zusammen mit GPT-5.5, Claude Opus 4.8, Gemini und jedem anderen Spitzen-Chatmodell der Plattform frei. Vergleiche Anbieter, ergänze Fallbacks und steuere Traffic pro Aufruf mit einer Konfigurationsänderung statt eines Integrationsprojekts.
Die DeepSeek V4 API ist ein Generationssprung gegenüber V3.2 — ein größeres Kontextfenster, zwei Modell-Stufen, Thinking standardmäßig an, Vision und agentenfokussierte Abstimmung. Das hat sich zwischen beiden geändert.
Der Vergleich spiegelt das öffentlich dokumentierte Verhalten aus DeepSeeks V4-Release-Notes und der Modelldokumentation zum Zeitpunkt der Erstellung wider. Einige Benchmark-Angaben stammen vom Anbieter. Modellverhalten und Preise können sich ändern; prüfe die Preiskarte oben und die API-Doku auf aktuelle Werte.
Registriere dich auf api.reapi.ai, öffne die Konsole, erzeuge unter API Keys einen API-Key und lade unter Top Up Tokens auf. Der Chat-Workspace ist vom Bild-/Video-Gateway auf reapi.ai getrennt — Keys sind nicht übergreifend gültig.
ÖffnenPOST an https://api.reapi.ai/v1/chat/completions mit `model` gesetzt auf `deepseek-v4-flash` (oder `deepseek-v4-pro`), deinem `messages`-Array und `max_tokens`. Der Endpoint der DeepSeek V4 API ist OpenAI-kompatibel, inklusive gestreamter Antworten; wechsle das Modell mit einer einzeiligen Änderung.
ÖffnenGreife in der DeepSeek V4 API bei latenzkritischer Arbeit mit hohem Durchsatz zu Flash und bei Aufgaben mit tiefem Reasoning zu Pro. Verwende stabile System-Prompts wieder, um die niedrige Cache-Read-Rate zu treffen, und schalte den Thinking-Modus für die schnellsten, günstigsten Antworten aus.
ÖffnenHäufige Fragen zu diesem Modell.
Entdecke weitere Modelle derselben Kategorie.
ChatOpenAI
OpenAIs GPT-5.4 mit 1M Kontext und 128K maximaler Ausgabe — die kostengünstige GPT-Route.
ChatAnthropic
Anthropics Claude Opus 4.7 — 1M Kontext, 128K Output, Premium-Coding und Agent-Reasoning.
ChatAnthropic
Anthropics Claude Sonnet 4.6 — ausgewogene Qualität und Geschwindigkeit für tägliche Produktions-Chats, Code Review und mittelkomplexe Agenten.
ChatOpenAI
OpenAIs GPT-5.5 mit 1M Kontext und 128K Ausgabe-Token, hinter einem OpenAI-kompatiblen reAPI-Key.
Sofort einsetzbarer Code und die vollständige Parametertabelle.
curl https://api.reapi.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v4-flash",
"group": "default",
"messages": [
{ "role": "user", "content": "Hello" }
],
"stream": true,
"max_tokens": 4096,
"temperature": 0.7
}'Probiere es im Playground aus oder hol dir einen API-Key, um direkt loszulegen.