rreAPI
  • Modelle
  • Chat
  • Blog
  • Docs
  • Changelog
Home/Models/DeepSeek V4new

DeepSeek V4 API — Flash & Pro, 1M Kontext

Die DeepSeek V4 API liefert zwei Open-Weight-Modelle über einen OpenAI-kompatiblen Endpoint — Flash für schnelle, günstige Alltagsaufgaben und Pro für Spitzen-Reasoning, agentisches Coding und STEM. Beide bieten ein Kontextfenster von 1M Tokens, bis zu 384K Output, standardmäßig aktivierten Thinking-Modus, Bildeingabe, Tool-Nutzung und Context-Caching. Abrechnung nach Verbrauch in USD.

Preis
est$0.14– $3.48pro 1M Tokens
API-Key holenAPI-Doku ansehen

Was du damit bauen kannst

Echte Workflows, die mit diesem Modell laufen.

DeepSeek V4 Pro steuert eine langfristige agentische Coding-Session

Langfristiges agentisches Coding mit DeepSeek V4 Pro

DeepSeek V4 Pro ist das Flaggschiff der DeepSeek V4 API — ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern (49 Mrd. aktiv), abgestimmt auf agentisches Coding, komplexes Reasoning und STEM. DeepSeek meldet Open-Source-Spitzenwerte auf Benchmarks für agentisches Coding, und V4 ist in Agent-Harnesses wie Claude Code, OpenClaw und OpenCode integriert. Richte einen Coding-Agenten auf die DeepSeek V4 API, und er grenzt die Aufgabe ab, ruft Tools auf und durchdenkt mehrstufige Arbeit in einem einzigen Durchlauf.

API-Doku lesen
DeepSeek V4 Flash treibt Coding mit hohem Durchsatz und Batch-Jobs an

Hoher Durchsatz und niedrige Kosten mit DeepSeek V4 Flash

DeepSeek V4 Flash ist die Überholspur der DeepSeek V4 API — 284 Mrd. Parameter (13 Mrd. aktiv), deren Reasoning dem von Pro zu einem Bruchteil der Kosten sehr nahekommt. Nutze die DeepSeek V4 API für Autocomplete in der IDE, Inline-Vorschläge, Code-Review in der CI-Stufe, Bulk-Zusammenfassungen und Chat-Backends. Context-Caching senkt wiederkehrende System-Prompts und Tool-Schemas auf die niedrige Cache-Hit-Rate, sodass Agent-Loops und Traffic mit hohem Volumen günstig bleiben.

DeepSeek V4 beim Reasoning über ein Analysepaket mit einer Million Tokens

Analyse von Million-Token-Codebasen und -Dokumenten

Beide Modelle der DeepSeek V4 API arbeiten standardmäßig mit einem Kontextfenster von 1M Tokens — genug, um ein komplettes mittelgroßes Repository, ein langes Recherchepaket oder einen mehrstufigen Agent-Trace in einem einzigen Aufruf zu laden. DeepSeek Sparse Attention hält die Inferenz bei langem Kontext effizient, sodass DeepSeek-V4-API-Workloads wie Architektur-Reviews, Dependency-Audits und Migrationsplanung selten Chunking brauchen.

Preise

Credit-basiert — 1 Credit = 0,001 USD. Du zahlst nur für erfolgreich abgeschlossene Generierungen.

KategorieEinheitPreis
DeepSeek V4 Flash
Input (Cache-Miss)1M tokens
$0.14
Input (Cache-Hit)1M tokens
$0.0028
Output1M tokens
$0.28
DeepSeek V4 Pro
Input (Cache-Miss)1M tokens
$1.74
Input (Cache-Hit)1M tokens
$0.0145
Output1M tokens
$3.48

Warum reAPI

OpenAI-kompatibler Drop-in — plus eine Anthropic-Oberfläche

Die DeepSeek V4 API spricht OpenAI Chat Completions wortgetreu. Eine bestehende OpenAI-Integration auf die DeepSeek V4 API umzustellen, bedeutet eine Base-URL, einen API-Key und eine Änderung des Model-Strings — `deepseek-v4-flash` oder `deepseek-v4-pro` — und keinen Plattform-Umbau. Dasselbe `messages`-Array, dasselbe Streaming-Format und eine native Oberfläche im Anthropic-Stil für SDK-Aufrufer, die sie bevorzugen.

Spitzen-Reasoning zu fairem Preis

Die DeepSeek V4 API ist Open-Weight und entsprechend bepreist. Pro misst sich bei Reasoning, Mathematik und Coding mit führenden Closed-Source-Modellen und kostet dabei pro Token nur einen Bruchteil davon; Flash drückt den Preis für Alltags-Traffic um eine weitere Größenordnung. Lass Premium-Arbeit auf Pro laufen und leite Aufrufe mit hohem Volumen über denselben Key an Flash.

Ein Key für DeepSeek, GPT, Claude und Gemini

Ein einziger api.reapi.ai-Key schaltet die DeepSeek V4 API zusammen mit GPT-5.5, Claude Opus 4.8, Gemini und jedem anderen Spitzen-Chatmodell der Plattform frei. Vergleiche Anbieter, ergänze Fallbacks und steuere Traffic pro Aufruf mit einer Konfigurationsänderung statt eines Integrationsprojekts.

DeepSeek V4 vs. DeepSeek V3.2

Die DeepSeek V4 API ist ein Generationssprung gegenüber V3.2 — ein größeres Kontextfenster, zwei Modell-Stufen, Thinking standardmäßig an, Vision und agentenfokussierte Abstimmung. Das hat sich zwischen beiden geändert.

Fähigkeit
DeepSeek V4 API auf reAPI
DeepSeek V3.2
Modell-Aufstellung
Zwei Varianten — Flash (284 Mrd. / 13 Mrd. aktiv) und Pro (1,6 Bio. / 49 Mrd. aktiv) — auf demselben API-Key.
Eine einzelne Chat-/Reasoner-Modellreihe.
Kontextfenster
1M Tokens standardmäßig, mit DeepSeek Sparse Attention für effizienten langen Kontext.
Kontextfenster von 128K Tokens.
Maximaler Output
Bis zu 384K Output-Tokens pro Antwort.
Deutlich kleinere Output-Obergrenze.
Thinking-Modus
Standardmäßig an, mit dualem Thinking-/Non-Thinking-Schalter und Gedankenkette in `reasoning_content`.
Reasoning über ein separates Reasoner-Modell verfügbar.
Bildeingabe
Bildeingabe unterstützt (Beta) am selben Endpoint.
Nur Text.
Agentische Abstimmung
Dedizierte Agent-Optimierungen; integriert mit führenden Coding-Agent-Harnesses; laut DeepSeek Open-Source-SOTA bei agentischem Coding.
Leistungsfähiges Allzweckmodell ohne die agentenspezifische Abstimmung von V4.

Der Vergleich spiegelt das öffentlich dokumentierte Verhalten aus DeepSeeks V4-Release-Notes und der Modelldokumentation zum Zeitpunkt der Erstellung wider. Einige Benchmark-Angaben stammen vom Anbieter. Modellverhalten und Preise können sich ändern; prüfe die Preiskarte oben und die API-Doku auf aktuelle Werte.

Die DeepSeek V4 API in drei Schritten live schalten

  1. 01
    step 01

    Konto und Key auf api.reapi.ai anlegen

    Registriere dich auf api.reapi.ai, öffne die Konsole, erzeuge unter API Keys einen API-Key und lade unter Top Up Tokens auf. Der Chat-Workspace ist vom Bild-/Video-Gateway auf reapi.ai getrennt — Keys sind nicht übergreifend gültig.

    Öffnen
  2. 02
    step 02

    Sende deine erste Anfrage

    POST an https://api.reapi.ai/v1/chat/completions mit `model` gesetzt auf `deepseek-v4-flash` (oder `deepseek-v4-pro`), deinem `messages`-Array und `max_tokens`. Der Endpoint der DeepSeek V4 API ist OpenAI-kompatibel, inklusive gestreamter Antworten; wechsle das Modell mit einer einzeiligen Änderung.

    Öffnen
  3. 03
    step 03

    Auf Kosten und Reasoning abstimmen

    Greife in der DeepSeek V4 API bei latenzkritischer Arbeit mit hohem Durchsatz zu Flash und bei Aufgaben mit tiefem Reasoning zu Pro. Verwende stabile System-Prompts wieder, um die niedrige Cache-Read-Rate zu treffen, und schalte den Thinking-Modus für die schnellsten, günstigsten Antworten aus.

    Öffnen

Häufig gestellte Fragen

Häufige Fragen zu diesem Modell.

Die DeepSeek V4 API wird nach Verbrauch in USD gegen dein api.reapi.ai-Token-Guthaben abgerechnet. Die Preiskarte auf dieser Seite zeigt die aktuellen Input- und Output-Raten pro 1M Tokens für Flash und Pro sowie die Cache-Hit-Rate. Cache-Hits sind dramatisch günstiger, als dieselben Tokens erneut zu senden, und fehlgeschlagene Anfragen werden nicht berechnet.

Verwandte Modelle

Entdecke weitere Modelle derselben Kategorie.

Alle Modelle ansehen
GPT-5.4 coverChat

OpenAI

GPT-5.4

OpenAIs GPT-5.4 mit 1M Kontext und 128K maximaler Ausgabe — die kostengünstige GPT-Route.

Ab $1.00 pro 1M Token
Claude Opus 4.7 coverChat

Anthropic

Claude Opus 4.7

Anthropics Claude Opus 4.7 — 1M Kontext, 128K Output, Premium-Coding und Agent-Reasoning.

Ab $2.00 pro 1M Tokens
Claude Sonnet 4.6 coverChat

Anthropic

Claude Sonnet 4.6

Anthropics Claude Sonnet 4.6 — ausgewogene Qualität und Geschwindigkeit für tägliche Produktions-Chats, Code Review und mittelkomplexe Agenten.

Ab $2.00 pro 1M Tokens
GPT-5.5 coverChat

OpenAI

GPT-5.5

OpenAIs GPT-5.5 mit 1M Kontext und 128K Ausgabe-Token, hinter einem OpenAI-kompatiblen reAPI-Key.

Ab $2.00 pro 1M Token
Alle Modelle ansehen
docs/api/deepseek-v4

API-Referenz

Sofort einsetzbarer Code und die vollständige Parametertabelle.

Vollständige Referenz ansehen
curl https://api.reapi.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-flash",
    "group": "default",
    "messages": [
      { "role": "user", "content": "Hello" }
    ],
    "stream": true,
    "max_tokens": 4096,
    "temperature": 0.7
  }'
start building

Bereit zum Start?

Probiere es im Playground aus oder hol dir einen API-Key, um direkt loszulegen.

API-Key holenAPI-Doku ansehen
rreAPI

reAPI ist der KI-API-Aggregator mit Failover im Sub-Sekunden-Bereich, ohne Request-Logging und mit einem OpenAI-kompatiblen Endpunkt für jedes Top-Modell.

GitHubX (Twitter)
Built withLogo of reAPIreAPI
Featured on There's An AI For ThatFeatured on Findly.toolsFazier badgeDang.ai
ai tools code.market
Featured on Twelve Tools
Bild
  • GPT Image 2
  • Gemini 3 Pro Image
  • Gemini 3.1 Flash Image
  • Gemini 2.5 Flash Image
  • Seedream 5.0 Lite
  • Imagen 4.0
  • Wan 2.7 Image
Video
  • Seedance 2.0
  • Happy Horse 1.0
  • Vidu Q3
  • Pixverse v6
  • Grok Imagine 1.0
  • VEO 3.1
  • Gemini Omni
  • Wan 2.7 Video
  • Kling Motion Control
LLM
  • Claude Opus 4.8
  • Claude Opus 4.7
  • Claude Sonnet 4.6
  • DeepSeek V4
  • GPT-5.4
  • GPT-5.5
Audio
  • Mureka V9
  • Vocal Remover
  • Music Extractor
  • Voice Cleaner
  • Multistem Splitter
  • Voice Changer
Text
  • AI Humanizer
  • AI Text Detector
Werkzeuge
  • Enhance Video 1.0
·······
© 2026 reAPI. All Rights Reserved.[email protected]
Über unsKontaktChangelogCookie-RichtlinieDatenschutzerklärungNutzungsbedingungen