rreAPI
  • Modèles
  • Chat
  • Blog
  • Docs
  • Changelog
Home/Models/DeepSeek V4new

API DeepSeek V4 — Flash & Pro, contexte de 1 M

L'API DeepSeek V4 propose deux modèles à poids ouverts sur un seul endpoint compatible OpenAI — Flash pour le travail quotidien rapide et économique, Pro pour le raisonnement de pointe, le codage agentique et les sciences. Tous deux offrent une fenêtre de contexte de 1 M de tokens, jusqu'à 384 K de sortie, le mode réflexion activé par défaut, l'entrée visuelle, l'usage d'outils et la mise en cache du contexte. Paiement à l'usage en USD.

Prix
est$0.14– $3.48par 1 M de tokens
Obtenir une clé APIVoir la doc API

Ce que tu peux construire

Des workflows réels propulsés par ce modèle.

DeepSeek V4 Pro pilotant une session de codage agentique au long cours

Codage agentique au long cours avec DeepSeek V4 Pro

DeepSeek V4 Pro est le modèle phare de l'API DeepSeek V4 — un modèle mixture-of-experts de 1,6 T de paramètres (49 Md actifs) optimisé pour le codage agentique, le raisonnement complexe et les sciences. DeepSeek annonce des résultats open source à l'état de l'art sur les benchmarks de codage agentique, et V4 s'intègre à des harnais d'agents comme Claude Code, OpenClaw et OpenCode. Branchez un agent de codage sur l'API DeepSeek V4 : il cadre la tâche, appelle les outils et raisonne sur un travail en plusieurs étapes en une seule exécution.

Lire la doc API
DeepSeek V4 Flash alimentant du codage à haut débit et des tâches par lots

Travail à haut débit et faible coût avec DeepSeek V4 Flash

DeepSeek V4 Flash est la voie rapide de l'API DeepSeek V4 — 284 Md de paramètres (13 Md actifs) dont le raisonnement frôle celui de Pro pour une fraction du coût. Utilisez l'API DeepSeek V4 pour l'autocomplétion dans l'IDE, les suggestions en ligne, la revue de code en phase CI, le résumé en masse et les backends de chat. La mise en cache du contexte ramène les prompts système et schémas d'outils répétés au faible tarif des cache hits, gardant les boucles d'agents et le trafic à fort volume bon marché.

DeepSeek V4 raisonnant sur un dossier d'analyse d'un million de tokens

Analyse de bases de code et de documents d'un million de tokens

Les deux modèles de l'API DeepSeek V4 utilisent par défaut une fenêtre de contexte de 1 M de tokens — assez pour charger un dépôt de taille moyenne complet, un long dossier de recherche ou une trace d'agent multi-tour en un seul appel. DeepSeek Sparse Attention maintient l'inférence à long contexte efficace, si bien que les charges de l'API DeepSeek V4 comme la revue d'architecture, l'audit de dépendances et la planification de migration n'ont presque jamais besoin de découpage.

Tarifs

Basé sur les crédits — 1 crédit = 0,001 USD. Tu ne paies que les générations réussies.

CatégorieUnitéPrix
DeepSeek V4 Flash
Entrée (cache miss)1M tokens
$0.14
Entrée (cache hit)1M tokens
$0.0028
Sortie1M tokens
$0.28
DeepSeek V4 Pro
Entrée (cache miss)1M tokens
$1.74
Entrée (cache hit)1M tokens
$0.0145
Sortie1M tokens
$3.48

Pourquoi reAPI

Compatible OpenAI clé en main — plus une surface Anthropic

L'API DeepSeek V4 parle OpenAI Chat Completions mot pour mot. Migrer une intégration OpenAI existante vers l'API DeepSeek V4 se résume à une URL de base, une clé API et un changement de chaîne de modèle — `deepseek-v4-flash` ou `deepseek-v4-pro` — sans réécriture de plateforme. Le même tableau `messages`, le même format de streaming, et une surface native de style Anthropic pour les appelants SDK qui la préfèrent.

Raisonnement de pointe à prix avantageux

L'API DeepSeek V4 est à poids ouverts et tarifée en conséquence. Pro rivalise avec les meilleurs modèles propriétaires en raisonnement, mathématiques et codage tout en coûtant une fraction de leur prix au token ; Flash réduit encore le prix d'un ordre de grandeur pour le trafic courant. Faites tourner le travail premium sur Pro et routez les appels à fort volume vers Flash avec la même clé.

Une seule clé pour DeepSeek, GPT, Claude et Gemini

Une seule clé api.reapi.ai débloque l'API DeepSeek V4 aux côtés de GPT-5.5, Claude Opus 4.8, Gemini et tous les autres modèles de chat de pointe de la plateforme. Comparez les fournisseurs, ajoutez des solutions de repli et routez le trafic appel par appel avec un changement de configuration au lieu d'un projet d'intégration.

DeepSeek V4 vs DeepSeek V3.2

L'API DeepSeek V4 marque un saut générationnel par rapport à V3.2 — fenêtre de contexte plus grande, deux paliers de modèles, réflexion activée par défaut, vision et optimisation pour les agents. Voici ce qui a changé entre les deux.

Capacité
API DeepSeek V4 sur reAPI
DeepSeek V3.2
Gamme de modèles
Deux variantes — Flash (284 Md / 13 Md actifs) et Pro (1,6 T / 49 Md actifs) — sur la même clé API.
Une seule lignée de modèle chat / reasoner.
Fenêtre de contexte
1 M de tokens par défaut, avec DeepSeek Sparse Attention pour un long contexte efficace.
Fenêtre de contexte de 128 K tokens.
Sortie max
Jusqu'à 384 K de tokens de sortie par réponse.
Plafond de sortie nettement plus bas.
Mode réflexion
Activé par défaut, avec un commutateur réflexion / sans réflexion et la chaîne de raisonnement dans `reasoning_content`.
Raisonnement disponible via un modèle reasoner distinct.
Entrée visuelle
Entrée image prise en charge (bêta) sur le même endpoint.
Texte uniquement.
Optimisation agentique
Optimisations dédiées aux agents ; intégration aux principaux harnais d'agents de codage ; état de l'art open source sur le codage agentique selon DeepSeek.
Modèle généraliste performant, sans l'optimisation spécifique aux agents de V4.

La comparaison reflète le comportement publiquement documenté dans les notes de version V4 de DeepSeek et la documentation des modèles au moment de la rédaction. Certaines affirmations de benchmark proviennent du fournisseur. Le comportement des modèles et les tarifs peuvent changer ; consultez la grille tarifaire ci-dessus et la doc API pour les valeurs actuelles.

Déployez l'API DeepSeek V4 en trois étapes

  1. 01
    step 01

    Créez un compte et une clé sur api.reapi.ai

    Inscrivez-vous sur api.reapi.ai, ouvrez la console, générez une clé API sous API Keys et créditez des tokens sous Top Up. L'espace de travail chat est distinct de la passerelle image/vidéo de reapi.ai — les clés ne sont pas interchangeables.

    Ouvrir
  2. 02
    step 02

    Envoyez votre première requête

    POST https://api.reapi.ai/v1/chat/completions avec `model` réglé sur `deepseek-v4-flash` (ou `deepseek-v4-pro`), votre tableau `messages` et `max_tokens`. L'endpoint de l'API DeepSeek V4 est compatible OpenAI, réponses en flux comprises ; changez de modèle en modifiant une seule ligne.

    Ouvrir
  3. 03
    step 03

    Réglez selon le coût et le raisonnement

    Sur l'API DeepSeek V4, optez pour Flash sur le travail sensible à la latence et à haut débit, et pour Pro lorsqu'une tâche exige un raisonnement profond. Réutilisez des prompts système stables pour atteindre le faible tarif de lecture en cache, et désactivez le mode réflexion pour les réponses les plus rapides et les moins chères.

    Ouvrir

Questions fréquentes

Questions courantes sur ce modèle.

L'API DeepSeek V4 est facturée à l'usage en USD sur votre solde de tokens api.reapi.ai. La grille tarifaire de cette page affiche les tarifs en direct par 1 M de tokens en entrée et en sortie pour Flash comme pour Pro, ainsi que le tarif des cache hits. Les cache hits sont nettement moins chers que de renvoyer les mêmes tokens, et les requêtes échouées ne sont pas facturées.

Modèles associés

Explorez d’autres modèles de la même catégorie.

Voir tous les modèles
GPT-5.4 coverChat

OpenAI

GPT-5.4

Le GPT-5.4 d'OpenAI avec 1M de contexte et 128K en sortie max — la route GPT économique.

À partir de $1.00 par 1M de tokens
Claude Opus 4.7 coverChat

Anthropic

Claude Opus 4.7

Claude Opus 4.7 d'Anthropic — contexte 1M, sortie 128K, codage premium et raisonnement d'agent.

À partir de $2.00 par 1M de tokens
Claude Sonnet 4.6 coverChat

Anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 d'Anthropic — qualité et vitesse équilibrées pour le chat de production au quotidien, la revue de code et les agents de complexité moyenne.

À partir de $2.00 par 1M de tokens
GPT-5.5 coverChat

OpenAI

GPT-5.5

GPT-5.5 d'OpenAI avec 1M de contexte et 128K en sortie max, derrière une seule clé reAPI compatible OpenAI.

À partir de $2.00 par 1M de tokens
Voir tous les modèles
docs/api/deepseek-v4

Référence API

Code prêt à l'emploi et tableau complet des paramètres.

Voir la référence complète
curl https://api.reapi.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-flash",
    "group": "default",
    "messages": [
      { "role": "user", "content": "Hello" }
    ],
    "stream": true,
    "max_tokens": 4096,
    "temperature": 0.7
  }'
start building

Prêt à déployer ?

Essaie-le dans le playground ou récupère une clé API pour intégrer dès maintenant.

Obtenir une clé APIVoir la doc API
rreAPI

reAPI est l'agrégateur d'API IA avec basculement en moins d'une seconde, zéro journalisation des requêtes et un endpoint compatible OpenAI pour chaque grand modèle.

GitHubX (Twitter)
Built withLogo of reAPIreAPI
Featured on There's An AI For ThatFeatured on Findly.toolsFazier badgeDang.ai
ai tools code.market
Featured on Twelve Tools
Image
  • GPT Image 2
  • Gemini 3 Pro Image
  • Gemini 3.1 Flash Image
  • Gemini 2.5 Flash Image
  • Seedream 5.0 Lite
  • Imagen 4.0
  • Wan 2.7 Image
Vidéo
  • Seedance 2.0
  • Happy Horse 1.0
  • Vidu Q3
  • Pixverse v6
  • Grok Imagine 1.0
  • VEO 3.1
  • Gemini Omni
  • Wan 2.7 Video
  • Kling Motion Control
LLM
  • Claude Opus 4.8
  • Claude Opus 4.7
  • Claude Sonnet 4.6
  • DeepSeek V4
  • GPT-5.4
  • GPT-5.5
Audio
  • Mureka V9
  • Vocal Remover
  • Music Extractor
  • Voice Cleaner
  • Multistem Splitter
  • Voice Changer
Texte
  • AI Humanizer
  • AI Text Detector
Outils
  • Enhance Video 1.0
·······
© 2026 reAPI. All Rights Reserved.[email protected]
À proposContactChangelogPolitique des cookiesPolitique de confidentialitéConditions d'utilisation