Quelle est la différence entre DeepSeek V4 Flash et Pro ?

Tous deux font partie de l'API DeepSeek V4 et partagent une fenêtre de contexte de 1 M, une sortie max de 384 K, le mode réflexion et l'usage d'outils. Flash (284 Md / 13 Md actifs) est l'option rapide et économique par défaut pour l'autocomplétion, l'analyse par lots et les backends de chat ; Pro (1,6 T / 49 Md actifs) est le modèle phare pour le raisonnement profond, le débogage complexe et le codage agentique. Ils partagent une seule clé d'API DeepSeek V4 — mélangez-les selon la requête.

L'API DeepSeek V4 est-elle compatible OpenAI ?

Oui. L'API DeepSeek V4 remplace clé en main le /v1/chat/completions d'OpenAI — même forme de requête, même tableau `messages`, mêmes paramètres `stream` / `temperature` / `max_tokens`, même format de fil SSE. La plupart des équipes migrent en changeant l'URL de base pour https://api.reapi.ai/v1, en remplaçant la clé API et en réglant `model` sur `deepseek-v4-flash` ou `deepseek-v4-pro`.

Quelle est la fenêtre de contexte de DeepSeek V4 ?

Les deux modèles de l'API DeepSeek V4 utilisent par défaut une fenêtre de contexte de 1 M de tokens et prennent en charge jusqu'à 384 K de tokens de sortie par réponse. DeepSeek Sparse Attention maintient l'inférence à long contexte efficace, ce qui vous permet d'alimenter des dépôts entiers et de longs documents sans découpage.

Comment fonctionne le mode réflexion, et puis-je le désactiver ?

DeepSeek V4 tourne en mode réflexion par défaut : il produit une chaîne de raisonnement avant la réponse finale et la renvoie dans un champ `reasoning_content` aux côtés de `content`. Pour les appels sensibles à la latence ou simples, vous pouvez basculer en mode sans réflexion pour des réponses plus rapides et moins chères — l'id du modèle reste le même.

L'API DeepSeek V4 prend-elle en charge l'entrée visuelle et l'usage d'outils ?

Oui. L'API DeepSeek V4 accepte les entrées image (bêta) aux côtés du texte dans le même appel, et prend en charge l'appel de fonctions / usage d'outils ainsi que la sortie JSON. Elle est optimisée pour les workflows agentiques en plusieurs étapes et s'intègre aux principaux harnais d'agents de codage.

En quoi DeepSeek V4 diffère-t-il de DeepSeek V3.2 ?

L'API DeepSeek V4 porte la fenêtre de contexte par défaut à 1 M de tokens (contre 128 K), se décline en deux variantes (Flash et Pro) au lieu d'une, active la réflexion par défaut avec un double mode réflexion / sans réflexion, ajoute l'entrée visuelle et embarque des optimisations agentiques dédiées. Pro rivalise avec les meilleurs modèles propriétaires en raisonnement et en codage tout en restant à poids ouverts.

Où créer une clé API et acheter des tokens ?

Les deux se font sur api.reapi.ai — l'espace de travail chat fonctionne comme sa propre plateforme, distincte de la passerelle de tâches image / vidéo sur reapi.ai. Inscrivez-vous sur api.reapi.ai, générez une clé sous API Keys et créditez sous Top Up. Une clé reapi.ai/settings/apikeys ne s'authentifiera pas sur l'endpoint chat.

API DeepSeek V4 — Flash & Pro, contexte de 1 M

L'API DeepSeek V4 propose deux modèles à poids ouverts sur un seul endpoint compatible OpenAI — Flash pour le travail quotidien rapide et économique, Pro pour le raisonnement de pointe, le codage agentique et les sciences. Tous deux offrent une fenêtre de contexte de 1 M de tokens, jusqu'à 384 K de sortie, le mode réflexion activé par défaut, l'entrée visuelle, l'usage d'outils et la mise en cache du contexte. Paiement à l'usage en USD.

DeepSeek V4modeldeepseek-v4-flash

DeepSeek V4 playground

Open the chat playground to run DeepSeek V4 through the standard chat completions surface with your api.reapi.ai key.

Open chat playground

Ce que tu peux construire avec ce modèle

Des workflows réels et des cas d'usage en production que tu peux construire et déployer avec ce modèle.

DeepSeek V4 Pro pilotant une session de codage agentique au long cours

Codage agentique au long cours avec DeepSeek V4 Pro

DeepSeek V4 Pro est le modèle phare de l'API DeepSeek V4 — un modèle mixture-of-experts de 1,6 T de paramètres (49 Md actifs) optimisé pour le codage agentique, le raisonnement complexe et les sciences. DeepSeek annonce des résultats open source à l'état de l'art sur les benchmarks de codage agentique, et V4 s'intègre à des harnais d'agents comme Claude Code, OpenClaw et OpenCode. Branchez un agent de codage sur l'API DeepSeek V4 : il cadre la tâche, appelle les outils et raisonne sur un travail en plusieurs étapes en une seule exécution.

Lire la doc API

DeepSeek V4 Flash alimentant du codage à haut débit et des tâches par lots

Travail à haut débit et faible coût avec DeepSeek V4 Flash

DeepSeek V4 Flash est la voie rapide de l'API DeepSeek V4 — 284 Md de paramètres (13 Md actifs) dont le raisonnement frôle celui de Pro pour une fraction du coût. Utilisez l'API DeepSeek V4 pour l'autocomplétion dans l'IDE, les suggestions en ligne, la revue de code en phase CI, le résumé en masse et les backends de chat. La mise en cache du contexte ramène les prompts système et schémas d'outils répétés au faible tarif des cache hits, gardant les boucles d'agents et le trafic à fort volume bon marché.

DeepSeek V4 raisonnant sur un dossier d'analyse d'un million de tokens

Analyse de bases de code et de documents d'un million de tokens

Les deux modèles de l'API DeepSeek V4 utilisent par défaut une fenêtre de contexte de 1 M de tokens — assez pour charger un dépôt de taille moyenne complet, un long dossier de recherche ou une trace d'agent multi-tour en un seul appel. DeepSeek Sparse Attention maintient l'inférence à long contexte efficace, si bien que les charges de l'API DeepSeek V4 comme la revue d'architecture, l'audit de dépendances et la planification de migration n'ont presque jamais besoin de découpage.

Tarifs

Basé sur les crédits — 1 crédit = 0,001 USD. Tu ne paies que les générations réussies.

Catégorie	Unité	Prix
DeepSeek V4 Flash
Entrée (cache miss)	1M tokens	$0.14
Entrée (cache hit)	1M tokens	$0.0028
Sortie	1M tokens	$0.28
DeepSeek V4 Pro
Entrée (cache miss)	1M tokens	$1.74
Entrée (cache hit)	1M tokens	$0.0145
Sortie	1M tokens	$3.48

Pourquoi reAPI

Compatible OpenAI clé en main — plus une surface Anthropic

L'API DeepSeek V4 parle OpenAI Chat Completions mot pour mot. Migrer une intégration OpenAI existante vers l'API DeepSeek V4 se résume à une URL de base, une clé API et un changement de chaîne de modèle — `deepseek-v4-flash` ou `deepseek-v4-pro` — sans réécriture de plateforme. Le même tableau `messages`, le même format de streaming, et une surface native de style Anthropic pour les appelants SDK qui la préfèrent.

Raisonnement de pointe à prix avantageux

L'API DeepSeek V4 est à poids ouverts et tarifée en conséquence. Pro rivalise avec les meilleurs modèles propriétaires en raisonnement, mathématiques et codage tout en coûtant une fraction de leur prix au token ; Flash réduit encore le prix d'un ordre de grandeur pour le trafic courant. Faites tourner le travail premium sur Pro et routez les appels à fort volume vers Flash avec la même clé.

Une seule clé pour DeepSeek, GPT, Claude et Gemini

Une seule clé api.reapi.ai débloque l'API DeepSeek V4 aux côtés de GPT-5.5, Claude Opus 4.8, Gemini et tous les autres modèles de chat de pointe de la plateforme. Comparez les fournisseurs, ajoutez des solutions de repli et routez le trafic appel par appel avec un changement de configuration au lieu d'un projet d'intégration.

DeepSeek V4 vs DeepSeek V3.2

L'API DeepSeek V4 marque un saut générationnel par rapport à V3.2 — fenêtre de contexte plus grande, deux paliers de modèles, réflexion activée par défaut, vision et optimisation pour les agents. Voici ce qui a changé entre les deux.

Capacité

API DeepSeek V4 sur reAPI

DeepSeek V3.2

Gamme de modèles

Deux variantes — Flash (284 Md / 13 Md actifs) et Pro (1,6 T / 49 Md actifs) — sur la même clé API.

Une seule lignée de modèle chat / reasoner.

Fenêtre de contexte

1 M de tokens par défaut, avec DeepSeek Sparse Attention pour un long contexte efficace.

Fenêtre de contexte de 128 K tokens.

Sortie max

Jusqu'à 384 K de tokens de sortie par réponse.

Plafond de sortie nettement plus bas.

Mode réflexion

Activé par défaut, avec un commutateur réflexion / sans réflexion et la chaîne de raisonnement dans `reasoning_content`.

Raisonnement disponible via un modèle reasoner distinct.

Entrée visuelle

Entrée image prise en charge (bêta) sur le même endpoint.

Texte uniquement.

Optimisation agentique

Optimisations dédiées aux agents ; intégration aux principaux harnais d'agents de codage ; état de l'art open source sur le codage agentique selon DeepSeek.

Modèle généraliste performant, sans l'optimisation spécifique aux agents de V4.

La comparaison reflète le comportement publiquement documenté dans les notes de version V4 de DeepSeek et la documentation des modèles au moment de la rédaction. Certaines affirmations de benchmark proviennent du fournisseur. Le comportement des modèles et les tarifs peuvent changer ; consultez la grille tarifaire ci-dessus et la doc API pour les valeurs actuelles.

Déployez l'API DeepSeek V4 en trois étapes

step 01
Créez un compte et une clé sur api.reapi.ai
Inscrivez-vous sur api.reapi.ai, ouvrez la console, générez une clé API sous API Keys et créditez des tokens sous Top Up. L'espace de travail chat est distinct de la passerelle image/vidéo de reapi.ai — les clés ne sont pas interchangeables.
Ouvrir
step 02
Envoyez votre première requête
POST https://api.reapi.ai/v1/chat/completions avec `model` réglé sur `deepseek-v4-flash` (ou `deepseek-v4-pro`), votre tableau `messages` et `max_tokens`. L'endpoint de l'API DeepSeek V4 est compatible OpenAI, réponses en flux comprises ; changez de modèle en modifiant une seule ligne.
Ouvrir
step 03
Réglez selon le coût et le raisonnement
Sur l'API DeepSeek V4, optez pour Flash sur le travail sensible à la latence et à haut débit, et pour Pro lorsqu'une tâche exige un raisonnement profond. Réutilisez des prompts système stables pour atteindre le faible tarif de lecture en cache, et désactivez le mode réflexion pour les réponses les plus rapides et les moins chères.
Ouvrir

Questions fréquentes

Questions courantes sur ce modèle.

L'API DeepSeek V4 est facturée à l'usage en USD sur votre solde de tokens api.reapi.ai. La grille tarifaire de cette page affiche les tarifs en direct par 1 M de tokens en entrée et en sortie pour Flash comme pour Pro, ainsi que le tarif des cache hits. Les cache hits sont nettement moins chers que de renvoyer les mêmes tokens, et les requêtes échouées ne sont pas facturées.

Modèles associés

Explorez d’autres modèles de la même catégorie.

Voir tous les modèles

MiniMax

MiniMax M3

À partir de $0.600 par 1M de tokens

Chat

OpenAI

GPT-5.4

À partir de $1.00 par 1M de tokens

Chat

Anthropic

Claude Opus 4.7

À partir de $2.00 par 1M de tokens

Chat

Anthropic

Claude Sonnet 4.6

À partir de $2.00 par 1M de tokens

Chat

Voir tous les modèles

start building

Prêt à déployer ?

Essaie-le dans le playground ou récupère une clé API pour intégrer dès maintenant.

Obtenir une clé API Voir la doc API

API DeepSeek V4 — Flash & Pro, contexte de 1 M

Ce que tu peux construire avec ce modèle

Des workflows réels et des cas d'usage en production que tu peux construire et déployer avec ce modèle.

Codage agentique au long cours avec DeepSeek V4 Pro

Lire la doc API

Travail à haut débit et faible coût avec DeepSeek V4 Flash

Analyse de bases de code et de documents d'un million de tokens

Tarifs

Basé sur les crédits — 1 crédit = 0,001 USD. Tu ne paies que les générations réussies.

Catégorie	Unité	Prix
DeepSeek V4 Flash
Entrée (cache miss)	1M tokens	$0.14
Entrée (cache hit)	1M tokens	$0.0028
Sortie	1M tokens	$0.28
DeepSeek V4 Pro
Entrée (cache miss)	1M tokens	$1.74
Entrée (cache hit)	1M tokens	$0.0145
Sortie	1M tokens	$3.48

Pourquoi reAPI