¿Cuál es la diferencia entre DeepSeek V4 Flash y Pro?

Ambos forman parte de la API de DeepSeek V4 y comparten una ventana de contexto de 1M, salida máxima de 384K, modo de pensamiento y uso de herramientas. Flash (284B / 13B activos) es la opción rápida y económica por defecto para autocompletado, análisis por lotes y backends de chat; Pro (1.6T / 49B activos) es el buque insignia para razonamiento profundo, depuración compleja y coding agéntico. Comparten una sola clave de la API de DeepSeek V4: combínalos por petición.

¿La API de DeepSeek V4 es compatible con OpenAI?

Sí. La API de DeepSeek V4 es un reemplazo directo de /v1/chat/completions de OpenAI: mismo formato de petición, mismo array `messages`, mismos parámetros `stream` / `temperature` / `max_tokens` y mismo formato SSE en el cable. La mayoría de los equipos migran cambiando la base URL a https://api.reapi.ai/v1, sustituyendo la clave API y poniendo `model` en `deepseek-v4-flash` o `deepseek-v4-pro`.

¿Cuál es la ventana de contexto de DeepSeek V4?

Ambos modelos de la API de DeepSeek V4 usan por defecto una ventana de contexto de 1M tokens y admiten hasta 384K tokens de salida por respuesta. DeepSeek Sparse Attention mantiene eficiente la inferencia con contexto largo, así que puedes alimentar repositorios enteros y documentos largos sin fragmentar.

¿Cómo funciona el modo de pensamiento y puedo desactivarlo?

DeepSeek V4 funciona en modo de pensamiento por defecto: produce una cadena de pensamiento antes de la respuesta final y la devuelve en un campo `reasoning_content` junto a `content`. Para llamadas sencillas o sensibles a la latencia puedes cambiar al modo sin pensamiento para respuestas más rápidas y económicas; el id del modelo no cambia.

¿La API de DeepSeek V4 admite visión y uso de herramientas?

Sí. La API de DeepSeek V4 acepta entradas de imagen (beta) junto al texto en la misma llamada, y admite function calling / uso de herramientas además de salida JSON. Está ajustada para flujos agénticos de varios pasos e integrada con los principales harnesses de agentes de coding.

¿En qué se diferencia DeepSeek V4 de DeepSeek V3.2?

La API de DeepSeek V4 eleva la ventana de contexto por defecto a 1M tokens (frente a 128K), se divide en dos variantes (Flash y Pro) en lugar de una, activa el pensamiento por defecto con un modo dual de pensamiento / sin pensamiento, añade entrada de visión e incorpora optimizaciones agénticas específicas. Pro rivaliza con los mejores modelos cerrados en razonamiento y coding sin dejar de ser open-weight.

¿Dónde creo una clave API y compro tokens?

Ambas cosas se hacen en api.reapi.ai: el espacio de trabajo de chat funciona como su propia plataforma, separada del gateway de tareas de imagen/vídeo de reapi.ai. Regístrate en api.reapi.ai, genera una clave en API Keys y recarga en Top Up. Una clave de reapi.ai/settings/apikeys no se autenticará contra el endpoint de chat.

API de DeepSeek V4 — Flash y Pro, contexto de 1M tokens

La API de DeepSeek V4 ofrece dos modelos open-weight en un único endpoint compatible con OpenAI: Flash para tareas rápidas y económicas del día a día, y Pro para razonamiento de frontera, coding agéntico y STEM. Ambos cuentan con una ventana de contexto de 1M tokens, hasta 384K de salida, modo de pensamiento activado por defecto, entrada de visión, uso de herramientas y caché de contexto. Pago por uso en USD.

DeepSeek V4modeldeepseek-v4-flash

DeepSeek V4 playground

Open the chat playground to run DeepSeek V4 through the standard chat completions surface with your api.reapi.ai key.

Open chat playground

Lo que puedes construir con este modelo

Flujos de trabajo reales y casos de uso en producción que puedes construir y lanzar con este modelo.

DeepSeek V4 Pro impulsando una sesión de coding agéntico de largo alcance

Coding agéntico de largo alcance con DeepSeek V4 Pro

DeepSeek V4 Pro es el buque insignia de la API de DeepSeek V4: un modelo mixture-of-experts de 1.6T parámetros (49B activos) ajustado para coding agéntico, razonamiento complejo y STEM. DeepSeek reporta resultados open-source de primer nivel en benchmarks de coding agéntico, y V4 está integrado con harnesses de agentes como Claude Code, OpenClaw y OpenCode. Apunta un agente de coding a la API de DeepSeek V4 y este define el alcance de la tarea, llama a las herramientas y razona a través de trabajo de varios pasos en una sola ejecución.

Leer la documentación de la API

DeepSeek V4 Flash potenciando coding de alto rendimiento y trabajos por lotes

Trabajo de alto rendimiento y bajo coste con DeepSeek V4 Flash

DeepSeek V4 Flash es el carril rápido de la API de DeepSeek V4: 284B parámetros (13B activos) cuyo razonamiento se acerca mucho al de Pro a una fracción del coste. Usa la API de DeepSeek V4 para autocompletado en el IDE, sugerencias en línea, revisión de código en la fase de CI, resúmenes masivos y backends de chat. La caché de contexto recorta los prompts de sistema y los esquemas de herramientas repetidos a la baja tarifa de acierto de caché, de modo que los bucles de agentes y el tráfico de alto volumen se mantienen baratos.

DeepSeek V4 razonando sobre un dossier de análisis de un millón de tokens

Análisis de bases de código y documentos de un millón de tokens

Ambos modelos de la API de DeepSeek V4 usan por defecto una ventana de contexto de 1M tokens, suficiente para cargar un repositorio mediano entero, un dossier de investigación extenso o una traza de agente de varios turnos en una sola llamada. DeepSeek Sparse Attention mantiene eficiente la inferencia con contexto largo, así que cargas de la API de DeepSeek V4 como la revisión de arquitectura, las auditorías de dependencias y la planificación de migraciones rara vez necesitan fragmentación.

Precios

Basado en créditos: 1 crédito = 0,001 USD. Solo pagas por las generaciones completadas.

Categoría	Unidad	Precio
DeepSeek V4 Flash
Entrada (sin caché)	1M tokens	$0.14
Entrada (con caché)	1M tokens	$0.0028
Salida	1M tokens	$0.28
DeepSeek V4 Pro
Entrada (sin caché)	1M tokens	$1.74
Entrada (con caché)	1M tokens	$0.0145
Salida	1M tokens	$3.48

Por qué reAPI

Reemplazo directo compatible con OpenAI, más una superficie Anthropic

La API de DeepSeek V4 habla OpenAI Chat Completions al pie de la letra. Migrar una integración OpenAI existente a la API de DeepSeek V4 es cuestión de cambiar la base URL, la clave API y la cadena del modelo (`deepseek-v4-flash` o `deepseek-v4-pro`), no de reescribir la plataforma. El mismo array `messages`, el mismo formato de streaming y una superficie nativa al estilo Anthropic para quienes prefieran llamar desde ese SDK.

Razonamiento de frontera a precio de valor

La API de DeepSeek V4 es open-weight y su precio lo refleja. Pro rivaliza con los mejores modelos cerrados en razonamiento, matemáticas y coding, costando una fracción de ellos por token; Flash baja el precio otro orden de magnitud para el tráfico del día a día. Ejecuta el trabajo premium en Pro y enruta las llamadas de alto volumen a Flash con la misma clave.

Una sola clave para DeepSeek, GPT, Claude y Gemini

Una única clave de api.reapi.ai desbloquea la API de DeepSeek V4 junto a GPT-5.5, Claude Opus 4.8, Gemini y el resto de modelos de chat de frontera de la plataforma. Compara proveedores, añade fallbacks y enruta el tráfico por llamada con un cambio de configuración en lugar de un proyecto de integración.

DeepSeek V4 frente a DeepSeek V3.2

La API de DeepSeek V4 es un salto generacional respecto a V3.2: una ventana de contexto mayor, dos niveles de modelo, pensamiento activado por defecto, visión y un ajuste centrado en agentes. Esto es lo que cambió entre ambos.

Capacidad

API de DeepSeek V4 en reAPI

DeepSeek V3.2

Gama de modelos

Dos variantes — Flash (284B / 13B activos) y Pro (1.6T / 49B activos) — con la misma clave API.

Una única línea de modelo de chat / razonador.

Ventana de contexto

1M tokens por defecto, con DeepSeek Sparse Attention para un contexto largo eficiente.

Ventana de contexto de 128K tokens.

Salida máxima

Hasta 384K tokens de salida por respuesta.

Límite de salida sustancialmente menor.

Modo de pensamiento

Activado por defecto, con un conmutador dual de pensamiento / sin pensamiento y la cadena de pensamiento en `reasoning_content`.

Razonamiento disponible a través de un modelo razonador aparte.

Entrada de visión

Entrada de imagen admitida (beta) en el mismo endpoint.

Solo texto.

Ajuste agéntico

Optimizaciones de agente específicas; integrado con los principales harnesses de agentes de coding; SOTA open-source en coding agéntico según DeepSeek.

Modelo general competente, sin el ajuste específico para agentes de V4.

La comparativa refleja el comportamiento documentado públicamente en las notas de la versión V4 de DeepSeek y la documentación del modelo en el momento de redactar este texto. Algunas cifras de benchmarks las reporta el proveedor. El comportamiento y los precios del modelo pueden cambiar; consulta la tarjeta de precios de arriba y la documentación de la API para ver los valores actuales.

Lanza con la API de DeepSeek V4 en tres pasos

step 01
Crea una cuenta y una clave en api.reapi.ai
Regístrate en api.reapi.ai, abre la consola, genera una clave API en API Keys y recarga tokens en Top Up. El espacio de trabajo de chat es independiente del gateway de imagen/vídeo de reapi.ai: las claves no se comparten entre ambos.
Abrir
step 02
Envía tu primera petición
Haz un POST a https://api.reapi.ai/v1/chat/completions con `model` puesto en `deepseek-v4-flash` (o `deepseek-v4-pro`), tu array `messages` y `max_tokens`. El endpoint de la API de DeepSeek V4 es compatible con OpenAI, incluidas las respuestas en streaming; cambia de modelo con una sola línea.
Abrir
step 03
Ajusta para coste y razonamiento
En la API de DeepSeek V4, recurre a Flash para trabajo de alto rendimiento sensible a la latencia y a Pro cuando una tarea requiera razonamiento profundo. Reutiliza prompts de sistema estables para alcanzar la baja tarifa de lectura de caché, y desactiva el modo de pensamiento para obtener las respuestas más rápidas y económicas.
Abrir

Preguntas frecuentes

Dudas comunes sobre este modelo.

La API de DeepSeek V4 se factura por uso en USD contra tu saldo de tokens de api.reapi.ai. La tarjeta de precios de esta página muestra las tarifas en vivo de entrada y salida por 1M tokens para Flash y Pro, además de la tarifa de acierto de caché. Los aciertos de caché son drásticamente más baratos que reenviar los mismos tokens, y las peticiones fallidas no se cobran.

Modelos relacionados

Explora más modelos de la misma categoría.

Ver todos los modelos

MiniMax

MiniMax M3

Desde $0.600 por 1M tokens

Chat

OpenAI

GPT-5.4

Desde $1.00 por 1M tokens

Chat

Anthropic

Claude Opus 4.7

Desde $2.00 por 1M tokens

Chat

Anthropic

Claude Sonnet 4.6

Desde $2.00 por 1M de tokens

Chat

Ver todos los modelos

start building

¿Listo para lanzar?

Pruébalo en el playground o consigue una API key para integrarlo ahora.

Obtener clave API Ver documentación de la API

API de DeepSeek V4 — Flash y Pro, contexto de 1M tokens

Lo que puedes construir con este modelo

Flujos de trabajo reales y casos de uso en producción que puedes construir y lanzar con este modelo.

Coding agéntico de largo alcance con DeepSeek V4 Pro

Leer la documentación de la API

Trabajo de alto rendimiento y bajo coste con DeepSeek V4 Flash

Análisis de bases de código y documentos de un millón de tokens

Precios

Basado en créditos: 1 crédito = 0,001 USD. Solo pagas por las generaciones completadas.

Categoría	Unidad	Precio
DeepSeek V4 Flash
Entrada (sin caché)	1M tokens	$0.14
Entrada (con caché)	1M tokens	$0.0028
Salida	1M tokens	$0.28
DeepSeek V4 Pro
Entrada (sin caché)	1M tokens	$1.74
Entrada (con caché)	1M tokens	$0.0145
Salida	1M tokens	$3.48

Por qué reAPI

Reemplazo directo compatible con OpenAI, más una superficie Anthropic

Razonamiento de frontera a precio de valor

Una sola clave para DeepSeek, GPT, Claude y Gemini

DeepSeek V4 frente a DeepSeek V3.2

Capacidad

API de DeepSeek V4 en reAPI

DeepSeek V3.2

Gama de modelos

Dos variantes — Flash (284B / 13B activos) y Pro (1.6T / 49B activos) — con la misma clave API.

Una única línea de modelo de chat / razonador.

Ventana de contexto

1M tokens por defecto, con DeepSeek Sparse Attention para un contexto largo eficiente.

Ventana de contexto de 128K tokens.

Salida máxima

Hasta 384K tokens de salida por respuesta.

Límite de salida sustancialmente menor.

Modo de pensamiento

Activado por defecto, con un conmutador dual de pensamiento / sin pensamiento y la cadena de pensamiento en `reasoning_content`.

Razonamiento disponible a través de un modelo razonador aparte.

Entrada de visión

Entrada de imagen admitida (beta) en el mismo endpoint.

Solo texto.

Ajuste agéntico

Optimizaciones de agente específicas; integrado con los principales harnesses de agentes de coding; SOTA open-source en coding agéntico según DeepSeek.

Modelo general competente, sin el ajuste específico para agentes de V4.

Lanza con la API de DeepSeek V4 en tres pasos

step 01
Crea una cuenta y una clave en api.reapi.ai
Regístrate en api.reapi.ai, abre la consola, genera una clave API en API Keys y recarga tokens en Top Up. El espacio de trabajo de chat es independiente del gateway de imagen/vídeo de reapi.ai: las claves no se comparten entre ambos.
Abrir
step 02
Envía tu primera petición
Haz un POST a https://api.reapi.ai/v1/chat/completions con `model` puesto en `deepseek-v4-flash` (o `deepseek-v4-pro`), tu array `messages` y `max_tokens`. El endpoint de la API de DeepSeek V4 es compatible con OpenAI, incluidas las respuestas en streaming; cambia de modelo con una sola línea.
Abrir
step 03
Ajusta para coste y razonamiento
En la API de DeepSeek V4, recurre a Flash para trabajo de alto rendimiento sensible a la latencia y a Pro cuando una tarea requiera razonamiento profundo. Reutiliza prompts de sistema estables para alcanzar la baja tarifa de lectura de caché, y desactiva el modo de pensamiento para obtener las respuestas más rápidas y económicas.
Abrir

API de DeepSeek V4 — Flash y Pro, contexto de 1M tokens

DeepSeek V4 playground

Lo que puedes construir con este modelo

Coding agéntico de largo alcance con DeepSeek V4 Pro

Trabajo de alto rendimiento y bajo coste con DeepSeek V4 Flash

Análisis de bases de código y documentos de un millón de tokens

Precios

Por qué reAPI

Reemplazo directo compatible con OpenAI, más una superficie Anthropic

Razonamiento de frontera a precio de valor

Una sola clave para DeepSeek, GPT, Claude y Gemini

DeepSeek V4 frente a DeepSeek V3.2

Lanza con la API de DeepSeek V4 en tres pasos

Crea una cuenta y una clave en api.reapi.ai

Envía tu primera petición

Ajusta para coste y razonamiento

Preguntas frecuentes

¿Cuánto cuesta la API de DeepSeek V4?

¿Cuál es la diferencia entre DeepSeek V4 Flash y Pro?

¿La API de DeepSeek V4 es compatible con OpenAI?

¿Cuál es la ventana de contexto de DeepSeek V4?

¿Cómo funciona el modo de pensamiento y puedo desactivarlo?

¿La API de DeepSeek V4 admite visión y uso de herramientas?

¿En qué se diferencia DeepSeek V4 de DeepSeek V3.2?

¿Dónde creo una clave API y compro tokens?