ChatOpenAI
GPT-5.4
GPT-5.4 de OpenAI con ventana de contexto de 1M y salida máxima de 128K — la ruta GPT rentable.
La API de DeepSeek V4 ofrece dos modelos open-weight en un único endpoint compatible con OpenAI: Flash para tareas rápidas y económicas del día a día, y Pro para razonamiento de frontera, coding agéntico y STEM. Ambos cuentan con una ventana de contexto de 1M tokens, hasta 384K de salida, modo de pensamiento activado por defecto, entrada de visión, uso de herramientas y caché de contexto. Pago por uso en USD.
Flujos de trabajo reales impulsados por este modelo.

DeepSeek V4 Pro es el buque insignia de la API de DeepSeek V4: un modelo mixture-of-experts de 1.6T parámetros (49B activos) ajustado para coding agéntico, razonamiento complejo y STEM. DeepSeek reporta resultados open-source de primer nivel en benchmarks de coding agéntico, y V4 está integrado con harnesses de agentes como Claude Code, OpenClaw y OpenCode. Apunta un agente de coding a la API de DeepSeek V4 y este define el alcance de la tarea, llama a las herramientas y razona a través de trabajo de varios pasos en una sola ejecución.
Leer la documentación de la API
DeepSeek V4 Flash es el carril rápido de la API de DeepSeek V4: 284B parámetros (13B activos) cuyo razonamiento se acerca mucho al de Pro a una fracción del coste. Usa la API de DeepSeek V4 para autocompletado en el IDE, sugerencias en línea, revisión de código en la fase de CI, resúmenes masivos y backends de chat. La caché de contexto recorta los prompts de sistema y los esquemas de herramientas repetidos a la baja tarifa de acierto de caché, de modo que los bucles de agentes y el tráfico de alto volumen se mantienen baratos.

Ambos modelos de la API de DeepSeek V4 usan por defecto una ventana de contexto de 1M tokens, suficiente para cargar un repositorio mediano entero, un dossier de investigación extenso o una traza de agente de varios turnos en una sola llamada. DeepSeek Sparse Attention mantiene eficiente la inferencia con contexto largo, así que cargas de la API de DeepSeek V4 como la revisión de arquitectura, las auditorías de dependencias y la planificación de migraciones rara vez necesitan fragmentación.
Basado en créditos: 1 crédito = 0,001 USD. Solo pagas por las generaciones completadas.
| Categoría | Unidad | Precio |
|---|---|---|
| DeepSeek V4 Flash | ||
| Entrada (sin caché) | 1M tokens | $0.14 |
| Entrada (con caché) | 1M tokens | $0.0028 |
| Salida | 1M tokens | $0.28 |
| DeepSeek V4 Pro | ||
| Entrada (sin caché) | 1M tokens | $1.74 |
| Entrada (con caché) | 1M tokens | $0.0145 |
| Salida | 1M tokens | $3.48 |
La API de DeepSeek V4 habla OpenAI Chat Completions al pie de la letra. Migrar una integración OpenAI existente a la API de DeepSeek V4 es cuestión de cambiar la base URL, la clave API y la cadena del modelo (`deepseek-v4-flash` o `deepseek-v4-pro`), no de reescribir la plataforma. El mismo array `messages`, el mismo formato de streaming y una superficie nativa al estilo Anthropic para quienes prefieran llamar desde ese SDK.
La API de DeepSeek V4 es open-weight y su precio lo refleja. Pro rivaliza con los mejores modelos cerrados en razonamiento, matemáticas y coding, costando una fracción de ellos por token; Flash baja el precio otro orden de magnitud para el tráfico del día a día. Ejecuta el trabajo premium en Pro y enruta las llamadas de alto volumen a Flash con la misma clave.
Una única clave de api.reapi.ai desbloquea la API de DeepSeek V4 junto a GPT-5.5, Claude Opus 4.8, Gemini y el resto de modelos de chat de frontera de la plataforma. Compara proveedores, añade fallbacks y enruta el tráfico por llamada con un cambio de configuración en lugar de un proyecto de integración.
La API de DeepSeek V4 es un salto generacional respecto a V3.2: una ventana de contexto mayor, dos niveles de modelo, pensamiento activado por defecto, visión y un ajuste centrado en agentes. Esto es lo que cambió entre ambos.
La comparativa refleja el comportamiento documentado públicamente en las notas de la versión V4 de DeepSeek y la documentación del modelo en el momento de redactar este texto. Algunas cifras de benchmarks las reporta el proveedor. El comportamiento y los precios del modelo pueden cambiar; consulta la tarjeta de precios de arriba y la documentación de la API para ver los valores actuales.
Regístrate en api.reapi.ai, abre la consola, genera una clave API en API Keys y recarga tokens en Top Up. El espacio de trabajo de chat es independiente del gateway de imagen/vídeo de reapi.ai: las claves no se comparten entre ambos.
AbrirHaz un POST a https://api.reapi.ai/v1/chat/completions con `model` puesto en `deepseek-v4-flash` (o `deepseek-v4-pro`), tu array `messages` y `max_tokens`. El endpoint de la API de DeepSeek V4 es compatible con OpenAI, incluidas las respuestas en streaming; cambia de modelo con una sola línea.
AbrirEn la API de DeepSeek V4, recurre a Flash para trabajo de alto rendimiento sensible a la latencia y a Pro cuando una tarea requiera razonamiento profundo. Reutiliza prompts de sistema estables para alcanzar la baja tarifa de lectura de caché, y desactiva el modo de pensamiento para obtener las respuestas más rápidas y económicas.
AbrirDudas comunes sobre este modelo.
Explora más modelos de la misma categoría.
ChatOpenAI
GPT-5.4 de OpenAI con ventana de contexto de 1M y salida máxima de 128K — la ruta GPT rentable.
ChatAnthropic
Claude Opus 4.7 de Anthropic — contexto de 1M, salida de 128K, programación premium y razonamiento de agentes.
ChatAnthropic
Claude Sonnet 4.6 de Anthropic — calidad y velocidad equilibradas para chat de producción cotidiano, revisión de código y agentes de complejidad media.
ChatOpenAI
GPT-5.5 de OpenAI con 1M de contexto y 128K de salida máxima, detrás de una única clave reAPI OpenAI-compatible.
curl https://api.reapi.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v4-flash",
"group": "default",
"messages": [
{ "role": "user", "content": "Hello" }
],
"stream": true,
"max_tokens": 4096,
"temperature": 0.7
}'Pruébalo en el playground o consigue una API key para integrarlo ahora.