rreAPI
  • Modelos
  • Chat
  • Blog
  • Docs
  • Changelog
Home/Models/DeepSeek V4new

API de DeepSeek V4 — Flash y Pro, contexto de 1M tokens

La API de DeepSeek V4 ofrece dos modelos open-weight en un único endpoint compatible con OpenAI: Flash para tareas rápidas y económicas del día a día, y Pro para razonamiento de frontera, coding agéntico y STEM. Ambos cuentan con una ventana de contexto de 1M tokens, hasta 384K de salida, modo de pensamiento activado por defecto, entrada de visión, uso de herramientas y caché de contexto. Pago por uso en USD.

Precio
est$0.14– $3.48por 1M tokens
Obtener clave APIVer documentación de la API

Lo que puedes construir

Flujos de trabajo reales impulsados por este modelo.

DeepSeek V4 Pro impulsando una sesión de coding agéntico de largo alcance

Coding agéntico de largo alcance con DeepSeek V4 Pro

DeepSeek V4 Pro es el buque insignia de la API de DeepSeek V4: un modelo mixture-of-experts de 1.6T parámetros (49B activos) ajustado para coding agéntico, razonamiento complejo y STEM. DeepSeek reporta resultados open-source de primer nivel en benchmarks de coding agéntico, y V4 está integrado con harnesses de agentes como Claude Code, OpenClaw y OpenCode. Apunta un agente de coding a la API de DeepSeek V4 y este define el alcance de la tarea, llama a las herramientas y razona a través de trabajo de varios pasos en una sola ejecución.

Leer la documentación de la API
DeepSeek V4 Flash potenciando coding de alto rendimiento y trabajos por lotes

Trabajo de alto rendimiento y bajo coste con DeepSeek V4 Flash

DeepSeek V4 Flash es el carril rápido de la API de DeepSeek V4: 284B parámetros (13B activos) cuyo razonamiento se acerca mucho al de Pro a una fracción del coste. Usa la API de DeepSeek V4 para autocompletado en el IDE, sugerencias en línea, revisión de código en la fase de CI, resúmenes masivos y backends de chat. La caché de contexto recorta los prompts de sistema y los esquemas de herramientas repetidos a la baja tarifa de acierto de caché, de modo que los bucles de agentes y el tráfico de alto volumen se mantienen baratos.

DeepSeek V4 razonando sobre un dossier de análisis de un millón de tokens

Análisis de bases de código y documentos de un millón de tokens

Ambos modelos de la API de DeepSeek V4 usan por defecto una ventana de contexto de 1M tokens, suficiente para cargar un repositorio mediano entero, un dossier de investigación extenso o una traza de agente de varios turnos en una sola llamada. DeepSeek Sparse Attention mantiene eficiente la inferencia con contexto largo, así que cargas de la API de DeepSeek V4 como la revisión de arquitectura, las auditorías de dependencias y la planificación de migraciones rara vez necesitan fragmentación.

Precios

Basado en créditos: 1 crédito = 0,001 USD. Solo pagas por las generaciones completadas.

CategoríaUnidadPrecio
DeepSeek V4 Flash
Entrada (sin caché)1M tokens
$0.14
Entrada (con caché)1M tokens
$0.0028
Salida1M tokens
$0.28
DeepSeek V4 Pro
Entrada (sin caché)1M tokens
$1.74
Entrada (con caché)1M tokens
$0.0145
Salida1M tokens
$3.48

Por qué reAPI

Reemplazo directo compatible con OpenAI, más una superficie Anthropic

La API de DeepSeek V4 habla OpenAI Chat Completions al pie de la letra. Migrar una integración OpenAI existente a la API de DeepSeek V4 es cuestión de cambiar la base URL, la clave API y la cadena del modelo (`deepseek-v4-flash` o `deepseek-v4-pro`), no de reescribir la plataforma. El mismo array `messages`, el mismo formato de streaming y una superficie nativa al estilo Anthropic para quienes prefieran llamar desde ese SDK.

Razonamiento de frontera a precio de valor

La API de DeepSeek V4 es open-weight y su precio lo refleja. Pro rivaliza con los mejores modelos cerrados en razonamiento, matemáticas y coding, costando una fracción de ellos por token; Flash baja el precio otro orden de magnitud para el tráfico del día a día. Ejecuta el trabajo premium en Pro y enruta las llamadas de alto volumen a Flash con la misma clave.

Una sola clave para DeepSeek, GPT, Claude y Gemini

Una única clave de api.reapi.ai desbloquea la API de DeepSeek V4 junto a GPT-5.5, Claude Opus 4.8, Gemini y el resto de modelos de chat de frontera de la plataforma. Compara proveedores, añade fallbacks y enruta el tráfico por llamada con un cambio de configuración en lugar de un proyecto de integración.

DeepSeek V4 frente a DeepSeek V3.2

La API de DeepSeek V4 es un salto generacional respecto a V3.2: una ventana de contexto mayor, dos niveles de modelo, pensamiento activado por defecto, visión y un ajuste centrado en agentes. Esto es lo que cambió entre ambos.

Capacidad
API de DeepSeek V4 en reAPI
DeepSeek V3.2
Gama de modelos
Dos variantes — Flash (284B / 13B activos) y Pro (1.6T / 49B activos) — con la misma clave API.
Una única línea de modelo de chat / razonador.
Ventana de contexto
1M tokens por defecto, con DeepSeek Sparse Attention para un contexto largo eficiente.
Ventana de contexto de 128K tokens.
Salida máxima
Hasta 384K tokens de salida por respuesta.
Límite de salida sustancialmente menor.
Modo de pensamiento
Activado por defecto, con un conmutador dual de pensamiento / sin pensamiento y la cadena de pensamiento en `reasoning_content`.
Razonamiento disponible a través de un modelo razonador aparte.
Entrada de visión
Entrada de imagen admitida (beta) en el mismo endpoint.
Solo texto.
Ajuste agéntico
Optimizaciones de agente específicas; integrado con los principales harnesses de agentes de coding; SOTA open-source en coding agéntico según DeepSeek.
Modelo general competente, sin el ajuste específico para agentes de V4.

La comparativa refleja el comportamiento documentado públicamente en las notas de la versión V4 de DeepSeek y la documentación del modelo en el momento de redactar este texto. Algunas cifras de benchmarks las reporta el proveedor. El comportamiento y los precios del modelo pueden cambiar; consulta la tarjeta de precios de arriba y la documentación de la API para ver los valores actuales.

Lanza con la API de DeepSeek V4 en tres pasos

  1. 01
    step 01

    Crea una cuenta y una clave en api.reapi.ai

    Regístrate en api.reapi.ai, abre la consola, genera una clave API en API Keys y recarga tokens en Top Up. El espacio de trabajo de chat es independiente del gateway de imagen/vídeo de reapi.ai: las claves no se comparten entre ambos.

    Abrir
  2. 02
    step 02

    Envía tu primera petición

    Haz un POST a https://api.reapi.ai/v1/chat/completions con `model` puesto en `deepseek-v4-flash` (o `deepseek-v4-pro`), tu array `messages` y `max_tokens`. El endpoint de la API de DeepSeek V4 es compatible con OpenAI, incluidas las respuestas en streaming; cambia de modelo con una sola línea.

    Abrir
  3. 03
    step 03

    Ajusta para coste y razonamiento

    En la API de DeepSeek V4, recurre a Flash para trabajo de alto rendimiento sensible a la latencia y a Pro cuando una tarea requiera razonamiento profundo. Reutiliza prompts de sistema estables para alcanzar la baja tarifa de lectura de caché, y desactiva el modo de pensamiento para obtener las respuestas más rápidas y económicas.

    Abrir

Preguntas frecuentes

Dudas comunes sobre este modelo.

La API de DeepSeek V4 se factura por uso en USD contra tu saldo de tokens de api.reapi.ai. La tarjeta de precios de esta página muestra las tarifas en vivo de entrada y salida por 1M tokens para Flash y Pro, además de la tarifa de acierto de caché. Los aciertos de caché son drásticamente más baratos que reenviar los mismos tokens, y las peticiones fallidas no se cobran.

Modelos relacionados

Explora más modelos de la misma categoría.

Ver todos los modelos
GPT-5.4 coverChat

OpenAI

GPT-5.4

GPT-5.4 de OpenAI con ventana de contexto de 1M y salida máxima de 128K — la ruta GPT rentable.

Desde $1.00 por 1M tokens
Claude Opus 4.7 coverChat

Anthropic

Claude Opus 4.7

Claude Opus 4.7 de Anthropic — contexto de 1M, salida de 128K, programación premium y razonamiento de agentes.

Desde $2.00 por 1M tokens
Claude Sonnet 4.6 coverChat

Anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 de Anthropic — calidad y velocidad equilibradas para chat de producción cotidiano, revisión de código y agentes de complejidad media.

Desde $2.00 por 1M de tokens
GPT-5.5 coverChat

OpenAI

GPT-5.5

GPT-5.5 de OpenAI con 1M de contexto y 128K de salida máxima, detrás de una única clave reAPI OpenAI-compatible.

Desde $2.00 por 1M de tokens
Ver todos los modelos
docs/api/deepseek-v4

Referencia de API

Código listo para usar y la tabla completa de parámetros.

Ver referencia completa
curl https://api.reapi.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-flash",
    "group": "default",
    "messages": [
      { "role": "user", "content": "Hello" }
    ],
    "stream": true,
    "max_tokens": 4096,
    "temperature": 0.7
  }'
start building

¿Listo para lanzar?

Pruébalo en el playground o consigue una API key para integrarlo ahora.

Obtener clave APIVer documentación de la API
rreAPI

reAPI es el agregador de API de IA con conmutación por error en menos de un segundo, sin registro de solicitudes y un único endpoint compatible con OpenAI para todos los modelos principales.

GitHubX (Twitter)
Built withLogo of reAPIreAPI
Featured on There's An AI For ThatFeatured on Findly.toolsFazier badgeDang.ai
ai tools code.market
Featured on Twelve Tools
Imagen
  • GPT Image 2
  • Gemini 3 Pro Image
  • Gemini 3.1 Flash Image
  • Gemini 2.5 Flash Image
  • Seedream 5.0 Lite
  • Imagen 4.0
  • Wan 2.7 Image
Video
  • Seedance 2.0
  • Happy Horse 1.0
  • Vidu Q3
  • Pixverse v6
  • Grok Imagine 1.0
  • VEO 3.1
  • Gemini Omni
  • Wan 2.7 Video
  • Kling Motion Control
LLM
  • Claude Opus 4.8
  • Claude Opus 4.7
  • Claude Sonnet 4.6
  • DeepSeek V4
  • GPT-5.4
  • GPT-5.5
Audio
  • Mureka V9
  • Vocal Remover
  • Music Extractor
  • Voice Cleaner
  • Multistem Splitter
  • Voice Changer
Texto
  • AI Humanizer
  • AI Text Detector
Herramientas
  • Enhance Video 1.0
·······
© 2026 reAPI. All Rights Reserved.[email protected]
Acerca deContactoChangelogPolítica de cookiesPolítica de privacidadTérminos del servicio