DeepSeek V4 Flash 和 Pro 有什么区别？

两者都属于 DeepSeek V4 API，共享 1M 上下文窗口、384K 最大输出、思考模式与工具调用。Flash（284B / 激活 13B）是快速、低成本的默认选择，适合自动补全、批量分析与聊天后端；Pro（1.6T / 激活 49B）是旗舰，面向深度推理、复杂调试与智能体编码。两者共用一个 DeepSeek V4 API Key——按请求粒度混用即可。

DeepSeek V4 API 与 OpenAI 兼容吗？

兼容。DeepSeek V4 API 可直接替代 OpenAI 的 /v1/chat/completions——请求结构相同、`messages` 数组相同、`stream` / `temperature` / `max_tokens` 参数相同、SSE 线协议格式相同。多数团队迁移时只需把 base URL 改为 https://api.reapi.ai/v1，更换 API Key，并把 `model` 设为 `deepseek-v4-flash` 或 `deepseek-v4-pro`。

DeepSeek V4 的上下文窗口有多大？

两款 DeepSeek V4 API 模型默认都采用 1M token 上下文窗口，单次响应最多支持 384K 输出 token。DeepSeek Sparse Attention 让长上下文推理保持高效，因此你可以喂入整个仓库和长篇文档而无需分块。

思考模式如何工作，能关闭吗？

DeepSeek V4 默认运行在思考模式：它在给出最终答案前先生成一段思维链，并将其放在 `reasoning_content` 字段中与 `content` 一并返回。对于延迟敏感或简单的调用，你可以切换到非思考模式，获得更快、更便宜的响应——模型 id 保持不变。

DeepSeek V4 API 支持视觉和工具调用吗？

支持。DeepSeek V4 API 可在同一次调用中接收图像输入（beta）与文本，并支持函数调用 / 工具调用以及 JSON 输出。它针对智能体多步工作流调优，并与领先的编码智能体框架集成。

DeepSeek V4 与 DeepSeek V3.2 有何不同？

DeepSeek V4 API 把默认上下文窗口提升到 1M token（此前为 128K），从单一模型拆分为两个变体（Flash 与 Pro），默认开启思考并提供思考 / 非思考双模式，新增视觉输入，并内置专门的智能体优化。Pro 在推理与编码上比肩顶级闭源模型，同时仍是开源权重。

我在哪里创建 API Key 并购买 token？

两者都在 api.reapi.ai 上完成——聊天工作区作为独立平台运行，与 reapi.ai 的图像 / 视频任务网关相互分离。前往 api.reapi.ai 注册，在 API Keys 下生成 Key，并在 Top Up 下充值。reapi.ai/settings/apikeys 上的 Key 无法在聊天端点上通过鉴权。

DeepSeek V4 API——Flash 与 Pro，1M 上下文

DeepSeek V4 API 在同一个 OpenAI 兼容端点上提供两款开源权重模型——Flash 主打快速、低成本的日常任务，Pro 面向前沿推理、智能体编码与 STEM。两者都具备 1M token 上下文窗口、384K 最大输出、默认开启的思考模式、视觉输入、工具调用与上下文缓存。按用量以美元计费。

DeepSeek V4modeldeepseek-v4-flash

DeepSeek V4 playground

Open the chat playground to run DeepSeek V4 through the standard chat completions surface with your api.reapi.ai key.

Open chat playground

你能用这个模型做什么

可以用这个模型构建并上线的真实工作流与生产级用例。

用 DeepSeek V4 Pro 进行长周期智能体编码

DeepSeek V4 Pro 是 DeepSeek V4 API 的旗舰——一款 1.6T 参数的混合专家模型（激活 49B），专为智能体编码、复杂推理与 STEM 调优。DeepSeek 公布其在智能体编码基准上取得开源 SOTA 成绩，V4 已与 Claude Code、OpenClaw、OpenCode 等智能体框架集成。把编码智能体指向 DeepSeek V4 API，它就能在一次运行中界定任务、调用工具并完成多步推理。

阅读 API 文档

用 DeepSeek V4 Flash 处理高吞吐、低成本任务

DeepSeek V4 Flash 是 DeepSeek V4 API 的快车道——284B 参数（激活 13B），其推理能力以极低成本逼近 Pro。可用 DeepSeek V4 API 来做 IDE 内自动补全、行内建议、CI 阶段代码评审、批量摘要以及聊天后端。上下文缓存把重复的系统提示词与工具 schema 削减到极低的缓存命中费率，让智能体循环与大流量场景保持低成本。

百万 token 代码库与文档分析

两款 DeepSeek V4 API 模型默认都采用 1M token 上下文窗口——足以在一次调用中加载整个中型仓库、一份长篇研究资料包或一段多轮智能体轨迹。DeepSeek Sparse Attention 让长上下文推理保持高效，因此架构评审、依赖审计、迁移规划等 DeepSeek V4 API 工作负载很少需要分块处理。

价格

积分计费 — 1 积分 = 0.001 美元，仅为成功生成付费。

类别	单位	价格
DeepSeek V4 Flash
输入（缓存未命中）	1M tokens	$0.14
输入（缓存命中）	1M tokens	$0.0028
输出	1M tokens	$0.28
DeepSeek V4 Pro
输入（缓存未命中）	1M tokens	$1.74
输入（缓存命中）	1M tokens	$0.0145
输出	1M tokens	$3.48

为什么选 reAPI

OpenAI 兼容、即插即用——还附带 Anthropic 接口

DeepSeek V4 API 完全遵循 OpenAI Chat Completions。把现有 OpenAI 集成迁移到 DeepSeek V4 API，只需改 base URL、API Key 和模型字符串——`deepseek-v4-flash` 或 `deepseek-v4-pro`——而非重写整个平台。同样的 `messages` 数组、同样的流式格式，并为偏好原生 SDK 的调用方提供 Anthropic 风格的原生接口。

前沿推理，超值定价

DeepSeek V4 API 是开源权重模型，定价也与之相称。Pro 在推理、数学和编码上比肩顶级闭源模型，而单 token 成本仅为其零头；Flash 又把价格压低一个数量级，专供日常流量。用 Pro 跑高端任务，把大流量调用路由到 Flash，全在同一个 Key 上完成。

一个 Key 打通 DeepSeek、GPT、Claude 与 Gemini

一个 api.reapi.ai 的 Key 即可解锁 DeepSeek V4 API，连同 GPT-5.5、Claude Opus 4.8、Gemini 以及平台上的所有其他前沿对话模型。只需改一处配置，就能比较各家厂商、添加兜底方案、按调用粒度路由流量，而不必启动一个集成项目。

DeepSeek V4 对比 DeepSeek V3.2

相比 V3.2，DeepSeek V4 API 是一次跨代飞跃——更大的上下文窗口、两档模型、默认开启思考、视觉，以及面向智能体的调优。以下是两代之间的变化。

能力

reAPI 上的 DeepSeek V4 API

DeepSeek V3.2

模型阵容

两个变体——Flash（284B / 激活 13B）与 Pro（1.6T / 激活 49B）——共用同一个 API Key。

单一的 chat / reasoner 模型线。

上下文窗口

默认 1M token，搭配 DeepSeek Sparse Attention 实现高效长上下文。

128K token 上下文窗口。

最大输出

单次响应最多 384K 输出 token。

输出上限明显更小。

思考模式

默认开启，提供思考 / 非思考双模式切换，思维链放在 `reasoning_content` 中。

推理需通过独立的 reasoner 模型实现。

视觉输入

同一端点支持图像输入（beta）。

仅支持文本。

智能体调优

专门的智能体优化；已与领先的编码智能体框架集成；据 DeepSeek 称在智能体编码上取得开源 SOTA。

一款能力出色的通用模型，但不具备 V4 的智能体专项调优。

本对比反映 DeepSeek V4 发布说明与模型文档在撰写时已公开记录的行为。部分基准数据为厂商自报。模型行为与定价可能变动；当前数值请以上方价格卡和 API 文档为准。

三步上线 DeepSeek V4 API

step 01
在 api.reapi.ai 上注册账号并创建 Key
前往 api.reapi.ai 注册，打开控制台，在 API Keys 下生成一个 API Key，并在 Top Up 下充值 token。聊天工作区与 reapi.ai 的图像/视频网关相互独立——Key 不能跨用。
打开
step 02
发送你的第一个请求
向 https://api.reapi.ai/v1/chat/completions 发 POST 请求，`model` 设为 `deepseek-v4-flash`（或 `deepseek-v4-pro`），带上你的 `messages` 数组和 `max_tokens`。DeepSeek V4 API 端点与 OpenAI 兼容，含流式响应；切换模型只需改一行。
打开
step 03
针对成本与推理进行调优
在 DeepSeek V4 API 中，延迟敏感、高吞吐的任务选 Flash，需要深度推理的任务选 Pro。复用稳定的系统提示词以命中极低的缓存读取费率，并在不需要时关闭思考模式，以获得最快、最便宜的回复。
打开

常见问题

关于此模型的常见疑问。

DeepSeek V4 API 按用量以美元计费，从你的 api.reapi.ai token 余额中扣除。本页的价格卡展示了 Flash 与 Pro 实时的每 1M token 输入、输出费率，以及缓存命中费率。缓存命中比重新发送相同 token 便宜得多，且失败的请求不收费。

准备好上线了吗？

在 Playground 中试用，或直接获取 API Key 立即接入。

获取 API Key 查看 API 文档

DeepSeek V4 API——Flash 与 Pro，1M 上下文

你能用这个模型做什么

可以用这个模型构建并上线的真实工作流与生产级用例。