对话你能用它做什么
由此模型驱动的真实工作流。

用 DeepSeek V4 Pro 进行长周期智能体编码
DeepSeek V4 Pro 是 DeepSeek V4 API 的旗舰——一款 1.6T 参数的混合专家模型(激活 49B),专为智能体编码、复杂推理与 STEM 调优。DeepSeek 公布其在智能体编码基准上取得开源 SOTA 成绩,V4 已与 Claude Code、OpenClaw、OpenCode 等智能体框架集成。把编码智能体指向 DeepSeek V4 API,它就能在一次运行中界定任务、调用工具并完成多步推理。
阅读 API 文档
用 DeepSeek V4 Flash 处理高吞吐、低成本任务
DeepSeek V4 Flash 是 DeepSeek V4 API 的快车道——284B 参数(激活 13B),其推理能力以极低成本逼近 Pro。可用 DeepSeek V4 API 来做 IDE 内自动补全、行内建议、CI 阶段代码评审、批量摘要以及聊天后端。上下文缓存把重复的系统提示词与工具 schema 削减到极低的缓存命中费率,让智能体循环与大流量场景保持低成本。

百万 token 代码库与文档分析
两款 DeepSeek V4 API 模型默认都采用 1M token 上下文窗口——足以在一次调用中加载整个中型仓库、一份长篇研究资料包或一段多轮智能体轨迹。DeepSeek Sparse Attention 让长上下文推理保持高效,因此架构评审、依赖审计、迁移规划等 DeepSeek V4 API 工作负载很少需要分块处理。
价格
积分计费 — 1 积分 = 0.001 美元,仅为成功生成付费。
| 类别 | 单位 | 价格 |
|---|---|---|
| DeepSeek V4 Flash | ||
| 输入(缓存未命中) | 1M tokens | $0.14 |
| 输入(缓存命中) | 1M tokens | $0.0028 |
| 输出 | 1M tokens | $0.28 |
| DeepSeek V4 Pro | ||
| 输入(缓存未命中) | 1M tokens | $1.74 |
| 输入(缓存命中) | 1M tokens | $0.0145 |
| 输出 | 1M tokens | $3.48 |
为什么选 reAPI
OpenAI 兼容、即插即用——还附带 Anthropic 接口
DeepSeek V4 API 完全遵循 OpenAI Chat Completions。把现有 OpenAI 集成迁移到 DeepSeek V4 API,只需改 base URL、API Key 和模型字符串——`deepseek-v4-flash` 或 `deepseek-v4-pro`——而非重写整个平台。同样的 `messages` 数组、同样的流式格式,并为偏好原生 SDK 的调用方提供 Anthropic 风格的原生接口。
前沿推理,超值定价
DeepSeek V4 API 是开源权重模型,定价也与之相称。Pro 在推理、数学和编码上比肩顶级闭源模型,而单 token 成本仅为其零头;Flash 又把价格压低一个数量级,专供日常流量。用 Pro 跑高端任务,把大流量调用路由到 Flash,全在同一个 Key 上完成。
一个 Key 打通 DeepSeek、GPT、Claude 与 Gemini
一个 api.reapi.ai 的 Key 即可解锁 DeepSeek V4 API,连同 GPT-5.5、Claude Opus 4.8、Gemini 以及平台上的所有其他前沿对话模型。只需改一处配置,就能比较各家厂商、添加兜底方案、按调用粒度路由流量,而不必启动一个集成项目。
DeepSeek V4 对比 DeepSeek V3.2
相比 V3.2,DeepSeek V4 API 是一次跨代飞跃——更大的上下文窗口、两档模型、默认开启思考、视觉,以及面向智能体的调优。以下是两代之间的变化。
本对比反映 DeepSeek V4 发布说明与模型文档在撰写时已公开记录的行为。部分基准数据为厂商自报。模型行为与定价可能变动;当前数值请以上方价格卡和 API 文档为准。
三步上线 DeepSeek V4 API
- step 01
在 api.reapi.ai 上注册账号并创建 Key
前往 api.reapi.ai 注册,打开控制台,在 API Keys 下生成一个 API Key,并在 Top Up 下充值 token。聊天工作区与 reapi.ai 的图像/视频网关相互独立——Key 不能跨用。
打开 - step 02
发送你的第一个请求
向 https://api.reapi.ai/v1/chat/completions 发 POST 请求,`model` 设为 `deepseek-v4-flash`(或 `deepseek-v4-pro`),带上你的 `messages` 数组和 `max_tokens`。DeepSeek V4 API 端点与 OpenAI 兼容,含流式响应;切换模型只需改一行。
打开 - step 03
针对成本与推理进行调优
在 DeepSeek V4 API 中,延迟敏感、高吞吐的任务选 Flash,需要深度推理的任务选 Pro。复用稳定的系统提示词以命中极低的缓存读取费率,并在不需要时关闭思考模式,以获得最快、最便宜的回复。
打开
常见问题
关于此模型的常见疑问。
相关模型
探索同类别的更多模型。
对话
对话Anthropic
Claude Opus 4.7
Anthropic Claude Opus 4.7 — 1M 上下文、128K 输出,专为高端编码与 Agent 推理打造。
对话Anthropic
Claude Sonnet 4.6
Anthropic Claude Sonnet 4.6 — 兼顾质量与速度,胜任日常生产对话、代码评审与中等复杂度的智能体场景。
对话curl https://api.reapi.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v4-flash",
"group": "default",
"messages": [
{ "role": "user", "content": "Hello" }
],
"stream": true,
"max_tokens": 4096,
"temperature": 0.7
}'