rreAPI
  • 模型
  • 聊天
  • 博客
  • 文档
  • 更新日志
Home/Models/DeepSeek V4new

DeepSeek V4 API——Flash 与 Pro,1M 上下文

DeepSeek V4 API 在同一个 OpenAI 兼容端点上提供两款开源权重模型——Flash 主打快速、低成本的日常任务,Pro 面向前沿推理、智能体编码与 STEM。两者都具备 1M token 上下文窗口、384K 最大输出、默认开启的思考模式、视觉输入、工具调用与上下文缓存。按用量以美元计费。

价格
est$0.14– $3.48每 1M token
获取 API Key查看 API 文档

你能用它做什么

由此模型驱动的真实工作流。

DeepSeek V4 Pro 驱动一次长周期智能体编码任务

用 DeepSeek V4 Pro 进行长周期智能体编码

DeepSeek V4 Pro 是 DeepSeek V4 API 的旗舰——一款 1.6T 参数的混合专家模型(激活 49B),专为智能体编码、复杂推理与 STEM 调优。DeepSeek 公布其在智能体编码基准上取得开源 SOTA 成绩,V4 已与 Claude Code、OpenClaw、OpenCode 等智能体框架集成。把编码智能体指向 DeepSeek V4 API,它就能在一次运行中界定任务、调用工具并完成多步推理。

阅读 API 文档
DeepSeek V4 Flash 驱动高吞吐编码与批处理任务

用 DeepSeek V4 Flash 处理高吞吐、低成本任务

DeepSeek V4 Flash 是 DeepSeek V4 API 的快车道——284B 参数(激活 13B),其推理能力以极低成本逼近 Pro。可用 DeepSeek V4 API 来做 IDE 内自动补全、行内建议、CI 阶段代码评审、批量摘要以及聊天后端。上下文缓存把重复的系统提示词与工具 schema 削减到极低的缓存命中费率,让智能体循环与大流量场景保持低成本。

DeepSeek V4 跨越百万 token 分析资料包进行推理

百万 token 代码库与文档分析

两款 DeepSeek V4 API 模型默认都采用 1M token 上下文窗口——足以在一次调用中加载整个中型仓库、一份长篇研究资料包或一段多轮智能体轨迹。DeepSeek Sparse Attention 让长上下文推理保持高效,因此架构评审、依赖审计、迁移规划等 DeepSeek V4 API 工作负载很少需要分块处理。

价格

积分计费 — 1 积分 = 0.001 美元,仅为成功生成付费。

类别单位价格
DeepSeek V4 Flash
输入(缓存未命中)1M tokens
$0.14
输入(缓存命中)1M tokens
$0.0028
输出1M tokens
$0.28
DeepSeek V4 Pro
输入(缓存未命中)1M tokens
$1.74
输入(缓存命中)1M tokens
$0.0145
输出1M tokens
$3.48

为什么选 reAPI

OpenAI 兼容、即插即用——还附带 Anthropic 接口

DeepSeek V4 API 完全遵循 OpenAI Chat Completions。把现有 OpenAI 集成迁移到 DeepSeek V4 API,只需改 base URL、API Key 和模型字符串——`deepseek-v4-flash` 或 `deepseek-v4-pro`——而非重写整个平台。同样的 `messages` 数组、同样的流式格式,并为偏好原生 SDK 的调用方提供 Anthropic 风格的原生接口。

前沿推理,超值定价

DeepSeek V4 API 是开源权重模型,定价也与之相称。Pro 在推理、数学和编码上比肩顶级闭源模型,而单 token 成本仅为其零头;Flash 又把价格压低一个数量级,专供日常流量。用 Pro 跑高端任务,把大流量调用路由到 Flash,全在同一个 Key 上完成。

一个 Key 打通 DeepSeek、GPT、Claude 与 Gemini

一个 api.reapi.ai 的 Key 即可解锁 DeepSeek V4 API,连同 GPT-5.5、Claude Opus 4.8、Gemini 以及平台上的所有其他前沿对话模型。只需改一处配置,就能比较各家厂商、添加兜底方案、按调用粒度路由流量,而不必启动一个集成项目。

DeepSeek V4 对比 DeepSeek V3.2

相比 V3.2,DeepSeek V4 API 是一次跨代飞跃——更大的上下文窗口、两档模型、默认开启思考、视觉,以及面向智能体的调优。以下是两代之间的变化。

能力
reAPI 上的 DeepSeek V4 API
DeepSeek V3.2
模型阵容
两个变体——Flash(284B / 激活 13B)与 Pro(1.6T / 激活 49B)——共用同一个 API Key。
单一的 chat / reasoner 模型线。
上下文窗口
默认 1M token,搭配 DeepSeek Sparse Attention 实现高效长上下文。
128K token 上下文窗口。
最大输出
单次响应最多 384K 输出 token。
输出上限明显更小。
思考模式
默认开启,提供思考 / 非思考双模式切换,思维链放在 `reasoning_content` 中。
推理需通过独立的 reasoner 模型实现。
视觉输入
同一端点支持图像输入(beta)。
仅支持文本。
智能体调优
专门的智能体优化;已与领先的编码智能体框架集成;据 DeepSeek 称在智能体编码上取得开源 SOTA。
一款能力出色的通用模型,但不具备 V4 的智能体专项调优。

本对比反映 DeepSeek V4 发布说明与模型文档在撰写时已公开记录的行为。部分基准数据为厂商自报。模型行为与定价可能变动;当前数值请以上方价格卡和 API 文档为准。

三步上线 DeepSeek V4 API

  1. 01
    step 01

    在 api.reapi.ai 上注册账号并创建 Key

    前往 api.reapi.ai 注册,打开控制台,在 API Keys 下生成一个 API Key,并在 Top Up 下充值 token。聊天工作区与 reapi.ai 的图像/视频网关相互独立——Key 不能跨用。

    打开
  2. 02
    step 02

    发送你的第一个请求

    向 https://api.reapi.ai/v1/chat/completions 发 POST 请求,`model` 设为 `deepseek-v4-flash`(或 `deepseek-v4-pro`),带上你的 `messages` 数组和 `max_tokens`。DeepSeek V4 API 端点与 OpenAI 兼容,含流式响应;切换模型只需改一行。

    打开
  3. 03
    step 03

    针对成本与推理进行调优

    在 DeepSeek V4 API 中,延迟敏感、高吞吐的任务选 Flash,需要深度推理的任务选 Pro。复用稳定的系统提示词以命中极低的缓存读取费率,并在不需要时关闭思考模式,以获得最快、最便宜的回复。

    打开

常见问题

关于此模型的常见疑问。

DeepSeek V4 API 按用量以美元计费,从你的 api.reapi.ai token 余额中扣除。本页的价格卡展示了 Flash 与 Pro 实时的每 1M token 输入、输出费率,以及缓存命中费率。缓存命中比重新发送相同 token 便宜得多,且失败的请求不收费。

相关模型

探索同类别的更多模型。

查看全部模型
GPT-5.4 cover对话

OpenAI

GPT-5.4

OpenAI GPT-5.4,1M 上下文与 128K 最大输出——经济实惠的 GPT 通道。

起 $1.00 每 1M tokens
Claude Opus 4.7 cover对话

Anthropic

Claude Opus 4.7

Anthropic Claude Opus 4.7 — 1M 上下文、128K 输出,专为高端编码与 Agent 推理打造。

起 $2.00 每 1M tokens
Claude Sonnet 4.6 cover对话

Anthropic

Claude Sonnet 4.6

Anthropic Claude Sonnet 4.6 — 兼顾质量与速度,胜任日常生产对话、代码评审与中等复杂度的智能体场景。

起 $2.00 每 1M Token
GPT-5.5 cover对话

OpenAI

GPT-5.5

OpenAI 的 GPT-5.5,1M 上下文 + 128K 最大输出,一个 OpenAI 兼容的 reAPI Key 即可调用。

起 $2.00 每 1M tokens
查看全部模型
docs/api/deepseek-v4

API 参考

复制即用的代码片段与完整参数表。

查看完整参考文档
curl https://api.reapi.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-flash",
    "group": "default",
    "messages": [
      { "role": "user", "content": "Hello" }
    ],
    "stream": true,
    "max_tokens": 4096,
    "temperature": 0.7
  }'
start building

准备好上线了吗?

在 Playground 中试用,或直接获取 API Key 立即接入。

获取 API Key查看 API 文档
rreAPI

reAPI 是 AI API 聚合站,提供亚秒级故障切换、不记录请求内容,一个 OpenAI 兼容端点直达所有顶级模型。

GitHubX (Twitter)
Built withLogo of reAPIreAPI
Featured on There's An AI For ThatFeatured on Findly.toolsFazier badgeDang.ai
ai tools code.market
Featured on Twelve Tools
图像
  • GPT Image 2
  • Gemini 3 Pro Image
  • Gemini 3.1 Flash Image
  • Gemini 2.5 Flash Image
  • Seedream 5.0 Lite
  • Imagen 4.0
  • Wan 2.7 Image
视频
  • Seedance 2.0
  • Happy Horse 1.0
  • Vidu Q3
  • Pixverse v6
  • Grok Imagine 1.0
  • VEO 3.1
  • Gemini Omni
  • Wan 2.7 Video
  • Kling Motion Control
LLM
  • Claude Opus 4.8
  • Claude Opus 4.7
  • Claude Sonnet 4.6
  • DeepSeek V4
  • GPT-5.4
  • GPT-5.5
音频
  • Mureka V9
  • Vocal Remover
  • Music Extractor
  • Voice Cleaner
  • Multistem Splitter
  • Voice Changer
文本
  • AI Humanizer
  • AI Text Detector
工具
  • Enhance Video 1.0
·······
© 2026 reAPI. All Rights Reserved.[email protected]
关于我们联系我们更新日志Cookie政策隐私政策服务条款