チャットDeepSeek V4 API — Flash と Pro、1M コンテキスト
DeepSeek V4 API は、OpenAI 互換の単一エンドポイントで 2 つのオープンウェイトモデルを提供します。日常業務を高速・低コストでこなす Flash と、フロンティア級の推論・エージェント型コーディング・STEM に対応する Pro です。どちらも 1M トークンのコンテキストウィンドウ、最大 384K の出力、デフォルトで有効な思考モード、画像入力、ツール利用、コンテキストキャッシュを備えます。米ドル建ての従量課金です。
できること
このモデルが支える実際のワークフロー。

DeepSeek V4 Pro による長期視点のエージェント型コーディング
DeepSeek V4 Pro は DeepSeek V4 API のフラグシップで、エージェント型コーディング・複雑な推論・STEM 向けにチューニングされた 1.6T パラメータの mixture-of-experts モデル(アクティブ 49B)です。DeepSeek はエージェント型コーディングのベンチマークでオープンソース最高水準の結果を報告しており、V4 は Claude Code、OpenClaw、OpenCode などのエージェントハーネスと統合されています。コーディングエージェントを DeepSeek V4 API に向ければ、タスクのスコープを定め、ツールを呼び出し、複数ステップの作業を 1 回の実行で推論しながら進めます。
API ドキュメントを読む
DeepSeek V4 Flash による高スループット・低コストな処理
DeepSeek V4 Flash は DeepSeek V4 API の高速レーンで、推論性能が Pro に肉薄しながらコストはわずかな 284B パラメータ(アクティブ 13B)のモデルです。DeepSeek V4 API は、IDE 内のオートコンプリート、インライン候補、CI 段階のコードレビュー、大量のサマリ生成、チャットバックエンドに使えます。コンテキストキャッシュは繰り返されるシステムプロンプトやツールスキーマを低いキャッシュヒット単価に切り詰めるため、エージェントループや大量トラフィックでも安価なまま運用できます。

100 万トークン規模のコードベース・ドキュメント解析
DeepSeek V4 API の両モデルは、デフォルトで 1M トークンのコンテキストウィンドウを備えます。中規模のリポジトリ全体、長大なリサーチ資料、複数ターンのエージェントトレースを 1 回の呼び出しで読み込むのに十分です。DeepSeek Sparse Attention により長コンテキストの推論が効率的に保たれるため、アーキテクチャレビュー、依存関係の監査、移行計画といった DeepSeek V4 API のワークロードでチャンク分割が必要になることはめったにありません。
料金
クレジット制 — 1クレジット = 0.001 USD。完了した生成のみお支払いいただきます。
| カテゴリ | 単位 | 料金 |
|---|---|---|
| DeepSeek V4 Flash | ||
| 入力(キャッシュミス) | 1M tokens | $0.14 |
| 入力(キャッシュヒット) | 1M tokens | $0.0028 |
| 出力 | 1M tokens | $0.28 |
| DeepSeek V4 Pro | ||
| 入力(キャッシュミス) | 1M tokens | $1.74 |
| 入力(キャッシュヒット) | 1M tokens | $0.0145 |
| 出力 | 1M tokens | $3.48 |
reApiを選ぶ理由
OpenAI 互換のドロップイン — さらに Anthropic 形式のサーフェスも
DeepSeek V4 API は OpenAI Chat Completions をそのまま話します。既存の OpenAI 連携を DeepSeek V4 API へ移すのに必要なのは、ベース URL、API キー、そしてモデル文字列の変更(`deepseek-v4-flash` または `deepseek-v4-pro`)だけで、プラットフォームの作り直しではありません。同じ `messages` 配列、同じストリーミング形式に加え、好む利用者向けにネイティブな Anthropic 形式のサーフェスも用意されています。
フロンティア級の推論をバリュー価格で
DeepSeek V4 API はオープンウェイトで、価格もそれに見合っています。Pro は推論・数学・コーディングでトップクラスのクローズドソースモデルに匹敵しながら、トークンあたりのコストはそのわずかな一部です。Flash は日常トラフィック向けにさらに一桁価格を下げます。プレミアムな作業は Pro で実行し、大量の呼び出しは同じキーで Flash にルーティングできます。
DeepSeek、GPT、Claude、Gemini を 1 つのキーで
1 つの api.reapi.ai キーで、DeepSeek V4 API を GPT-5.5、Claude Opus 4.8、Gemini など、プラットフォーム上のあらゆるフロンティアチャットモデルと並べて利用できます。設定変更だけで、ベンダーを比較し、フォールバックを追加し、呼び出し単位でトラフィックをルーティングできます。連携プロジェクトを起こす必要はありません。
DeepSeek V4 と DeepSeek V3.2 の比較
DeepSeek V4 API は V3.2 からの世代を超えた飛躍です。より大きなコンテキストウィンドウ、2 つのモデルティア、デフォルトで有効な思考モード、画像対応、エージェント重視のチューニングを備えます。両者の変更点は次のとおりです。
この比較は、執筆時点での DeepSeek の V4 リリースノートおよびモデルドキュメントで公に記載された挙動を反映しています。一部のベンチマークに関する主張はベンダー報告によるものです。モデルの挙動と価格は変わることがあります。最新の値は上の料金カードと API ドキュメントを確認してください。
DeepSeek V4 API を 3 ステップで導入
- step 01
api.reapi.ai でアカウントとキーを作成
api.reapi.ai で登録し、コンソールを開き、API Keys でキーを生成し、Top Up でトークンをチャージします。チャットワークスペースは reapi.ai の画像/動画ゲートウェイとは別物で、キーは相互に使えません。
開く - step 02
最初のリクエストを送る
POST https://api.reapi.ai/v1/chat/completions に対し、`model` を `deepseek-v4-flash`(または `deepseek-v4-pro`)に設定し、`messages` 配列と `max_tokens` を指定して送信します。DeepSeek V4 API のエンドポイントはストリーミングレスポンスを含めて OpenAI 互換で、モデルの切り替えは 1 行の変更で済みます。
開く - step 03
コストと推論をチューニング
DeepSeek V4 API では、レイテンシに敏感で高スループットな作業には Flash を、深い推論が必要なタスクには Pro を選びます。安定したシステムプロンプトを再利用して低いキャッシュ読み取り単価を狙い、不要なときは思考モードをオフにして最速・最安の応答を得ます。
開く
よくある質問
このモデルに関するよくある質問。
関連モデル
同じカテゴリの他のモデルもチェック。
チャット
チャットAnthropic
Claude Opus 4.7
Anthropic の Claude Opus 4.7 — 1M コンテキスト、128K 出力、最上位のコーディングとエージェント推論。
チャットAnthropic
Claude Sonnet 4.6
Anthropic の Claude Sonnet 4.6 — 日常的な本番チャット、コードレビュー、中程度の複雑度のエージェントに、品質と速度のバランスを提供します。
チャットcurl https://api.reapi.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v4-flash",
"group": "default",
"messages": [
{ "role": "user", "content": "Hello" }
],
"stream": true,
"max_tokens": 4096,
"temperature": 0.7
}'