DeepSeek V4 Flash と Pro の違いは何ですか？

どちらも DeepSeek V4 API の一部で、1M コンテキストウィンドウ、最大 384K の出力、思考モード、ツール利用を共有します。Flash（284B / アクティブ 13B）はオートコンプリート、バッチ解析、チャットバックエンド向けの高速・低コストなデフォルトです。Pro（1.6T / アクティブ 49B）は深い推論、複雑なデバッグ、エージェント型コーディング向けのフラグシップです。両者は 1 つの DeepSeek V4 API キーを共有し、リクエストごとに使い分けられます。

DeepSeek V4 API は OpenAI 互換ですか？

はい。DeepSeek V4 API は OpenAI の /v1/chat/completions のドロップインです。同じリクエスト形状、同じ `messages` 配列、同じ `stream` / `temperature` / `max_tokens` パラメータ、同じ SSE のワイヤ形式に対応します。多くのチームは、ベース URL を https://api.reapi.ai/v1 に変更し、API キーを差し替え、`model` を `deepseek-v4-flash` または `deepseek-v4-pro` に設定するだけで移行しています。

DeepSeek V4 のコンテキストウィンドウはどれくらいですか？

DeepSeek V4 API の両モデルはデフォルトで 1M トークンのコンテキストウィンドウを備え、1 レスポンスあたり最大 384K の出力トークンに対応します。DeepSeek Sparse Attention により長コンテキストの推論が効率的に保たれるため、リポジトリ全体や長大なドキュメントをチャンク分割せずに投入できます。

思考モードはどう動作し、オフにできますか？

DeepSeek V4 はデフォルトで思考モードで動作します。最終回答の前に chain-of-thought を生成し、それを `content` と並んで `reasoning_content` フィールドで返します。レイテンシに敏感な呼び出しや単純な呼び出しでは、より高速・低コストな応答のために非思考モードへ切り替えられます。モデル ID は同じままです。

DeepSeek V4 API は画像とツール利用に対応していますか？

はい。DeepSeek V4 API は同じ呼び出しでテキストと並んで画像入力（ベータ）を受け付け、function calling / ツール利用に加えて JSON 出力にも対応します。エージェント型の複数ステップワークフロー向けにチューニングされ、主要なコーディングエージェントハーネスと統合されています。

DeepSeek V4 は DeepSeek V3.2 とどう違いますか？

DeepSeek V4 API はデフォルトのコンテキストウィンドウを 1M トークンに引き上げ（128K から）、1 つではなく 2 つのバリアント（Flash と Pro）に分かれ、思考モードをデフォルトで有効にして思考 / 非思考のデュアルモードを備え、画像入力を追加し、専用のエージェント最適化を搭載します。Pro はオープンウェイトを維持しながら、推論とコーディングでトップクラスのクローズドソースモデルに匹敵します。

API キーの作成とトークンの購入はどこで行いますか？

どちらも api.reapi.ai で行います。チャットワークスペースは reapi.ai の画像 / 動画タスクゲートウェイとは別の独立したプラットフォームとして動作します。api.reapi.ai で登録し、API Keys でキーを生成し、Top Up でチャージしてください。reapi.ai/settings/apikeys のキーはチャットエンドポイントでは認証されません。

DeepSeek V4 API — Flash と Pro、1M コンテキスト

DeepSeek V4 API は、OpenAI 互換の単一エンドポイントで 2 つのオープンウェイトモデルを提供します。日常業務を高速・低コストでこなす Flash と、フロンティア級の推論・エージェント型コーディング・STEM に対応する Pro です。どちらも 1M トークンのコンテキストウィンドウ、最大 384K の出力、デフォルトで有効な思考モード、画像入力、ツール利用、コンテキストキャッシュを備えます。米ドル建ての従量課金です。

DeepSeek V4modeldeepseek-v4-flash

DeepSeek V4 playground

Open the chat playground to run DeepSeek V4 through the standard chat completions surface with your api.reapi.ai key.

Open chat playground

このモデルで作れるもの

このモデルで構築して本番に出せる、実際のワークフローとユースケースをご紹介します。

長期視点のエージェント型コーディングセッションを駆動する DeepSeek V4 Pro

DeepSeek V4 Pro による長期視点のエージェント型コーディング

DeepSeek V4 Pro は DeepSeek V4 API のフラグシップで、エージェント型コーディング・複雑な推論・STEM 向けにチューニングされた 1.6T パラメータの mixture-of-experts モデル（アクティブ 49B）です。DeepSeek はエージェント型コーディングのベンチマークでオープンソース最高水準の結果を報告しており、V4 は Claude Code、OpenClaw、OpenCode などのエージェントハーネスと統合されています。コーディングエージェントを DeepSeek V4 API に向ければ、タスクのスコープを定め、ツールを呼び出し、複数ステップの作業を 1 回の実行で推論しながら進めます。

API ドキュメントを読む

高スループットなコーディングとバッチ処理を支える DeepSeek V4 Flash

DeepSeek V4 Flash による高スループット・低コストな処理

DeepSeek V4 Flash は DeepSeek V4 API の高速レーンで、推論性能が Pro に肉薄しながらコストはわずかな 284B パラメータ（アクティブ 13B）のモデルです。DeepSeek V4 API は、IDE 内のオートコンプリート、インライン候補、CI 段階のコードレビュー、大量のサマリ生成、チャットバックエンドに使えます。コンテキストキャッシュは繰り返されるシステムプロンプトやツールスキーマを低いキャッシュヒット単価に切り詰めるため、エージェントループや大量トラフィックでも安価なまま運用できます。

100 万トークン規模のコードベース・ドキュメント解析

DeepSeek V4 API の両モデルは、デフォルトで 1M トークンのコンテキストウィンドウを備えます。中規模のリポジトリ全体、長大なリサーチ資料、複数ターンのエージェントトレースを 1 回の呼び出しで読み込むのに十分です。DeepSeek Sparse Attention により長コンテキストの推論が効率的に保たれるため、アーキテクチャレビュー、依存関係の監査、移行計画といった DeepSeek V4 API のワークロードでチャンク分割が必要になることはめったにありません。

料金

クレジット制 — 1クレジット = 0.001 USD。完了した生成のみお支払いいただきます。

カテゴリ	単位	料金
DeepSeek V4 Flash
入力（キャッシュミス）	1M tokens	$0.14
入力（キャッシュヒット）	1M tokens	$0.0028
出力	1M tokens	$0.28
DeepSeek V4 Pro
入力（キャッシュミス）	1M tokens	$1.74
入力（キャッシュヒット）	1M tokens	$0.0145
出力	1M tokens	$3.48

reApiを選ぶ理由

OpenAI 互換のドロップイン — さらに Anthropic 形式のサーフェスも

DeepSeek V4 API は OpenAI Chat Completions をそのまま話します。既存の OpenAI 連携を DeepSeek V4 API へ移すのに必要なのは、ベース URL、API キー、そしてモデル文字列の変更（`deepseek-v4-flash` または `deepseek-v4-pro`）だけで、プラットフォームの作り直しではありません。同じ `messages` 配列、同じストリーミング形式に加え、好む利用者向けにネイティブな Anthropic 形式のサーフェスも用意されています。

フロンティア級の推論をバリュー価格で

DeepSeek V4 API はオープンウェイトで、価格もそれに見合っています。Pro は推論・数学・コーディングでトップクラスのクローズドソースモデルに匹敵しながら、トークンあたりのコストはそのわずかな一部です。Flash は日常トラフィック向けにさらに一桁価格を下げます。プレミアムな作業は Pro で実行し、大量の呼び出しは同じキーで Flash にルーティングできます。

DeepSeek、GPT、Claude、Gemini を 1 つのキーで

1 つの api.reapi.ai キーで、DeepSeek V4 API を GPT-5.5、Claude Opus 4.8、Gemini など、プラットフォーム上のあらゆるフロンティアチャットモデルと並べて利用できます。設定変更だけで、ベンダーを比較し、フォールバックを追加し、呼び出し単位でトラフィックをルーティングできます。連携プロジェクトを起こす必要はありません。

DeepSeek V4 と DeepSeek V3.2 の比較

DeepSeek V4 API は V3.2 からの世代を超えた飛躍です。より大きなコンテキストウィンドウ、2 つのモデルティア、デフォルトで有効な思考モード、画像対応、エージェント重視のチューニングを備えます。両者の変更点は次のとおりです。

機能

reAPI 上の DeepSeek V4 API

DeepSeek V3.2

モデルラインナップ

2 つのバリアント — Flash（284B / アクティブ 13B）と Pro（1.6T / アクティブ 49B）— を同じ API キーで。

単一の chat / reasoner モデルライン。

コンテキストウィンドウ

デフォルトで 1M トークン。効率的な長コンテキストのための DeepSeek Sparse Attention を搭載。

128K トークンのコンテキストウィンドウ。

最大出力

1 レスポンスあたり最大 384K の出力トークン。

大幅に小さい出力上限。

思考モード

デフォルトで有効。思考 / 非思考のデュアル切り替えと、`reasoning_content` での chain-of-thought を備える。

推論は別の reasoner モデルで利用可能。

画像入力

同じエンドポイントで画像入力に対応（ベータ）。

テキストのみ。

エージェント向けチューニング

専用のエージェント最適化。主要なコーディングエージェントハーネスと統合。DeepSeek によればエージェント型コーディングでオープンソース SOTA。

V4 のエージェント特化チューニングを持たない、能力の高い汎用モデル。

この比較は、執筆時点での DeepSeek の V4 リリースノートおよびモデルドキュメントで公に記載された挙動を反映しています。一部のベンチマークに関する主張はベンダー報告によるものです。モデルの挙動と価格は変わることがあります。最新の値は上の料金カードと API ドキュメントを確認してください。

DeepSeek V4 API を 3 ステップで導入

step 01
api.reapi.ai でアカウントとキーを作成
api.reapi.ai で登録し、コンソールを開き、API Keys でキーを生成し、Top Up でトークンをチャージします。チャットワークスペースは reapi.ai の画像/動画ゲートウェイとは別物で、キーは相互に使えません。
開く
step 02
最初のリクエストを送る
POST https://api.reapi.ai/v1/chat/completions に対し、`model` を `deepseek-v4-flash`（または `deepseek-v4-pro`）に設定し、`messages` 配列と `max_tokens` を指定して送信します。DeepSeek V4 API のエンドポイントはストリーミングレスポンスを含めて OpenAI 互換で、モデルの切り替えは 1 行の変更で済みます。
開く
step 03
コストと推論をチューニング
DeepSeek V4 API では、レイテンシに敏感で高スループットな作業には Flash を、深い推論が必要なタスクには Pro を選びます。安定したシステムプロンプトを再利用して低いキャッシュ読み取り単価を狙い、不要なときは思考モードをオフにして最速・最安の応答を得ます。
開く

よくある質問

このモデルに関するよくある質問。

DeepSeek V4 API は、api.reapi.ai のトークン残高に対して米ドル建ての従量課金で請求されます。このページの料金カードには、Flash と Pro の両方について、100 万トークンあたりの入力・出力のライブ単価とキャッシュヒット単価が表示されます。キャッシュヒットは同じトークンを再送するより劇的に安く、失敗したリクエストは課金されません。

リリースの準備はできましたか？

プレイグラウンドで試すか、APIキーを取得して今すぐ統合しましょう。

API キーを取得 API ドキュメントを見る

DeepSeek V4 API — Flash と Pro、1M コンテキスト

このモデルで作れるもの

このモデルで構築して本番に出せる、実際のワークフローとユースケースをご紹介します。