DeepSeek V4 Flash와 Pro의 차이는 무엇인가요?

둘 다 DeepSeek V4 API의 일부이며 100만 컨텍스트 윈도, 384K 최대 출력, 사고 모드, 툴 호출을 공유합니다. Flash(284B / 활성 13B)는 자동완성, 배치 분석, 챗봇 백엔드에 적합한 빠르고 저렴한 기본 옵션이고, Pro(1.6조 / 활성 49B)는 깊은 추론, 복잡한 디버깅, 에이전트 코딩을 위한 플래그십입니다. 둘은 하나의 DeepSeek V4 API 키를 공유하므로 요청마다 섞어 쓸 수 있습니다.

DeepSeek V4 API는 OpenAI 호환인가요?

네. DeepSeek V4 API는 OpenAI의 /v1/chat/completions를 그대로 대체하는 드롭인입니다. 동일한 요청 형태, 동일한 `messages` 배열, 동일한 `stream` / `temperature` / `max_tokens` 파라미터, 동일한 SSE 와이어 형식을 씁니다. 대부분의 팀은 base URL을 https://api.reapi.ai/v1로 바꾸고, API 키를 교체하고, `model`을 `deepseek-v4-flash`나 `deepseek-v4-pro`로 설정하는 것으로 마이그레이션을 마칩니다.

DeepSeek V4의 컨텍스트 윈도는 얼마인가요?

DeepSeek V4 API의 두 모델 모두 기본 컨텍스트 윈도가 100만 토큰이며 응답당 최대 384K 출력 토큰을 지원합니다. DeepSeek Sparse Attention이 롱컨텍스트 추론을 효율적으로 유지하므로 리포지토리 전체와 긴 문서를 청크 분할 없이 넣을 수 있습니다.

사고 모드는 어떻게 동작하며, 끌 수 있나요?

DeepSeek V4는 기본적으로 사고 모드로 동작합니다. 최종 답변 전에 체인 오브 소트를 생성하고 이를 `content` 옆 `reasoning_content` 필드로 반환합니다. 지연에 민감하거나 단순한 호출에서는 비사고 모드로 전환해 더 빠르고 저렴한 응답을 받을 수 있으며, 모델 id는 그대로 유지됩니다.

DeepSeek V4 API는 비전과 툴 호출을 지원하나요?

네. DeepSeek V4 API는 같은 호출에서 텍스트와 함께 이미지 입력(베타)을 받으며, 함수 호출/툴 사용과 JSON 출력을 지원합니다. 에이전트형 다단계 워크플로에 맞춰 튜닝되었고 주요 코딩 에이전트 하니스와 통합됩니다.

DeepSeek V4는 DeepSeek V3.2와 어떻게 다른가요?

DeepSeek V4 API는 기본 컨텍스트 윈도를 100만 토큰으로(128K에서) 끌어올렸고, 하나가 아닌 두 변형(Flash와 Pro)으로 나뉘며, 사고/비사고 이중 모드와 함께 사고 모드를 기본 활성화했고, 비전 입력을 추가했으며, 전용 에이전트 최적화를 제공합니다. Pro는 오픈웨이트를 유지하면서도 추론과 코딩에서 최상위 클로즈드 소스 모델과 견줍니다.

API 키 생성과 토큰 구매는 어디서 하나요?

둘 다 api.reapi.ai에서 이뤄집니다. 채팅 워크스페이스는 reapi.ai의 이미지/영상 작업 게이트웨이와 별개의 독립 플랫폼으로 운영됩니다. api.reapi.ai에서 가입하고, API Keys에서 키를 생성하고, Top Up에서 충전하세요. reapi.ai/settings/apikeys 키는 채팅 엔드포인트에서 인증되지 않습니다.

DeepSeek V4 API — Flash & Pro, 1M 컨텍스트

DeepSeek V4 API는 OpenAI 호환 엔드포인트 하나에 두 가지 오픈웨이트 모델을 제공합니다. 빠르고 저렴한 일상 작업에는 Flash, 프런티어급 추론·에이전트 코딩·STEM에는 Pro를 쓰세요. 두 모델 모두 100만 토큰 컨텍스트 윈도, 384K 최대 출력, 기본 활성화된 사고 모드, 비전 입력, 툴 호출, 컨텍스트 캐싱을 갖췄습니다. USD 기준 사용한 만큼 과금됩니다.

DeepSeek V4modeldeepseek-v4-flash

DeepSeek V4 playground

Open the chat playground to run DeepSeek V4 through the standard chat completions surface with your api.reapi.ai key.

Open chat playground

이 모델로 만들 수 있는 것

이 모델로 구축하고 배포할 수 있는 실제 워크플로우와 프로덕션 활용 사례입니다.

DeepSeek V4 Pro로 수행하는 장기 호흡 에이전트 코딩

DeepSeek V4 Pro는 DeepSeek V4 API의 플래그십입니다. 에이전트 코딩, 복잡한 추론, STEM에 맞춰 튜닝된 1.6조 파라미터(활성 49B) 전문가 혼합(MoE) 모델입니다. DeepSeek는 에이전트 코딩 벤치마크에서 오픈소스 최고 수준의 결과를 보고했으며, V4는 Claude Code, OpenClaw, OpenCode 같은 에이전트 하니스와 통합되어 있습니다. 코딩 에이전트를 DeepSeek V4 API에 연결하면 작업 범위를 정하고, 툴을 호출하며, 다단계 작업을 한 번의 실행으로 추론해 냅니다.

API 문서 읽기

DeepSeek V4 Flash로 처리하는 고처리량·저비용 작업

DeepSeek V4 Flash는 DeepSeek V4 API의 고속 라인입니다. 284B 파라미터(활성 13B)로, 비용은 일부에 불과하면서 추론 능력은 Pro에 근접합니다. IDE 내 자동완성, 인라인 제안, CI 단계 코드 리뷰, 대량 요약, 챗봇 백엔드에 DeepSeek V4 API를 활용하세요. 컨텍스트 캐싱이 반복되는 시스템 프롬프트와 툴 스키마를 낮은 캐시 히트 단가로 줄여 주므로, 에이전트 루프와 대량 트래픽도 저렴하게 유지됩니다.

100만 토큰 규모의 코드베이스 및 문서 분석

DeepSeek V4 API의 두 모델 모두 기본 컨텍스트 윈도가 100만 토큰입니다. 중간 규모 리포지토리 전체, 긴 리서치 자료 묶음, 멀티턴 에이전트 트레이스를 한 번의 호출에 담기 충분합니다. DeepSeek Sparse Attention이 롱컨텍스트 추론을 효율적으로 유지하므로, 아키텍처 리뷰·의존성 감사·마이그레이션 계획 같은 DeepSeek V4 API 워크로드는 대개 청크 분할이 필요 없습니다.

가격

크레딧 기반 — 1 크레딧 = 0.001 USD. 성공한 생성에 대해서만 비용을 지불합니다.

카테고리	단위	가격
DeepSeek V4 Flash
입력 (캐시 미스)	1M tokens	$0.14
입력 (캐시 히트)	1M tokens	$0.0028
출력	1M tokens	$0.28
DeepSeek V4 Pro
입력 (캐시 미스)	1M tokens	$1.74
입력 (캐시 히트)	1M tokens	$0.0145
출력	1M tokens	$3.48

reApi를 선택해야 하는 이유

OpenAI 호환 드롭인 — 여기에 Anthropic 인터페이스까지

DeepSeek V4 API는 OpenAI Chat Completions를 그대로 따릅니다. 기존 OpenAI 연동을 DeepSeek V4 API로 옮기는 일은 base URL, API 키, 모델 문자열(`deepseek-v4-flash` 또는 `deepseek-v4-pro`)만 바꾸면 되는 것이지 플랫폼을 다시 짜는 일이 아닙니다. 동일한 `messages` 배열, 동일한 스트리밍 형식, 그리고 이를 선호하는 SDK 호출자를 위한 네이티브 Anthropic 스타일 인터페이스를 제공합니다.

가성비 가격에 누리는 프런티어급 추론

DeepSeek V4 API는 오픈웨이트이며 가격도 거기에 맞춰져 있습니다. Pro는 추론·수학·코딩에서 최상위 클로즈드 소스 모델과 견주면서도 토큰당 비용은 그 일부에 불과하고, Flash는 일상 트래픽을 위해 가격을 한 단계 더 낮춥니다. 프리미엄 작업은 Pro에서 돌리고 대량 호출은 같은 키로 Flash에 라우팅하세요.

DeepSeek, GPT, Claude, Gemini를 키 하나로

api.reapi.ai 키 하나면 DeepSeek V4 API는 물론 GPT-5.5, Claude Opus 4.8, Gemini를 비롯해 플랫폼의 모든 프런티어 채팅 모델을 쓸 수 있습니다. 연동 프로젝트가 아니라 설정 변경만으로 벤더를 비교하고, 폴백을 추가하며, 호출마다 트래픽을 라우팅하세요.

DeepSeek V4 vs DeepSeek V3.2

DeepSeek V4 API는 V3.2를 넘어서는 세대 도약입니다. 더 큰 컨텍스트 윈도, 두 가지 모델 티어, 기본 활성화된 사고 모드, 비전, 에이전트 중심 튜닝을 갖췄습니다. 두 버전 사이에 무엇이 바뀌었는지 정리했습니다.

기능

reAPI의 DeepSeek V4 API

DeepSeek V3.2

모델 라인업

두 가지 변형 — Flash(284B / 활성 13B)와 Pro(1.6조 / 활성 49B) — 를 같은 API 키로.

단일 채팅 / 추론 모델 라인.

컨텍스트 윈도

기본 100만 토큰, 효율적 롱컨텍스트를 위한 DeepSeek Sparse Attention 적용.

128K 토큰 컨텍스트 윈도.

최대 출력

응답당 최대 384K 출력 토큰.

현저히 작은 출력 상한.

사고 모드

기본 활성화, 사고 / 비사고 이중 스위치와 `reasoning_content`의 체인 오브 소트 제공.

별도 추론 모델을 통해 추론 제공.

비전 입력

같은 엔드포인트에서 이미지 입력 지원(베타).

텍스트 전용.

에이전트 튜닝

전용 에이전트 최적화, 주요 코딩 에이전트 하니스와 통합, DeepSeek 기준 에이전트 코딩 오픈소스 SOTA.

V4의 에이전트 전용 튜닝이 없는 유능한 범용 모델.

이 비교는 작성 시점의 DeepSeek V4 출시 노트와 모델 문서에 공개된 동작을 반영합니다. 일부 벤치마크 수치는 벤더가 보고한 값입니다. 모델 동작과 가격은 바뀔 수 있으니 현재 값은 위 가격 카드와 API 문서를 확인하세요.

세 단계로 DeepSeek V4 API 출시하기

step 01
api.reapi.ai에서 계정과 키 만들기
api.reapi.ai에서 가입하고 콘솔을 연 다음, API Keys 메뉴에서 API 키를 생성하고 Top Up에서 토큰을 충전하세요. 채팅 워크스페이스는 reapi.ai의 이미지/영상 게이트웨이와 분리되어 있어 키가 서로 통용되지 않습니다.
열기
step 02
첫 요청 보내기
`model`을 `deepseek-v4-flash`(또는 `deepseek-v4-pro`)로 설정하고, `messages` 배열과 `max_tokens`를 담아 https://api.reapi.ai/v1/chat/completions로 POST하세요. DeepSeek V4 API 엔드포인트는 스트리밍 응답을 포함해 OpenAI 호환이며, 한 줄만 바꿔 모델을 전환할 수 있습니다.
열기
step 03
비용과 추론에 맞춰 튜닝하기
DeepSeek V4 API 전반에서, 지연에 민감하고 처리량이 높은 작업에는 Flash를, 깊은 추론이 필요한 작업에는 Pro를 선택하세요. 안정적인 시스템 프롬프트를 재사용해 낮은 캐시 읽기 단가에 닿게 하고, 필요 없을 때는 사고 모드를 꺼서 가장 빠르고 저렴한 응답을 받으세요.
열기

자주 묻는 질문

이 모델에 대한 일반적인 질문입니다.

DeepSeek V4 API는 api.reapi.ai 토큰 잔액에서 USD 기준 사용한 만큼 과금됩니다. 이 페이지의 가격 카드에 Flash와 Pro 모두의 실시간 100만 토큰당 입력·출력 단가와 캐시 히트 단가가 표시됩니다. 캐시 히트는 같은 토큰을 다시 보내는 것보다 훨씬 저렴하며, 실패한 요청은 과금되지 않습니다.

이제 출시할 준비가 되셨나요?

Playground에서 시험해 보거나 API 키를 발급받아 바로 연동해 보세요.

API 키 받기 API 문서 보기

DeepSeek V4 API — Flash & Pro, 1M 컨텍스트

이 모델로 만들 수 있는 것

이 모델로 구축하고 배포할 수 있는 실제 워크플로우와 프로덕션 활용 사례입니다.