채팅이런 것을 만들 수 있습니다
이 모델로 구동되는 실제 워크플로우입니다.

DeepSeek V4 Pro로 수행하는 장기 호흡 에이전트 코딩
DeepSeek V4 Pro는 DeepSeek V4 API의 플래그십입니다. 에이전트 코딩, 복잡한 추론, STEM에 맞춰 튜닝된 1.6조 파라미터(활성 49B) 전문가 혼합(MoE) 모델입니다. DeepSeek는 에이전트 코딩 벤치마크에서 오픈소스 최고 수준의 결과를 보고했으며, V4는 Claude Code, OpenClaw, OpenCode 같은 에이전트 하니스와 통합되어 있습니다. 코딩 에이전트를 DeepSeek V4 API에 연결하면 작업 범위를 정하고, 툴을 호출하며, 다단계 작업을 한 번의 실행으로 추론해 냅니다.
API 문서 읽기
DeepSeek V4 Flash로 처리하는 고처리량·저비용 작업
DeepSeek V4 Flash는 DeepSeek V4 API의 고속 라인입니다. 284B 파라미터(활성 13B)로, 비용은 일부에 불과하면서 추론 능력은 Pro에 근접합니다. IDE 내 자동완성, 인라인 제안, CI 단계 코드 리뷰, 대량 요약, 챗봇 백엔드에 DeepSeek V4 API를 활용하세요. 컨텍스트 캐싱이 반복되는 시스템 프롬프트와 툴 스키마를 낮은 캐시 히트 단가로 줄여 주므로, 에이전트 루프와 대량 트래픽도 저렴하게 유지됩니다.

100만 토큰 규모의 코드베이스 및 문서 분석
DeepSeek V4 API의 두 모델 모두 기본 컨텍스트 윈도가 100만 토큰입니다. 중간 규모 리포지토리 전체, 긴 리서치 자료 묶음, 멀티턴 에이전트 트레이스를 한 번의 호출에 담기 충분합니다. DeepSeek Sparse Attention이 롱컨텍스트 추론을 효율적으로 유지하므로, 아키텍처 리뷰·의존성 감사·마이그레이션 계획 같은 DeepSeek V4 API 워크로드는 대개 청크 분할이 필요 없습니다.
가격
크레딧 기반 — 1 크레딧 = 0.001 USD. 성공한 생성에 대해서만 비용을 지불합니다.
| 카테고리 | 단위 | 가격 |
|---|---|---|
| DeepSeek V4 Flash | ||
| 입력 (캐시 미스) | 1M tokens | $0.14 |
| 입력 (캐시 히트) | 1M tokens | $0.0028 |
| 출력 | 1M tokens | $0.28 |
| DeepSeek V4 Pro | ||
| 입력 (캐시 미스) | 1M tokens | $1.74 |
| 입력 (캐시 히트) | 1M tokens | $0.0145 |
| 출력 | 1M tokens | $3.48 |
reApi를 선택해야 하는 이유
OpenAI 호환 드롭인 — 여기에 Anthropic 인터페이스까지
DeepSeek V4 API는 OpenAI Chat Completions를 그대로 따릅니다. 기존 OpenAI 연동을 DeepSeek V4 API로 옮기는 일은 base URL, API 키, 모델 문자열(`deepseek-v4-flash` 또는 `deepseek-v4-pro`)만 바꾸면 되는 것이지 플랫폼을 다시 짜는 일이 아닙니다. 동일한 `messages` 배열, 동일한 스트리밍 형식, 그리고 이를 선호하는 SDK 호출자를 위한 네이티브 Anthropic 스타일 인터페이스를 제공합니다.
가성비 가격에 누리는 프런티어급 추론
DeepSeek V4 API는 오픈웨이트이며 가격도 거기에 맞춰져 있습니다. Pro는 추론·수학·코딩에서 최상위 클로즈드 소스 모델과 견주면서도 토큰당 비용은 그 일부에 불과하고, Flash는 일상 트래픽을 위해 가격을 한 단계 더 낮춥니다. 프리미엄 작업은 Pro에서 돌리고 대량 호출은 같은 키로 Flash에 라우팅하세요.
DeepSeek, GPT, Claude, Gemini를 키 하나로
api.reapi.ai 키 하나면 DeepSeek V4 API는 물론 GPT-5.5, Claude Opus 4.8, Gemini를 비롯해 플랫폼의 모든 프런티어 채팅 모델을 쓸 수 있습니다. 연동 프로젝트가 아니라 설정 변경만으로 벤더를 비교하고, 폴백을 추가하며, 호출마다 트래픽을 라우팅하세요.
DeepSeek V4 vs DeepSeek V3.2
DeepSeek V4 API는 V3.2를 넘어서는 세대 도약입니다. 더 큰 컨텍스트 윈도, 두 가지 모델 티어, 기본 활성화된 사고 모드, 비전, 에이전트 중심 튜닝을 갖췄습니다. 두 버전 사이에 무엇이 바뀌었는지 정리했습니다.
이 비교는 작성 시점의 DeepSeek V4 출시 노트와 모델 문서에 공개된 동작을 반영합니다. 일부 벤치마크 수치는 벤더가 보고한 값입니다. 모델 동작과 가격은 바뀔 수 있으니 현재 값은 위 가격 카드와 API 문서를 확인하세요.
세 단계로 DeepSeek V4 API 출시하기
- step 01
api.reapi.ai에서 계정과 키 만들기
api.reapi.ai에서 가입하고 콘솔을 연 다음, API Keys 메뉴에서 API 키를 생성하고 Top Up에서 토큰을 충전하세요. 채팅 워크스페이스는 reapi.ai의 이미지/영상 게이트웨이와 분리되어 있어 키가 서로 통용되지 않습니다.
열기 - step 02
첫 요청 보내기
`model`을 `deepseek-v4-flash`(또는 `deepseek-v4-pro`)로 설정하고, `messages` 배열과 `max_tokens`를 담아 https://api.reapi.ai/v1/chat/completions로 POST하세요. DeepSeek V4 API 엔드포인트는 스트리밍 응답을 포함해 OpenAI 호환이며, 한 줄만 바꿔 모델을 전환할 수 있습니다.
열기 - step 03
비용과 추론에 맞춰 튜닝하기
DeepSeek V4 API 전반에서, 지연에 민감하고 처리량이 높은 작업에는 Flash를, 깊은 추론이 필요한 작업에는 Pro를 선택하세요. 안정적인 시스템 프롬프트를 재사용해 낮은 캐시 읽기 단가에 닿게 하고, 필요 없을 때는 사고 모드를 꺼서 가장 빠르고 저렴한 응답을 받으세요.
열기
자주 묻는 질문
이 모델에 대한 일반적인 질문입니다.
관련 모델
같은 카테고리의 다른 모델도 살펴보세요.
채팅
채팅Anthropic
Claude Opus 4.7
Anthropic의 Claude Opus 4.7 — 1M 컨텍스트, 128K 출력, 프리미엄 코딩과 에이전트 추론.
채팅Anthropic
Claude Sonnet 4.6
Anthropic Claude Sonnet 4.6 — 일상적인 프로덕션 채팅, 코드 리뷰, 중간 복잡도 에이전트를 위한 균형 잡힌 품질과 속도.
채팅curl https://api.reapi.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v4-flash",
"group": "default",
"messages": [
{ "role": "user", "content": "Hello" }
],
"stream": true,
"max_tokens": 4096,
"temperature": 0.7
}'