rreAPI
  • Модели
  • Чат
  • Блог
  • Документация
  • Changelog
Home/Models/DeepSeek V4new

DeepSeek V4 API — Flash и Pro, контекст 1M

DeepSeek V4 API даёт две open-weight модели на одном OpenAI-совместимом эндпоинте: Flash — для быстрой и недорогой повседневной работы, Pro — для передового рассуждения, агентного кодинга и STEM. У обеих контекстное окно 1M токенов, до 384K вывода, режим рассуждения включён по умолчанию, ввод изображений, вызов инструментов и кэширование контекста. Оплата по факту в долларах.

Цена
est$0.14– $3.48за 1M токенов
Получить API-ключДокументация API

Что можно создать

Реальные рабочие процессы на этой модели.

DeepSeek V4 Pro ведёт долгую сессию агентного кодинга

Долгосрочный агентный кодинг с DeepSeek V4 Pro

DeepSeek V4 Pro — флагман DeepSeek V4 API: mixture-of-experts модель на 1,6T параметров (49B активных), настроенная под агентный кодинг, сложное рассуждение и STEM. DeepSeek сообщает о результатах уровня open-source state-of-the-art в бенчмарках агентного кодинга, а V4 интегрирована с агентными оболочками вроде Claude Code, OpenClaw и OpenCode. Направьте кодинг-агента на DeepSeek V4 API — и он сам определит объём задачи, вызовет инструменты и пройдёт многошаговую работу за один прогон.

Читать документацию API
DeepSeek V4 Flash питает высоконагруженный кодинг и пакетные задачи

Высокая пропускная способность и низкая цена с DeepSeek V4 Flash

DeepSeek V4 Flash — скоростная полоса DeepSeek V4 API: 284B параметров (13B активных), чьё рассуждение вплотную приближается к Pro за долю стоимости. Используйте DeepSeek V4 API для автодополнения в IDE, встроенных подсказок, ревью кода на этапе CI, массового реферирования и чат-бэкендов. Кэширование контекста сводит повторяющиеся системные промпты и схемы инструментов к низкой ставке попадания в кэш, так что агентные циклы и высоконагруженный трафик остаются дешёвыми.

DeepSeek V4 рассуждает по подборке для анализа на миллион токенов

Анализ кодовых баз и документов на миллион токенов

Обе модели DeepSeek V4 API по умолчанию используют контекстное окно в 1M токенов — этого хватает, чтобы загрузить целый репозиторий среднего размера, объёмную подборку исследований или многоходовую трассу агента за один вызов. DeepSeek Sparse Attention сохраняет эффективность инференса на длинном контексте, поэтому задачи DeepSeek V4 API вроде архитектурного обзора, аудита зависимостей и планирования миграции редко требуют разбивки на части.

Цены

Оплата кредитами — 1 кредит = $0.001 USD. Платишь только за успешные генерации.

КатегорияЕдиницаЦена
DeepSeek V4 Flash
Ввод (промах кэша)1M tokens
$0.14
Ввод (попадание в кэш)1M tokens
$0.0028
Вывод1M tokens
$0.28
DeepSeek V4 Pro
Ввод (промах кэша)1M tokens
$1.74
Ввод (попадание в кэш)1M tokens
$0.0145
Вывод1M tokens
$3.48

Почему reAPI

Drop-in замена OpenAI — плюс поверхность Anthropic

DeepSeek V4 API дословно говорит на языке OpenAI Chat Completions. Перенос существующей интеграции с OpenAI на DeepSeek V4 API — это смена base URL, API-ключа и строки модели (`deepseek-v4-flash` или `deepseek-v4-pro`), а не переписывание платформы. Тот же массив `messages`, тот же формат стриминга и нативная поверхность в стиле Anthropic для тех, кто вызывает через SDK и предпочитает её.

Передовое рассуждение по выгодной цене

DeepSeek V4 API — open-weight и оценён соответственно. Pro соперничает с топовыми закрытыми моделями в рассуждении, математике и кодинге, стоя при этом долю их цены за токен; Flash снижает цену ещё на порядок для повседневного трафика. Запускайте премиум-задачи на Pro и направляйте высоконагруженные вызовы на Flash с тем же ключом.

Один ключ для DeepSeek, GPT, Claude и Gemini

Единый ключ api.reapi.ai открывает DeepSeek V4 API вместе с GPT-5.5, Claude Opus 4.8, Gemini и любой другой передовой чат-моделью на платформе. Сравнивайте вендоров, добавляйте резервные варианты и маршрутизируйте трафик для каждого вызова изменением конфигурации, а не отдельным интеграционным проектом.

DeepSeek V4 против DeepSeek V3.2

DeepSeek V4 API — поколенческий скачок относительно V3.2: больше контекстное окно, два уровня моделей, рассуждение по умолчанию, зрение и агентная настройка. Вот что изменилось между ними.

Возможность
DeepSeek V4 API на reAPI
DeepSeek V3.2
Линейка моделей
Два варианта — Flash (284B / 13B активных) и Pro (1,6T / 49B активных) — на одном API-ключе.
Одна линейка чат / reasoner.
Контекстное окно
1M токенов по умолчанию, с DeepSeek Sparse Attention для эффективного длинного контекста.
Контекстное окно 128K токенов.
Макс. вывод
До 384K токенов вывода на ответ.
Заметно меньший лимит вывода.
Режим рассуждения
Включён по умолчанию, с переключателем рассуждение / без рассуждения и цепочкой рассуждений в `reasoning_content`.
Рассуждение доступно через отдельную reasoner-модель.
Ввод изображений
Поддержка ввода изображений (бета) на том же эндпоинте.
Только текст.
Агентная настройка
Специальные агентные оптимизации; интеграция с ведущими оболочками кодинг-агентов; по данным DeepSeek — open-source SOTA в агентном кодинге.
Сильная универсальная модель без агентной настройки уровня V4.

Сравнение отражает публично документированное поведение из release notes и документации DeepSeek по V4 на момент написания. Часть заявленных результатов бенчмарков — данные вендора. Поведение модели и цены могут меняться; смотрите карточку цен выше и документацию API для актуальных значений.

Запустите DeepSeek V4 API за три шага

  1. 01
    step 01

    Создайте аккаунт и ключ на api.reapi.ai

    Зарегистрируйтесь на api.reapi.ai, откройте консоль, сгенерируйте API-ключ в разделе API Keys и пополните токены в разделе Top Up. Рабочее пространство чата отделено от шлюза изображений/видео reapi.ai — ключи между ними не действуют.

    Открыть
  2. 02
    step 02

    Отправьте первый запрос

    POST на https://api.reapi.ai/v1/chat/completions с `model`, выставленным в `deepseek-v4-flash` (или `deepseek-v4-pro`), вашим массивом `messages` и `max_tokens`. Эндпоинт DeepSeek V4 API OpenAI-совместимый, включая стримовые ответы; смена модели — это правка в одну строку.

    Открыть
  3. 03
    step 03

    Настройте под цену и рассуждение

    В рамках DeepSeek V4 API берите Flash для задач, чувствительных к задержке и высоконагруженных, и Pro, когда нужно глубокое рассуждение. Переиспользуйте стабильные системные промпты, чтобы попадать в низкую ставку чтения из кэша, и отключайте режим рассуждения для самых быстрых и дешёвых ответов.

    Открыть

Часто задаваемые вопросы

Распространённые вопросы об этой модели.

DeepSeek V4 API тарифицируется по факту в долларах со счёта токенов на api.reapi.ai. Карточка цен на этой странице показывает актуальные ставки за 1M токенов ввода и вывода для Flash и Pro, а также ставку при попадании в кэш. Попадания в кэш заметно дешевле, чем повторная отправка тех же токенов, а за неуспешные запросы плата не взимается.

Похожие модели

Смотрите другие модели той же категории.

Все модели
GPT-5.4 coverЧат

OpenAI

GPT-5.4

GPT-5.4 от OpenAI с контекстом 1M и выходом до 128K — экономичный маршрут GPT.

От $1.00 за 1M токенов
Claude Opus 4.7 coverЧат

Anthropic

Claude Opus 4.7

Claude Opus 4.7 от Anthropic — контекст 1M, выход 128K, премиальный код и агентные рассуждения.

От $2.00 за 1M токенов
Claude Sonnet 4.6 coverЧат

Anthropic

Claude Sonnet 4.6

Claude Sonnet 4.6 от Anthropic — сбалансированное качество и скорость для повседневного продакшен-чата, ревью кода и агентов средней сложности.

От $2.00 за 1M токенов
GPT-5.5 coverЧат

OpenAI

GPT-5.5

OpenAI GPT-5.5 с окном контекста 1M и до 128K выходных токенов — под одним OpenAI-совместимым ключом reAPI.

От $2.00 за 1M токенов
Все модели
docs/api/deepseek-v4

Справочник API

Готовый код и полная таблица параметров.

Открыть полный справочник
curl https://api.reapi.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-flash",
    "group": "default",
    "messages": [
      { "role": "user", "content": "Hello" }
    ],
    "stream": true,
    "max_tokens": 4096,
    "temperature": 0.7
  }'
start building

Готов к запуску?

Попробуй в playground или получи API-ключ для интеграции прямо сейчас.

Получить API-ключДокументация API
rreAPI

reAPI — агрегатор ИИ-API с переключением быстрее секунды, без логирования запросов и одним OpenAI-совместимым эндпоинтом для каждой топовой модели.

GitHubX (Twitter)
Built withLogo of reAPIreAPI
Featured on There's An AI For ThatFeatured on Findly.toolsFazier badgeDang.ai
ai tools code.market
Featured on Twelve Tools
Изображение
  • GPT Image 2
  • Gemini 3 Pro Image
  • Gemini 3.1 Flash Image
  • Gemini 2.5 Flash Image
  • Seedream 5.0 Lite
  • Imagen 4.0
  • Wan 2.7 Image
Видео
  • Seedance 2.0
  • Happy Horse 1.0
  • Vidu Q3
  • Pixverse v6
  • Grok Imagine 1.0
  • VEO 3.1
  • Gemini Omni
  • Wan 2.7 Video
  • Kling Motion Control
LLM
  • Claude Opus 4.8
  • Claude Opus 4.7
  • Claude Sonnet 4.6
  • DeepSeek V4
  • GPT-5.4
  • GPT-5.5
Аудио
  • Mureka V9
  • Vocal Remover
  • Music Extractor
  • Voice Cleaner
  • Multistem Splitter
  • Voice Changer
Текст
  • AI Humanizer
  • AI Text Detector
Инструменты
  • Enhance Video 1.0
·······
© 2026 reAPI. All Rights Reserved.[email protected]
О насКонтактыChangelogПолитика cookieПолитика конфиденциальностиУсловия использования