MiniMax M3 支持标准 chat-completions 格式吗？

是的。MiniMax M3 可即插即用地替代 OpenAI 的 /v1/chat/completions——同样的请求结构、同样的 `messages` 数组、同样的 `stream` / `temperature` / `max_tokens` 参数、同样的 SSE 传输格式。大多数团队的迁移方式是：把 base URL 改成 https://api.reapi.ai/v1，换上 API key，再把 `model` 设为 `minimax/minimax-m3`。

MiniMax M3 的上下文窗口和最大输出是多少？

MiniMax M3 默认 1M token 上下文窗口（保证最低 512K），每次响应最高支持 512K 输出 token，推荐 128K。MiniMax Sparse Attention 让长上下文推理保持高效，因此你可以喂入整个仓库和长文档而无需分块。

MiniMax M3 是推理模型吗？

是的。MiniMax M3 是一款原生思考模型，先思考再作答，并支持在工具调用过程中交错思考。思考默认自适应——难任务上推理，简单任务上直接作答——你也可以关闭它，以获得最快、最省的回复。无论哪种方式，模型 id 都保持不变。

MiniMax M3 支持视觉和工具调用吗？

是的。MiniMax M3 原生多模态：在同一次调用里，它接受图像和视频输入连同文本，并支持带 JSON 输出的 function calling / 工具调用。它针对混合视觉、检索与代码的智能体多步工作流做了调优。

MiniMax M3 与 DeepSeek V4 等前沿模型相比如何？

MiniMax M3 和 DeepSeek V4 都是开放权重、超值定价的模型，具备 1M 上下文、思考与工具调用。MiniMax 把 M3 定位在前沿编程与智能体基准，外加原生的图像与视频多模态；MiniMax 报告称 M3 在软件工程任务上跻身顶级闭源模型行列。本页的对比表会拆解这些差异。全都在一把 api.reapi.ai key 上，所以你可以按请求对它们做 A/B。

MiniMax M3 支持提示词缓存吗？

是的。MiniMax M3 会缓存稳定的提示词前缀，缓存读取只按标准输入价的一个小零头计费。跨调用复用同样的 system 提示词和工具 schema，折扣会自动应用到重复的 token 上——对于长上下文智能体和聊天机器人，这是一笔大省。

我在哪里创建 API key 和购买 token？

两者都在 api.reapi.ai 上完成——聊天工作区作为独立平台运行，与 reapi.ai 上的图像 / 视频任务网关分开。在 api.reapi.ai 注册，在 API Keys 下生成一把 key，并在 Top Up 下充值。一把 reapi.ai/settings/apikeys 的 key 无法在 MiniMax M3 聊天端点上通过认证。

MiniMax M3 — 前沿编程，1M 上下文

MiniMax M3 是一款开放权重模型，在前沿编程与智能体基准之外，还配备 1M token 上下文窗口和原生多模态输入。MiniMax M3 先思考再作答，能在长程任务中调用工具，并在同一次调用里读取图像和视频——在 api.reapi.ai 上以即插即用的通用端点暴露。按量付费、以美元计价，价格只是闭源前沿模型的零头。

MiniMax M3modelminimax/minimax-m3

MiniMax M3 playground

Open the chat playground to run MiniMax M3 through the standard chat completions surface with your api.reapi.ai key.

Open chat playground

你能用这个模型做什么

可以用这个模型构建并上线的真实工作流与生产级用例。

长程智能体编程与软件工程

智能体编程是 MiniMax M3 的招牌。MiniMax 报告称其在软件工程基准上达到前沿水平——SWE-Bench Pro 上 59.0%，Terminal-Bench 2.1 上 66.0%——让 MiniMax M3 在保持开放权重的同时，跻身顶级闭源编程模型的行列。把一个编程智能体对准 MiniMax M3，它就能界定任务范围、调用工具、推演多步工作并在长程运行中自我纠错，全程都在同一个会话里完成。

查看 API 文档

百万 token 代码库与文档分析

MiniMax M3 默认 1M token 上下文窗口——足以在一次调用里装下整个中型仓库、一份长篇研究材料，或一段多轮智能体轨迹。MiniMax Sparse Attention 让长上下文推理保持高效，因此架构评审、依赖审计、迁移规划这类 MiniMax M3 工作负载很少需要分块。稳定的提示词前缀在每次重复时都能命中低廉的缓存读取价。

原生多模态理解与工具调用

MiniMax M3 从底层就是多模态的：在同一次 Chat Completions 调用里，连同文本一起发送图像和视频——截图、示意图、文档扫描件和短片——模型会对这一切进行推理。配合可靠的 function calling 与 JSON 输出，MiniMax M3 能驱动浏览器智能体、文档流水线，以及混合视觉、检索与代码的工具调用工作流。

价格

积分计费 — 1 积分 = 0.001 美元，仅为成功生成付费。

类别	单位	价格
Token 计价
输入	1M tokens	$0.6
输出	1M tokens	$2.4
缓存读取	1M tokens	$0.12

为什么选 reAPI

通用即插即用

MiniMax M3 原汁原味地讲 OpenAI Chat Completions。把现有的 OpenAI 集成迁到 MiniMax M3，只是改 base URL、API key 和一个模型字符串——`minimax/minimax-m3`——而不是重写平台。同一个 `messages` 数组、同一套流式格式、同样的工具调用结构。

前沿编程，超值定价

MiniMax M3 开放权重，定价也与之相称。它交出前沿级的编程与智能体基准成绩，每 token 成本却只是闭源模型的零头——而提示词缓存还会在重复上下文上再压一次价。无需高昂的每 token 账单，也能跑出高端的智能体工作。

一把 key 通吃 MiniMax、GPT、Claude 与 Gemini

一把 api.reapi.ai key，就能在解锁 MiniMax M3 的同时，用上 GPT-5.5、Claude Opus 4.8、DeepSeek V4、Gemini，以及平台上每一款前沿对话模型。只需改一处配置，就能比较厂商、加上 fallback、按调用路由流量，而不必另起一个集成项目。

MiniMax M3 对比 DeepSeek V4

MiniMax M3 和 DeepSeek V4 都是开放权重、超值定价的模型，具备 1M token 上下文窗口、思考与工具调用。下面看看在对智能体和编程工作至关重要的维度上，MiniMax M3 相对 DeepSeek V4 是如何定位的。

能力

reAPI 上的 MiniMax M3

DeepSeek V4

定位

单一开放权重模型，为前沿编程、长程智能体和原生多模态而调优。

两个开放权重变体——Flash（快 / 低成本）和 Pro（旗舰推理）。

上下文窗口

默认 1M token，保证最低 512K，并以 MiniMax Sparse Attention 实现高效长上下文。

1M token 上下文窗口，搭配 DeepSeek Sparse Attention。

最大输出

每次响应最高 512K 输出 token（推荐 128K）。

每次响应最高 384K 输出 token。

思考

原生思考，工具调用中交错推理；默认自适应，可关闭。

思考模式默认开启，带思考 / 非思考双模式开关。

多模态输入

在同一次 Chat Completions 调用里原生理解图像和视频。

支持图像输入（beta）；文本加图像。

智能体与编程侧重

厂商报告在 SWE-Bench Pro、Terminal-Bench 和智能体基准上的前沿成绩；为长程编程智能体调优。

专门的智能体优化；据 DeepSeek 称在智能体编程上达到开源 SOTA。

本对比反映撰写时 MiniMax M3 发布说明与 DeepSeek V4 文档中公开记载的行为。基准数字为厂商报告。模型行为和定价可能变化；当前数值请查看上方价格卡和 API 文档。

三步上手 MiniMax M3

step 01
在 api.reapi.ai 创建账号和 key
在 api.reapi.ai 注册，打开控制台，在 API Keys 下生成一把 API key，并在 Top Up 下充值 token。聊天工作区与 reapi.ai 的图像/视频网关是分开的——两边的 key 不通用。
打开
step 02
发出第一个请求
向 https://api.reapi.ai/v1/chat/completions 发 POST，`model` 设为 `minimax/minimax-m3`，带上你的 `messages` 数组和 `max_tokens`。MiniMax M3 端点是通用的，包括流式响应，所以大多数 SDK 只需改一个 base URL 就能用。
打开
step 03
为推理与成本调优
MiniMax M3 自适应思考——任务难时就推理，不难时就直接作答。跨调用复用稳定的 system 提示词和工具 schema，以命中低廉的缓存读取价；在重推理工作上把 `max_tokens` 设得够高，好容纳思维链。
打开

常见问题

关于此模型的常见疑问。

MiniMax M3 按量付费，以美元从你的 api.reapi.ai token 余额中扣费。本页的价格卡展示了实时的每 1M token 输入、输出和缓存读取价。缓存读取远比重新发送同样的 token 便宜，失败的请求不计费。

准备好上线了吗？

在 Playground 中试用，或直接获取 API Key 立即接入。

获取 API key 查看 API 文档

MiniMax M3 — 前沿编程，1M 上下文

你能用这个模型做什么

可以用这个模型构建并上线的真实工作流与生产级用例。