对话DeepSeek
DeepSeek V4
DeepSeek V4 API——Flash + Pro,1M 上下文,默认思考模式,以极低的单 token 价格提供前沿推理。
minimax/minimax-m3Open the chat playground to run MiniMax M3 through the OpenAI-compatible chat completions surface with your api.reapi.ai key.
可以用这个模型构建并上线的真实工作流与生产级用例。

智能体编程是 MiniMax M3 的招牌。MiniMax 报告称其在软件工程基准上达到前沿水平——SWE-Bench Pro 上 59.0%,Terminal-Bench 2.1 上 66.0%——让 MiniMax M3 在保持开放权重的同时,跻身顶级闭源编程模型的行列。把一个编程智能体对准 MiniMax M3,它就能界定任务范围、调用工具、推演多步工作并在长程运行中自我纠错,全程都在同一个会话里完成。
查看 API 文档
MiniMax M3 默认 1M token 上下文窗口——足以在一次调用里装下整个中型仓库、一份长篇研究材料,或一段多轮智能体轨迹。MiniMax Sparse Attention 让长上下文推理保持高效,因此架构评审、依赖审计、迁移规划这类 MiniMax M3 工作负载很少需要分块。稳定的提示词前缀在每次重复时都能命中低廉的缓存读取价。

MiniMax M3 从底层就是多模态的:在同一次 Chat Completions 调用里,连同文本一起发送图像和视频——截图、示意图、文档扫描件和短片——模型会对这一切进行推理。配合可靠的 function calling 与 JSON 输出,MiniMax M3 能驱动浏览器智能体、文档流水线,以及混合视觉、检索与代码的工具调用工作流。
积分计费 — 1 积分 = 0.001 美元,仅为成功生成付费。
| 类别 | 单位 | 价格 |
|---|---|---|
| Token 计价 | ||
| 输入 | 1M tokens | $0.6 |
| 输出 | 1M tokens | $2.4 |
| 缓存读取 | 1M tokens | $0.12 |
MiniMax M3 原汁原味地讲 OpenAI Chat Completions。把现有的 OpenAI 集成迁到 MiniMax M3,只是改 base URL、API key 和一个模型字符串——`minimax/minimax-m3`——而不是重写平台。同一个 `messages` 数组、同一套流式格式、同样的工具调用结构。
MiniMax M3 开放权重,定价也与之相称。它交出前沿级的编程与智能体基准成绩,每 token 成本却只是闭源模型的零头——而提示词缓存还会在重复上下文上再压一次价。无需高昂的每 token 账单,也能跑出高端的智能体工作。
一把 api.reapi.ai key,就能在解锁 MiniMax M3 的同时,用上 GPT-5.5、Claude Opus 4.8、DeepSeek V4、Gemini,以及平台上每一款前沿对话模型。只需改一处配置,就能比较厂商、加上 fallback、按调用路由流量,而不必另起一个集成项目。
MiniMax M3 和 DeepSeek V4 都是开放权重、超值定价的模型,具备 1M token 上下文窗口、思考与工具调用。下面看看在对智能体和编程工作至关重要的维度上,MiniMax M3 相对 DeepSeek V4 是如何定位的。
本对比反映撰写时 MiniMax M3 发布说明与 DeepSeek V4 文档中公开记载的行为。基准数字为厂商报告。模型行为和定价可能变化;当前数值请查看上方价格卡和 API 文档。
在 api.reapi.ai 注册,打开控制台,在 API Keys 下生成一把 API key,并在 Top Up 下充值 token。聊天工作区与 reapi.ai 的图像/视频网关是分开的——两边的 key 不通用。
打开向 https://api.reapi.ai/v1/chat/completions 发 POST,`model` 设为 `minimax/minimax-m3`,带上你的 `messages` 数组和 `max_tokens`。MiniMax M3 端点是 OpenAI-compatible 的,包括流式响应,所以大多数 SDK 只需改一个 base URL 就能用。
打开MiniMax M3 自适应思考——任务难时就推理,不难时就直接作答。跨调用复用稳定的 system 提示词和工具 schema,以命中低廉的缓存读取价;在重推理工作上把 `max_tokens` 设得够高,好容纳思维链。
打开关于此模型的常见疑问。
探索同类别的更多模型。
对话DeepSeek
DeepSeek V4 API——Flash + Pro,1M 上下文,默认思考模式,以极低的单 token 价格提供前沿推理。
对话
对话Anthropic
Anthropic Claude Opus 4.7 — 1M 上下文、128K 输出,专为高端编码与 Agent 推理打造。
对话Anthropic
Anthropic Claude Sonnet 4.6 — 兼顾质量与速度,胜任日常生产对话、代码评审与中等复杂度的智能体场景。