通过一个更易集成的 API 接入 Xiaomi MiMo 模型
用单一 provider 入口接入 MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-Flash 与 MiMo-V2-TTS,更快构建 agent、多模态与语音产品。
Models
MiMo-V2-Pro
面向复杂 agent 编排与高质量推理任务的旗舰模型。
100 万上下文窗口
MiMo-V2-Omni
支持图像、视频与音频理解,适合丰富的多模态应用。
25.6 万多模态上下文
MiMo-V2-Flash
兼顾成本与速度,适合大规模生产流量与轻量推理。
更快且更省成本
MiMo-V2-TTS
更自然、更具表现力的语音生成,适合助手、播报与语音 agent。
支持说话与唱歌
概览
MiMo 模型家族与产品工作负载的对应关系
针对推理、多模态理解、高效推断和语音生成,为不同产品工作负载选择合适的 MiMo 模型。
为什么选择这个 provider
围绕 MiMo 的真实生产用法来设计落地页叙事
这一页重点强调开发者真正关心的内容:模型覆盖、兼容性、工作负载匹配与更顺滑的接入路径。
这一页重点强调开发者真正关心的内容:模型覆盖、兼容性、工作负载匹配与更顺滑的接入路径。
需要更大工作记忆时,优先选择 MiMo-V2-Pro
当产品涉及深度推理、复杂工具调用、多轮 agent 执行与大体量上下文时,MiMo-V2-Pro 更贴近这类需求。
为开发者而建
更适合接入多种 MiMo 能力的产品团队
与其让一个模型承担所有任务,不如通过 provider 思路保持路由、集成方式与工作负载选择的灵活性。
与其让一个模型承担所有任务,不如通过 provider 思路保持路由、集成方式与工作负载选择的灵活性。
- 一个 API 覆盖 Pro、Omni、Flash 与 TTS
- 兼容 OpenAI 风格请求流程
- 按用例快速切换模型
- 适合聊天、编码、语音和多模态产品
针对不同产品界面选择最合适的模型
Pro 适合高质量推理,Omni 适合多模态理解,Flash 适合高并发流量,TTS 负责语音输出。
尽量减少 SDK 与后端改动
这个落地页的核心定位,就是把 MiMo 呈现成更容易落地、迁移和试用的 provider 方案。
支持需要长上下文、工具编排与更深推理能力的 agent 工作流。
在需要文本、图像、视频与音频共同输入的产品中更自然地工作。
借助 MiMo-V2-TTS 增加更自然、更有表现力的语音体验。
能力亮点
首页上最值得被快速看懂的 MiMo 能力
这些区块更适合承载访问者在评估新模型 provider 时最先关心的关键信息。
Pro 支持 100 万上下文
MiMo-V2-Pro 面向长上下文推理场景,OpenRouter 页面给出的上下文窗口为 1,048,576 tokens。
Omni 支持 25.6 万多模态上下文
MiMo-V2-Omni 支持图像、视频、音频与文本理解,上下文窗口为 262,144 tokens。
更省成本的 Flash 层
MiMo-V2-Flash 更适合追求吞吐和预算效率的团队,用于更大规模的生产请求。
强调推理与 agent 场景
MiMo 的整体叙事重点在 agentic 和 reasoning,而不是泛化的聊天机器人包装。
更具表现力的语音生成
MiMo-V2-TTS 更强调语音风格控制与更自然的表达,适合助手、播报和语音交互。
同时支持说话与唱歌
官方 TTS 页面明确强调 speaking 与 singing generation 均由同一统一模型提供。
模型与价格概览
这里不再展示无关的 SaaS 订阅套餐,而是直接帮助访问者把 MiMo 模型与自己的工作负载对应起来。
1,048,576 token 上下文窗口。
输入 ¥7.35/M tokens,输出 ¥22.05/M tokens。
长上下文推理、代码 agent 与复杂多步骤编排。
262,144 token 上下文窗口。
输入 ¥2.94/M tokens,输出 ¥14.70/M tokens。
多模态助手、媒体理解与更丰富的应用交互界面。
262,144 token 上下文窗口。
输入 ¥0.74/M tokens,输出 ¥2.21/M tokens。
高并发流量、轻量推理任务与预算优化。
更适用于重视声音质量与风格控制的语音场景,而非纯文本补全。
限时免费。
语音 agent、旁白、助手回复与表达力更强的语音交互。
价格对比
与主流 AI 服务商的透明价格对比,所有价格均为每百万 tokens(美元)。
旗舰推理模型
| 模型 | 服务商 | 输入 / 1M | 输出 / 1M | 上下文 |
|---|---|---|---|---|
MiMo-V2-ProOurs | Mimo API | $1.05 | $3.15 | 1M |
GPT-5 | OpenAI | $1.25 | $10.00 | - |
GPT-4.1 | OpenAI | $2.00 | $8.00 | 1M |
o3 | OpenAI | $2.00 | $8.00 | 200K |
Gemini 2.5 Pro | $1.25 | $10.00 | 1M | |
Claude Sonnet 4.6 | Anthropic | $3.00 | $15.00 | 1M |
Claude Opus 4.6 | Anthropic | $5.00 | $25.00 | 1M |
轻量高效模型
| 模型 | 服务商 | 输入 / 1M | 输出 / 1M | 上下文 |
|---|---|---|---|---|
MiMo-V2-FlashOurs | Mimo API | $0.11 | $0.32 | 256K |
GPT-4.1-nano | OpenAI | $0.10 | $0.40 | 1M |
GPT-4.1-mini | OpenAI | $0.20 | $0.80 | 1M |
o4-mini | OpenAI | $0.55 | $2.20 | 200K |
Gemini 2.5 Flash | $0.30 | $2.50 | 1M | |
Claude Haiku 4.5 | Anthropic | $1.00 | $5.00 | 200K |
多模态模型
| 模型 | 服务商 | 输入 / 1M | 输出 / 1M | 上下文 |
|---|---|---|---|---|
MiMo-V2-OmniOurs | Mimo API | $0.42 | $2.10 | 256K |
GPT-4o | OpenAI | $2.50 | $10.00 | 128K |
Gemini 2.5 Flash | $0.30 | $2.50 | 1M | |
Claude Sonnet 4.6 | Anthropic | $3.00 | $15.00 | 1M |
价格基于 2026 年 3 月各服务商公开数据,可能随时变动。输出价格通常是大多数工作负载的主要成本。
FAQ
开发者最可能优先提出的问题