通过一个更易集成的 API 接入 Xiaomi MiMo 模型

用单一 provider 入口接入 MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Flash 与 MiMo-V2.5-TTS，更快构建 agent、多模态与语音产品。

获取 API 访问

查看模型

Models

旗舰

MiMo-V2.5-Pro

面向复杂 agent 编排与高质量推理任务的旗舰模型。

100 万上下文窗口

多模态

MiMo-V2.5

支持图像、视频与音频理解，适合丰富的多模态应用。

100 万全模态上下文

高效

MiMo-V2-Flash

兼顾成本与速度，适合大规模生产流量与轻量推理。

更快且更省成本

语音

MiMo-V2.5-TTS

更自然、更具表现力的语音生成，适合助手、播报与语音 agent。

支持说话与唱歌

概览

MiMo 模型家族与产品工作负载的对应关系

针对推理、多模态理解、高效推断和语音生成，为不同产品工作负载选择合适的 MiMo 模型。

MiMo-V2.5-Pro

适合长上下文推理、agent 工作流、编码与多步骤任务编排。

查看

MiMo-V2.5

适合需要图像、视频、音频与文本共同理解的多模态应用。

查看

MiMo-V2-Flash

适合更关注吞吐、成本和生产规模的轻量推理场景。

查看

MiMo-V2.5-TTS

适合助手播报、语音回复、旁白与交互式语音产品。

查看

OpenAI 兼容 API

沿用熟悉的 SDK 与请求模式，降低从现有栈迁移到 MiMo 的成本。

查看

面向 provider 的部署方式

通过一个入口承载多类 MiMo 能力，便于统一路由、管理与模型选择。

查看

为什么选择这个 provider

围绕 MiMo 的真实生产用法来设计落地页叙事

这一页重点强调开发者真正关心的内容：模型覆盖、兼容性、工作负载匹配与更顺滑的接入路径。

当产品需要大上下文、多轮 agent 循环与复杂推理时，可直接对接 MiMo-V2.5-Pro。

长上下文

需要更大工作记忆时，优先选择 MiMo-V2.5-Pro

当产品涉及深度推理、复杂工具调用、多轮 agent 执行与大体量上下文时，MiMo-V2.5-Pro 更贴近这类需求。

适合代码助手与 agent 后端。

适合长文档、长指令与复杂上下文。

更强调推理质量，而非极致低成本。

为开发者而建

更适合接入多种 MiMo 能力的产品团队

与其让一个模型承担所有任务，不如通过 provider 思路保持路由、集成方式与工作负载选择的灵活性。

一个 API 覆盖 Pro、Omni、Flash 与 TTS
兼容 OpenAI 风格请求流程
按用例快速切换模型
适合聊天、编码、语音和多模态产品

路由

针对不同产品界面选择最合适的模型

Pro 适合高质量推理，Omni 适合多模态理解，Flash 适合高并发流量，TTS 负责语音输出。

接入

尽量减少 SDK 与后端改动

这个落地页的核心定位，就是把 MiMo 呈现成更容易落地、迁移和试用的 provider 方案。

Agents

支持需要长上下文、工具编排与更深推理能力的 agent 工作流。

多模态

在需要文本、图像、视频与音频共同输入的产品中更自然地工作。

语音

借助 MiMo-V2.5-TTS 增加更自然、更有表现力的语音体验。

能力亮点

首页上最值得被快速看懂的 MiMo 能力

这些区块更适合承载访问者在评估新模型 provider 时最先关心的关键信息。

Pro 支持 100 万上下文

MiMo-V2.5-Pro 面向长上下文推理场景，OpenRouter 页面给出的上下文窗口为 1,048,576 tokens。

V2.5 支持 100 万全模态上下文

MiMo-V2.5 支持图像、视频、音频与文本理解，上下文窗口为 1,048,576 tokens。

更省成本的 Flash 层

MiMo-V2-Flash 更适合追求吞吐和预算效率的团队，用于更大规模的生产请求。

强调推理与 agent 场景

MiMo 的整体叙事重点在 agentic 和 reasoning，而不是泛化的聊天机器人包装。

更具表现力的语音生成

MiMo-V2.5-TTS 更强调语音风格控制与更自然的表达，适合助手、播报和语音交互。

同时支持说话与唱歌

官方 TTS 页面明确强调 speaking 与 singing generation 均由同一统一模型提供。

模型与价格概览

这里不再展示无关的 SaaS 订阅套餐，而是直接帮助访问者把 MiMo 模型与自己的工作负载对应起来。

推理

MiMo-V2.5-Pro

面向旗舰级 agent 与代码工作流的高质量推理模型。

上下文

1,048,576 token 上下文窗口。

价格

输入 $0.435/M tokens，输出 $0.87/M tokens。

适用场景

长上下文推理、代码 agent 与复杂多步骤编排。

开始使用

多模态

MiMo-V2.5

面向文本、图像、视频与音频理解的全模态模型。

上下文

1,048,576 token 上下文窗口。

价格

输入 $0.14/M tokens，输出 $0.28/M tokens。

适用场景

多模态助手、媒体理解与更丰富的应用交互界面。

开始使用

高效

MiMo-V2-Flash

适合更广泛生产流量与成本敏感型部署。

上下文

262,144 token 上下文窗口。

价格

2026-06-01 后按 V2.5 价格：输入 $0.14/M tokens，输出 $0.28/M tokens。

适用场景

高并发流量、轻量推理任务与预算优化。

开始使用

语音

MiMo-V2.5-TTS

适合语音助手、播报与更具表现力的 spoken UX。

上下文

更适用于重视声音质量与风格控制的语音场景，而非纯文本补全。

价格

限时免费。

适用场景

语音 agent、旁白、助手回复与表达力更强的语音交互。

开始使用

价格对比

与主流 AI 服务商的透明价格对比，所有价格均为每百万 tokens（美元）。

旗舰推理模型

模型	服务商	输入 / 1M	输出 / 1M	上下文
MiMo-V2.5-ProOurs	Mimo API	$0.435	$0.87	1M
GPT-5	OpenAI	$1.25	$10.00	-
GPT-4.1	OpenAI	$2.00	$8.00	1M
o3	OpenAI	$2.00	$8.00	200K
Gemini 2.5 Pro	Google	$1.25	$10.00	1M
Claude Sonnet 4.6	Anthropic	$3.00	$15.00	1M
Claude Opus 4.6	Anthropic	$5.00	$25.00	1M

轻量高效模型

模型	服务商	输入 / 1M	输出 / 1M	上下文
MiMo-V2-OmniOurs	Mimo API	$0.14	$0.28	256K
GPT-4.1-nano	OpenAI	$0.10	$0.40	1M
GPT-4.1-mini	OpenAI	$0.20	$0.80	1M
o4-mini	OpenAI	$0.55	$2.20	200K
Gemini 2.5 Flash	Google	$0.30	$2.50	1M
Claude Haiku 4.5	Anthropic	$1.00	$5.00	200K

多模态模型

模型	服务商	输入 / 1M	输出 / 1M	上下文
MiMo-V2.5Ours	Mimo API	$0.14	$0.28	1M
GPT-4o	OpenAI	$2.50	$10.00	128K
Gemini 2.5 Flash	Google	$0.30	$2.50	1M
Claude Sonnet 4.6	Anthropic	$3.00	$15.00	1M

价格基于 2026 年 4 月各服务商公开数据，可能随时变动。输出价格通常是大多数工作负载的主要成本。

FAQ

开发者最可能优先提出的问题

现在就开始用 Xiaomi MiMo 构建产品

通过一个更清晰的 provider 入口接入 MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Flash 与 MiMo-V2.5-TTS。

获取 API 访问联系销售

Build with Xiaomi MiMo

通过一个更易集成的 API 接入 Xiaomi MiMo 模型

用单一 provider 入口接入 MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Flash 与 MiMo-V2.5-TTS，更快构建 agent、多模态与语音产品。

获取 API 访问

查看模型

Models

旗舰

MiMo-V2.5-Pro

面向复杂 agent 编排与高质量推理任务的旗舰模型。

100 万上下文窗口

多模态

MiMo-V2.5

支持图像、视频与音频理解，适合丰富的多模态应用。

100 万全模态上下文

高效

MiMo-V2-Flash

兼顾成本与速度，适合大规模生产流量与轻量推理。

更快且更省成本

语音

MiMo-V2.5-TTS

更自然、更具表现力的语音生成，适合助手、播报与语音 agent。

支持说话与唱歌

模型

服务商

输入 / 1M

输出 / 1M

上下文

MiMo-V2.5-ProOurs

Mimo API

$0.435

$0.87

GPT-5

OpenAI

$1.25

$10.00

GPT-4.1

OpenAI

$2.00

$8.00

OpenAI

$2.00

$8.00

200K

Gemini 2.5 Pro

Google

$1.25

$10.00

Claude Sonnet 4.6

Anthropic

$3.00

$15.00

Claude Opus 4.6

Anthropic

$5.00

$25.00

模型

服务商

输入 / 1M

输出 / 1M

上下文

MiMo-V2-OmniOurs

Mimo API

$0.14

$0.28

256K

GPT-4.1-nano

OpenAI

$0.10

$0.40

GPT-4.1-mini

OpenAI

$0.20

$0.80

o4-mini

OpenAI

$0.55

$2.20

200K

Gemini 2.5 Flash

Google

$0.30

$2.50

Claude Haiku 4.5

Anthropic

$1.00

$5.00

200K

模型

服务商

输入 / 1M

输出 / 1M

上下文

MiMo-V2.5Ours

Mimo API

$0.14

$0.28

GPT-4o

OpenAI

$2.50

$10.00

128K

Gemini 2.5 Flash

Google

$0.30

$2.50

Claude Sonnet 4.6

Anthropic

$3.00

$15.00

通过一个更易集成的 API 接入 Xiaomi MiMo 模型

Models

MiMo-V2.5-Pro

MiMo-V2.5

MiMo-V2-Flash

MiMo-V2.5-TTS

MiMo 模型家族与产品工作负载的对应关系

MiMo-V2.5-Pro

MiMo-V2.5

MiMo-V2-Flash

MiMo-V2.5-TTS

OpenAI 兼容 API

面向 provider 的部署方式

围绕 MiMo 的真实生产用法来设计落地页叙事

长上下文推理接入

多模态应用支持

OpenAI 风格集成

一个 provider，多类工作负载

需要更大工作记忆时，优先选择 MiMo-V2.5-Pro

更适合接入多种 MiMo 能力的产品团队

针对不同产品界面选择最合适的模型

尽量减少 SDK 与后端改动

能力亮点

首页上最值得被快速看懂的 MiMo 能力

Pro 支持 100 万上下文

V2.5 支持 100 万全模态上下文

更省成本的 Flash 层

强调推理与 agent 场景

更具表现力的语音生成

同时支持说话与唱歌

模型与价格概览

价格对比

旗舰推理模型

轻量高效模型

多模态模型

FAQ

这个 provider 支持哪些 MiMo 模型？

API 是否兼容 OpenAI 风格？

Pro、Omni 和 Flash 应该怎么选？

MiMo 是否支持语音生成？

MiMo 适合 agent 与代码工作流吗？

现在就开始用 Xiaomi MiMo 构建产品

通过一个更易集成的 API 接入 Xiaomi MiMo 模型

Models

MiMo-V2.5-Pro

MiMo-V2.5

MiMo-V2-Flash

MiMo-V2.5-TTS

MiMo 模型家族与产品工作负载的对应关系

MiMo-V2.5-Pro

MiMo-V2.5

MiMo-V2-Flash

MiMo-V2.5-TTS

OpenAI 兼容 API

面向 provider 的部署方式

围绕 MiMo 的真实生产用法来设计落地页叙事

长上下文推理接入

多模态应用支持

OpenAI 风格集成

一个 provider，多类工作负载

需要更大工作记忆时，优先选择 MiMo-V2.5-Pro

更适合接入多种 MiMo 能力的产品团队

针对不同产品界面选择最合适的模型

尽量减少 SDK 与后端改动

能力亮点

首页上最值得被快速看懂的 MiMo 能力

Pro 支持 100 万上下文

V2.5 支持 100 万全模态上下文

更省成本的 Flash 层

强调推理与 agent 场景

更具表现力的语音生成

同时支持说话与唱歌

模型与价格概览

价格对比

旗舰推理模型

轻量高效模型

多模态模型

FAQ

这个 provider 支持哪些 MiMo 模型？

API 是否兼容 OpenAI 风格？