LogoXiaomi MiMo API Provider
  • 功能
  • 价格
  • 模型
  • 博客
  • 文档
Build with Xiaomi MiMo

通过一个更易集成的 API 接入 Xiaomi MiMo 模型

用单一 provider 入口接入 MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-Flash 与 MiMo-V2-TTS,更快构建 agent、多模态与语音产品。

获取 API 访问
查看模型

Models

旗舰

MiMo-V2-Pro

面向复杂 agent 编排与高质量推理任务的旗舰模型。

100 万上下文窗口

多模态

MiMo-V2-Omni

支持图像、视频与音频理解,适合丰富的多模态应用。

25.6 万多模态上下文

高效

MiMo-V2-Flash

兼顾成本与速度,适合大规模生产流量与轻量推理。

更快且更省成本

语音

MiMo-V2-TTS

更自然、更具表现力的语音生成,适合助手、播报与语音 agent。

支持说话与唱歌

概览

MiMo 模型家族与产品工作负载的对应关系

针对推理、多模态理解、高效推断和语音生成,为不同产品工作负载选择合适的 MiMo 模型。

MiMo-V2-Pro

适合长上下文推理、agent 工作流、编码与多步骤任务编排。

查看

MiMo-V2-Omni

适合需要图像、视频、音频与文本共同理解的多模态应用。

查看

MiMo-V2-Flash

适合更关注吞吐、成本和生产规模的轻量推理场景。

查看

MiMo-V2-TTS

适合助手播报、语音回复、旁白与交互式语音产品。

查看

OpenAI 兼容 API

沿用熟悉的 SDK 与请求模式,降低从现有栈迁移到 MiMo 的成本。

查看

面向 provider 的部署方式

通过一个入口承载多类 MiMo 能力,便于统一路由、管理与模型选择。

查看

为什么选择这个 provider

围绕 MiMo 的真实生产用法来设计落地页叙事

这一页重点强调开发者真正关心的内容:模型覆盖、兼容性、工作负载匹配与更顺滑的接入路径。

这一页重点强调开发者真正关心的内容:模型覆盖、兼容性、工作负载匹配与更顺滑的接入路径。

当产品需要大上下文、多轮 agent 循环与复杂推理时,可直接对接 MiMo-V2-Pro。

长上下文

需要更大工作记忆时,优先选择 MiMo-V2-Pro

当产品涉及深度推理、复杂工具调用、多轮 agent 执行与大体量上下文时,MiMo-V2-Pro 更贴近这类需求。

适合代码助手与 agent 后端。
适合长文档、长指令与复杂上下文。
更强调推理质量,而非极致低成本。

为开发者而建

更适合接入多种 MiMo 能力的产品团队

与其让一个模型承担所有任务,不如通过 provider 思路保持路由、集成方式与工作负载选择的灵活性。

与其让一个模型承担所有任务,不如通过 provider 思路保持路由、集成方式与工作负载选择的灵活性。

  • 一个 API 覆盖 Pro、Omni、Flash 与 TTS
  • 兼容 OpenAI 风格请求流程
  • 按用例快速切换模型
  • 适合聊天、编码、语音和多模态产品
路由

针对不同产品界面选择最合适的模型

Pro 适合高质量推理,Omni 适合多模态理解,Flash 适合高并发流量,TTS 负责语音输出。

接入

尽量减少 SDK 与后端改动

这个落地页的核心定位,就是把 MiMo 呈现成更容易落地、迁移和试用的 provider 方案。

Agents

支持需要长上下文、工具编排与更深推理能力的 agent 工作流。

多模态

在需要文本、图像、视频与音频共同输入的产品中更自然地工作。

语音

借助 MiMo-V2-TTS 增加更自然、更有表现力的语音体验。

能力亮点

首页上最值得被快速看懂的 MiMo 能力

这些区块更适合承载访问者在评估新模型 provider 时最先关心的关键信息。

Pro 支持 100 万上下文

MiMo-V2-Pro 面向长上下文推理场景,OpenRouter 页面给出的上下文窗口为 1,048,576 tokens。

Omni 支持 25.6 万多模态上下文

MiMo-V2-Omni 支持图像、视频、音频与文本理解,上下文窗口为 262,144 tokens。

更省成本的 Flash 层

MiMo-V2-Flash 更适合追求吞吐和预算效率的团队,用于更大规模的生产请求。

强调推理与 agent 场景

MiMo 的整体叙事重点在 agentic 和 reasoning,而不是泛化的聊天机器人包装。

更具表现力的语音生成

MiMo-V2-TTS 更强调语音风格控制与更自然的表达,适合助手、播报和语音交互。

同时支持说话与唱歌

官方 TTS 页面明确强调 speaking 与 singing generation 均由同一统一模型提供。

模型与价格概览

这里不再展示无关的 SaaS 订阅套餐,而是直接帮助访问者把 MiMo 模型与自己的工作负载对应起来。

推理
MiMo-V2-Pro
面向旗舰级 agent 与代码工作流的高质量推理模型。
上下文

1,048,576 token 上下文窗口。

价格

输入 ¥7.35/M tokens,输出 ¥22.05/M tokens。

适用场景

长上下文推理、代码 agent 与复杂多步骤编排。

多模态
MiMo-V2-Omni
面向文本、图像、视频与音频理解的全模态模型。
上下文

262,144 token 上下文窗口。

价格

输入 ¥2.94/M tokens,输出 ¥14.70/M tokens。

适用场景

多模态助手、媒体理解与更丰富的应用交互界面。

高效
MiMo-V2-Flash
适合更广泛生产流量与成本敏感型部署。
上下文

262,144 token 上下文窗口。

价格

输入 ¥0.74/M tokens,输出 ¥2.21/M tokens。

适用场景

高并发流量、轻量推理任务与预算优化。

语音
MiMo-V2-TTS
适合语音助手、播报与更具表现力的 spoken UX。
上下文

更适用于重视声音质量与风格控制的语音场景,而非纯文本补全。

价格

限时免费。

适用场景

语音 agent、旁白、助手回复与表达力更强的语音交互。

价格对比

与主流 AI 服务商的透明价格对比,所有价格均为每百万 tokens(美元)。

旗舰推理模型

模型服务商输入 / 1M输出 / 1M上下文
MiMo-V2-ProOurs
Mimo API$1.05$3.151M
GPT-5
OpenAI$1.25$10.00-
GPT-4.1
OpenAI$2.00$8.001M
o3
OpenAI$2.00$8.00200K
Gemini 2.5 Pro
Google$1.25$10.001M
Claude Sonnet 4.6
Anthropic$3.00$15.001M
Claude Opus 4.6
Anthropic$5.00$25.001M

轻量高效模型

模型服务商输入 / 1M输出 / 1M上下文
MiMo-V2-FlashOurs
Mimo API$0.11$0.32256K
GPT-4.1-nano
OpenAI$0.10$0.401M
GPT-4.1-mini
OpenAI$0.20$0.801M
o4-mini
OpenAI$0.55$2.20200K
Gemini 2.5 Flash
Google$0.30$2.501M
Claude Haiku 4.5
Anthropic$1.00$5.00200K

多模态模型

模型服务商输入 / 1M输出 / 1M上下文
MiMo-V2-OmniOurs
Mimo API$0.42$2.10256K
GPT-4o
OpenAI$2.50$10.00128K
Gemini 2.5 Flash
Google$0.30$2.501M
Claude Sonnet 4.6
Anthropic$3.00$15.001M

价格基于 2026 年 3 月各服务商公开数据,可能随时变动。输出价格通常是大多数工作负载的主要成本。

FAQ

开发者最可能优先提出的问题

现在就开始用 Xiaomi MiMo 构建产品

通过一个更清晰的 provider 入口接入 MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-Flash 与 MiMo-V2-TTS。

获取 API 访问联系销售
LogoXiaomi MiMo API Provider

统一接入 Xiaomi MiMo 模型,服务于 agent、多模态与语音工作负载。

Email
产品
  • 功能
  • 价格
  • 模型
  • 常见问题
资源
  • 博客
  • 文档
  • 更新日志
  • 路线图
  • Happy Horse
公司
  • 关于我们
  • 联系我们
  • 邮件列表
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 Xiaomi MiMo API Provider All Rights Reserved.