透過一個更容易整合的 API 接入 Xiaomi MiMo 模型

使用單一 provider 入口接入 MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Flash 與 MiMo-V2.5-TTS，更快打造 agent、多模態與語音產品。

取得 API 存取權限

查看模型

Models

旗艦

MiMo-V2.5-Pro

面向複雜 agent 編排與高品質推理任務的旗艦模型。

100 萬上下文視窗

多模態

MiMo-V2.5

支援圖像、影片與音訊理解，適合豐富的多模態應用。

100 萬全模態上下文

高效

MiMo-V2-Flash

兼顧成本與速度，適合大規模生產流量與輕量推理。

更快且更省成本

語音

MiMo-V2.5-TTS

更自然、更具表現力的語音生成，適合助理、播報與語音 agent。

支援說話與唱歌

概覽

MiMo 模型家族與產品工作負載的對應關係

針對推理、多模態理解、高效率推斷與語音生成，為不同產品工作負載選擇合適的 MiMo 模型。

MiMo-V2.5-Pro

適合長上下文推理、agent 工作流程、程式開發與多步驟任務編排。

查看

MiMo-V2.5

適合需要圖像、影片、音訊與文字共同理解的多模態應用。

查看

MiMo-V2-Flash

適合更重視吞吐、成本與生產規模的輕量推理場景。

查看

MiMo-V2.5-TTS

適合助理播報、語音回覆、旁白與互動式語音產品。

查看

OpenAI 相容 API

沿用熟悉的 SDK 與請求模式，降低從現有棧遷移到 MiMo 的成本。

查看

面向 provider 的部署方式

透過單一入口承載多類 MiMo 能力，便於統一路由、管理與模型選擇。

查看

為什麼選擇這個 provider

圍繞 MiMo 的真實生產用法來設計落地頁敘事

這一頁重點強調開發者真正關心的內容：模型覆蓋、相容性、工作負載匹配與更順滑的接入路徑。

當產品需要大上下文、多輪 agent 循環與複雜推理時，可直接對接 MiMo-V2.5-Pro。

長上下文

需要更大工作記憶時，優先選擇 MiMo-V2.5-Pro

當產品涉及深度推理、複雜工具呼叫、多輪 agent 執行與大體量上下文時，MiMo-V2.5-Pro 更貼近這類需求。

適合程式助手與 agent 後端。

適合長文件、長指令與複雜上下文。

更強調推理品質，而非極致低成本。

為開發者而建

更適合整合多種 MiMo 能力的產品團隊

與其讓一個模型承擔所有任務，不如透過 provider 思路保持路由、整合方式與工作負載選擇的彈性。

一個 API 覆蓋 Pro、Omni、Flash 與 TTS
相容 OpenAI 風格請求流程
按用例快速切換模型
適合聊天、程式開發、語音和多模態產品

路由

針對不同產品介面選擇最合適的模型

Pro 適合高品質推理，Omni 適合多模態理解，Flash 適合高併發流量，TTS 負責語音輸出。

接入

盡量減少 SDK 與後端改動

這個落地頁的核心定位，就是把 MiMo 呈現成更容易落地、遷移和試用的 provider 方案。

Agents

支援需要長上下文、工具編排與更深推理能力的 agent 工作流程。

多模態

在需要文字、圖像、影片與音訊共同輸入的產品中更自然地工作。

語音

借助 MiMo-V2.5-TTS 增加更自然、更有表現力的語音體驗。

能力亮點

首頁上最值得被快速看懂的 MiMo 能力

這些區塊更適合承載訪客在評估新模型 provider 時最先在意的關鍵資訊。

Pro 支援 100 萬上下文

MiMo-V2.5-Pro 面向長上下文推理場景，OpenRouter 頁面給出的上下文視窗為 1,048,576 tokens。

V2.5 支援 100 萬全模態上下文

MiMo-V2.5 支援圖像、影片、音訊與文字理解，上下文視窗為 1,048,576 tokens。

更省成本的 Flash 層

MiMo-V2-Flash 更適合追求吞吐和預算效率的團隊，用於更大規模的生產請求。

強調推理與 agent 場景

MiMo 的整體敘事重點在 agentic 和 reasoning，而不是泛化的聊天機器人包裝。

更具表現力的語音生成

MiMo-V2.5-TTS 更強調語音風格控制與更自然的表達，適合助理、播報和語音互動。

同時支援說話與唱歌

官方 TTS 頁面明確強調 speaking 與 singing generation 均由同一統一模型提供。

模型與價格概覽

這裡不再展示無關的 SaaS 訂閱套餐，而是直接幫助訪客把 MiMo 模型與自己的工作負載對應起來。

推理

MiMo-V2.5-Pro

面向旗艦級 agent 與程式開發工作流程的高品質推理模型。

上下文

1,048,576 token 上下文視窗。

價格

輸入 $0.435/M tokens，輸出 $0.87/M tokens。

適用場景

長上下文推理、程式開發 agent 與複雜多步驟編排。

開始使用

多模態

MiMo-V2.5

面向文字、圖像、影片與音訊理解的全模態模型。

上下文

1,048,576 token 上下文視窗。

價格

輸入 $0.14/M tokens，輸出 $0.28/M tokens。

適用場景

多模態助理、媒體理解與更豐富的應用互動介面。

開始使用

高效

MiMo-V2-Flash

適合更廣泛生產流量與成本敏感型部署。

上下文

262,144 token 上下文視窗。

價格

2026-06-01 後按 V2.5 價格：輸入 $0.14/M tokens，輸出 $0.28/M tokens。

適用場景

高併發流量、輕量推理任務與預算最佳化。

開始使用

語音

MiMo-V2.5-TTS

適合語音助理、播報與更具表現力的 spoken UX。

上下文

更適用於重視聲音品質與風格控制的語音場景，而非純文字補全。

價格

具體 provider 側語音接入方式建議單獨諮詢。

適用場景

語音 agent、旁白、助理回覆與表達力更強的語音互動。

開始使用

價格對比

與主流 AI 服務商的透明價格對比，所有價格均為每百萬 tokens（美元）。

旗艦推理模型

模型	服務商	輸入 / 1M	輸出 / 1M	上下文
MiMo-V2.5-ProOurs	Mimo API	$0.435	$0.87	1M
GPT-5	OpenAI	$1.25	$10.00	-
GPT-4.1	OpenAI	$2.00	$8.00	1M
o3	OpenAI	$2.00	$8.00	200K
Gemini 2.5 Pro	Google	$1.25	$10.00	1M
Claude Sonnet 4.6	Anthropic	$3.00	$15.00	1M
Claude Opus 4.6	Anthropic	$5.00	$25.00	1M

輕量高效模型

模型	服務商	輸入 / 1M	輸出 / 1M	上下文
MiMo-V2-OmniOurs	Mimo API	$0.14	$0.28	256K
GPT-4.1-nano	OpenAI	$0.10	$0.40	1M
GPT-4.1-mini	OpenAI	$0.20	$0.80	1M
o4-mini	OpenAI	$0.55	$2.20	200K
Gemini 2.5 Flash	Google	$0.30	$2.50	1M
Claude Haiku 4.5	Anthropic	$1.00	$5.00	200K

多模態模型

模型	服務商	輸入 / 1M	輸出 / 1M	上下文
MiMo-V2.5Ours	Mimo API	$0.14	$0.28	1M
GPT-4o	OpenAI	$2.50	$10.00	128K
Gemini 2.5 Flash	Google	$0.30	$2.50	1M
Claude Sonnet 4.6	Anthropic	$3.00	$15.00	1M

價格基於 2026 年 4 月各服務商公開資料，可能隨時變動。輸出價格通常是大多數工作負載的主要成本。

FAQ

開發者最可能優先提出的問題

現在就開始用 Xiaomi MiMo 構建產品

透過更清晰的 provider 入口接入 MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Flash 與 MiMo-V2.5-TTS。

取得 API 存取權限聯絡銷售

Build with Xiaomi MiMo

透過一個更容易整合的 API 接入 Xiaomi MiMo 模型

使用單一 provider 入口接入 MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2-Flash 與 MiMo-V2.5-TTS，更快打造 agent、多模態與語音產品。

取得 API 存取權限

查看模型

Models

旗艦

MiMo-V2.5-Pro

面向複雜 agent 編排與高品質推理任務的旗艦模型。

100 萬上下文視窗

多模態

MiMo-V2.5

支援圖像、影片與音訊理解，適合豐富的多模態應用。

100 萬全模態上下文

高效

MiMo-V2-Flash

兼顧成本與速度，適合大規模生產流量與輕量推理。

更快且更省成本

語音

MiMo-V2.5-TTS

更自然、更具表現力的語音生成，適合助理、播報與語音 agent。

支援說話與唱歌

模型

服務商

輸入 / 1M

輸出 / 1M

上下文

MiMo-V2.5-ProOurs

Mimo API

$0.435

$0.87

GPT-5

OpenAI

$1.25

$10.00

GPT-4.1

OpenAI

$2.00

$8.00

OpenAI

$2.00

$8.00

200K

Gemini 2.5 Pro

Google

$1.25

$10.00

Claude Sonnet 4.6

Anthropic

$3.00

$15.00

Claude Opus 4.6

Anthropic

$5.00

$25.00

模型

服務商

輸入 / 1M

輸出 / 1M

上下文

MiMo-V2-OmniOurs

Mimo API

$0.14

$0.28

256K

GPT-4.1-nano

OpenAI

$0.10

$0.40

GPT-4.1-mini

OpenAI

$0.20

$0.80

o4-mini

OpenAI

$0.55

$2.20

200K

Gemini 2.5 Flash

Google

$0.30

$2.50

Claude Haiku 4.5

Anthropic

$1.00

$5.00

200K

模型

服務商

輸入 / 1M

輸出 / 1M

上下文

MiMo-V2.5Ours

Mimo API

$0.14

$0.28

GPT-4o

OpenAI

$2.50

$10.00

128K

Gemini 2.5 Flash

Google

$0.30

$2.50

Claude Sonnet 4.6

Anthropic

$3.00

$15.00

透過一個更容易整合的 API 接入 Xiaomi MiMo 模型

Models

MiMo-V2.5-Pro

MiMo-V2.5

MiMo-V2-Flash

MiMo-V2.5-TTS

MiMo 模型家族與產品工作負載的對應關係

MiMo-V2.5-Pro

MiMo-V2.5

MiMo-V2-Flash

MiMo-V2.5-TTS

OpenAI 相容 API

面向 provider 的部署方式

圍繞 MiMo 的真實生產用法來設計落地頁敘事

長上下文推理接入

多模態應用支援

OpenAI 風格整合

一個 provider，多類工作負載

需要更大工作記憶時，優先選擇 MiMo-V2.5-Pro

更適合整合多種 MiMo 能力的產品團隊

針對不同產品介面選擇最合適的模型

盡量減少 SDK 與後端改動

能力亮點

首頁上最值得被快速看懂的 MiMo 能力

Pro 支援 100 萬上下文

V2.5 支援 100 萬全模態上下文

更省成本的 Flash 層

強調推理與 agent 場景

更具表現力的語音生成

同時支援說話與唱歌

模型與價格概覽

價格對比

旗艦推理模型

輕量高效模型

多模態模型

FAQ

這個 provider 支援哪些 MiMo 模型？

API 是否相容 OpenAI 風格？

Pro、Omni 和 Flash 該怎麼選？

MiMo 是否支援語音生成？

MiMo 適合 agent 與程式開發工作流程嗎？

現在就開始用 Xiaomi MiMo 構建產品

透過一個更容易整合的 API 接入 Xiaomi MiMo 模型

Models

MiMo-V2.5-Pro

MiMo-V2.5

MiMo-V2-Flash

MiMo-V2.5-TTS

MiMo 模型家族與產品工作負載的對應關係

MiMo-V2.5-Pro

MiMo-V2.5

MiMo-V2-Flash

MiMo-V2.5-TTS

OpenAI 相容 API

面向 provider 的部署方式

圍繞 MiMo 的真實生產用法來設計落地頁敘事

長上下文推理接入

多模態應用支援

OpenAI 風格整合

一個 provider，多類工作負載

需要更大工作記憶時，優先選擇 MiMo-V2.5-Pro

更適合整合多種 MiMo 能力的產品團隊

針對不同產品介面選擇最合適的模型

盡量減少 SDK 與後端改動

能力亮點

首頁上最值得被快速看懂的 MiMo 能力

Pro 支援 100 萬上下文

V2.5 支援 100 萬全模態上下文

更省成本的 Flash 層

強調推理與 agent 場景

更具表現力的語音生成

同時支援說話與唱歌

模型與價格概覽

價格對比

旗艦推理模型

輕量高效模型

多模態模型

FAQ

這個 provider 支援哪些 MiMo 模型？

API 是否相容 OpenAI 風格？