LogoMiMo API 文件
LogoMiMo API 文件
首頁歡迎使用

快速開始

定價與限速

API 參考

指南

語音合成

支援

常見問題
使用指南

語音合成

使用 MiMo-V2.5-TTS 系列模型將文字轉換為自然語音。

MiMo-V2.5-TTS 可以把文字轉成自然語音。呼叫格式按小米 MiMo 官方文件走:使用 Chat Completions。

語音合成功能目前限時免費。

API 端點

POST https://api.mimo-v2.com/v1/chat/completions

呼叫規則

  • 要合成的文字放在 assistant 訊息裡。
  • user 訊息可選,用來寫語氣、風格等要求。
  • 輸出音訊格式和音色放在 audio 物件裡。

範例

import base64
from openai import OpenAI

client = OpenAI(
    api_key="your_mimo_api_key",
    base_url="https://api.mimo-v2.com/v1"
)

completion = client.chat.completions.create(
    model="mimo-v2.5-tts",
    messages=[
        {
            "role": "assistant",
            "content": "你好!歡迎使用 Mimo API 服務。很高興為你提供服務。"
        }
    ],
    audio={
        "format": "wav",
        "voice": "mimo_default"
    }
)

audio_bytes = base64.b64decode(completion.choices[0].message.audio.data)
with open("output.wav", "wb") as f:
    f.write(audio_bytes)

引數說明

引數型別必填說明
modelstring是可用 mimo-v2.5-tts、mimo-v2.5-tts-voicedesign、mimo-v2.5-tts-voiceclone。
messagesarray是要合成的文字放在 assistant 訊息裡。
audio.formatstring否輸出格式,可用 wav、mp3、pcm16。
audio.voicestring否內建音色 ID,預設 mimo_default。

相容說明

/v1/audio/speech 仍然相容 OpenAI 語音客戶端,但推薦使用官方的 /v1/chat/completions 格式。

影片理解

使用 MiMo-V2-Omni 進行影片理解和分析。

常見問題

下一頁

目錄

API 端點
呼叫規則
範例
引數說明
相容說明