使用指南
語音合成
使用 MiMo-V2.5-TTS 系列模型將文字轉換為自然語音。
MiMo-V2.5-TTS 可以把文字轉成自然語音。呼叫格式按小米 MiMo 官方文件走:使用 Chat Completions。
語音合成功能目前限時免費。
API 端點
POST https://api.mimo-v2.com/v1/chat/completions呼叫規則
- 要合成的文字放在
assistant訊息裡。 user訊息可選,用來寫語氣、風格等要求。- 輸出音訊格式和音色放在
audio物件裡。
範例
import base64
from openai import OpenAI
client = OpenAI(
api_key="your_mimo_api_key",
base_url="https://api.mimo-v2.com/v1"
)
completion = client.chat.completions.create(
model="mimo-v2.5-tts",
messages=[
{
"role": "assistant",
"content": "你好!歡迎使用 Mimo API 服務。很高興為你提供服務。"
}
],
audio={
"format": "wav",
"voice": "mimo_default"
}
)
audio_bytes = base64.b64decode(completion.choices[0].message.audio.data)
with open("output.wav", "wb") as f:
f.write(audio_bytes)引數說明
| 引數 | 型別 | 必填 | 說明 |
|---|---|---|---|
model | string | 是 | 可用 mimo-v2.5-tts、mimo-v2.5-tts-voicedesign、mimo-v2.5-tts-voiceclone。 |
messages | array | 是 | 要合成的文字放在 assistant 訊息裡。 |
audio.format | string | 否 | 輸出格式,可用 wav、mp3、pcm16。 |
audio.voice | string | 否 | 內建音色 ID,預設 mimo_default。 |
相容說明
/v1/audio/speech 仍然相容 OpenAI 語音客戶端,但推薦使用官方的 /v1/chat/completions 格式。
MiMo API 文件