使用指南
語音合成
使用 MiMo-V2-TTS 模型將文字轉換為自然語音。
MiMo-V2-TTS 提供高質量的語音合成服務,可以將文字轉換為自然流暢的語音。
語音合成功能目前限時免費。收費方案將在免費期結束前公佈。
API 端點
POST https://api.mimo-v2.com/v1/audio/speech示例
from openai import OpenAI
client = OpenAI(
api_key="your_mimo_api_key",
base_url="https://api.mimo-v2.com/v1"
)
response = client.audio.speech.create(
model="mimo-v2-tts",
voice="alloy",
input="你好!歡迎使用 Mimo API 服務。很高興為你提供服務。"
)
response.stream_to_file("output.mp3")引數說明
| 引數 | 型別 | 必填 | 說明 |
|---|---|---|---|
model | string | 是 | 使用的 TTS 模型,設定為 mimo-v2-tts。 |
input | string | 是 | 需要合成語音的文字內容。 |
voice | string | 是 | 用於合成的語音角色。 |
response_format | string | 否 | 輸出音訊格式,預設為 mp3。 |
speed | number | 否 | 語速倍率(0.25 到 4.0),預設為 1.0。 |
支援的輸出格式
| 格式 | 說明 |
|---|---|
mp3 | MPEG 音訊(預設) |
opus | Opus 編碼,低延遲 |
aac | AAC 音訊 |
flac | 無損音訊 |
wav | 未壓縮 WAV |
pcm | 原始 PCM 音訊 |
MiMo API 文件