LogoMiMo API 文档
LogoMiMo API 文档
首页欢迎使用

快速开始

定价与限速

API 参考

指南

语音合成

支持

常见问题
使用指南

语音合成

使用 MiMo-V2.5-TTS 系列模型将文本转换为自然语音。

MiMo-V2.5-TTS 可以把文本转成自然语音。调用格式按小米 MiMo 官方文档走:使用 Chat Completions。

语音合成功能目前限时免费。

API 端点

POST https://api.mimo-v2.com/v1/chat/completions

调用规则

  • 要合成的文本放在 assistant 消息里。
  • user 消息可选,用来写语气、风格等要求。
  • 输出音频格式和音色放在 audio 对象里。

示例

import base64
from openai import OpenAI

client = OpenAI(
    api_key="your_mimo_api_key",
    base_url="https://api.mimo-v2.com/v1"
)

completion = client.chat.completions.create(
    model="mimo-v2.5-tts",
    messages=[
        {
            "role": "assistant",
            "content": "你好!欢迎使用 Mimo API 服务。很高兴为你提供服务。"
        }
    ],
    audio={
        "format": "wav",
        "voice": "mimo_default"
    }
)

audio_bytes = base64.b64decode(completion.choices[0].message.audio.data)
with open("output.wav", "wb") as f:
    f.write(audio_bytes)

参数说明

参数类型必填说明
modelstring是可用 mimo-v2.5-tts、mimo-v2.5-tts-voicedesign、mimo-v2.5-tts-voiceclone。
messagesarray是要合成的文本放在 assistant 消息里。
audio.formatstring否输出格式,可用 wav、mp3、pcm16。
audio.voicestring否内置音色 ID,默认 mimo_default。

兼容说明

/v1/audio/speech 仍然兼容 OpenAI 语音客户端,但推荐使用官方的 /v1/chat/completions 格式。

视频理解

使用 MiMo-V2-Omni 进行视频理解和分析。

常见问题

下一页

目录

API 端点
调用规则
示例
参数说明
兼容说明