LogoMiMo API 文件
LogoMiMo API 文件
首頁Welcome

Quick Start

Pricing & Rate Limits

API Reference

Guides

Text-to-Speech

Support

FAQ
Usage Guide

语音合成

使用 MiMo-V2-TTS 模型将文本转换为自然语音。

MiMo-V2-TTS 提供高质量的语音合成服务,可以将文本转换为自然流畅的语音。

语音合成功能目前限时免费。收费方案将在免费期结束前公布。

API 端点

POST https://api.mimo-v2.com/v1/audio/speech

示例

from openai import OpenAI

client = OpenAI(
    api_key="your_mimo_api_key",
    base_url="https://api.mimo-v2.com/v1"
)

response = client.audio.speech.create(
    model="mimo-v2-tts",
    voice="alloy",
    input="你好!欢迎使用 Mimo API 服务。很高兴为你提供服务。"
)

response.stream_to_file("output.mp3")

参数说明

参数类型必填说明
modelstring是使用的 TTS 模型,设置为 mimo-v2-tts。
inputstring是需要合成语音的文本内容。
voicestring是用于合成的语音角色。
response_formatstring否输出音频格式,默认为 mp3。
speednumber否语速倍率(0.25 到 4.0),默认为 1.0。

支持的输出格式

格式说明
mp3MPEG 音频(默认)
opusOpus 编码,低延迟
aacAAC 音频
flac无损音频
wav未压缩 WAV
pcm原始 PCM 音频

Video Understanding

Use MiMo-V2-Omni for video understanding and analysis.

FAQ

下一頁

目錄

API 端点
示例
参数说明
支持的输出格式