LogoMiMo API 文件
LogoMiMo API 文件
首頁歡迎使用

快速開始

定價與限速

API 參考

指南

圖片理解語音理解影片理解
語音合成

支援

常見問題
使用指南多模態理解

圖片理解

使用 MiMo-V2-Omni 進行圖片理解和分析。

MiMo-V2-Omni 支援圖片理解功能,你可以傳送圖片進行分析、描述和視覺問答。圖片可以透過 URL 或 base64 編碼資料提供。

使用圖片 URL

from openai import OpenAI

client = OpenAI(
    api_key="your_mimo_api_key",
    base_url="https://api.mimo-v2.com/v1"
)

completion = client.chat.completions.create(
    model="mimo-v2-omni",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "這張圖片裡有什麼?"},
                {"type": "image_url", "image_url": {"url": "https://example.com/image.jpg"}}
            ]
        }
    ]
)

print(completion.choices[0].message.content)

使用 Base64 編碼圖片

from openai import OpenAI
import base64

client = OpenAI(
    api_key="your_mimo_api_key",
    base_url="https://api.mimo-v2.com/v1"
)

with open("image.jpg", "rb") as f:
    image_data = base64.b64encode(f.read()).decode()

completion = client.chat.completions.create(
    model="mimo-v2-omni",
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "描述這張圖片"},
                {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{image_data}"}}
            ]
        }
    ]
)

print(completion.choices[0].message.content)

支援的格式

格式MIME 型別
JPEGimage/jpeg
PNGimage/png
GIFimage/gif
WebPimage/webp

圖片 Token 消耗與圖片解析度相關。解析度越高,消耗的 Token 越多。如果關注 Token 用量,建議適當壓縮圖片尺寸。

聯網搜尋

在 MiMo 模型中啟用聯網搜尋功能,獲取實時資訊。

語音理解

使用 MiMo-V2-Omni 進行語音理解和轉錄。

目錄

使用圖片 URL
使用 Base64 編碼圖片
支援的格式