使用指南多模態理解
圖片理解
使用 MiMo-V2-Omni 進行圖片理解和分析。
MiMo-V2-Omni 支援圖片理解功能,你可以傳送圖片進行分析、描述和視覺問答。圖片可以透過 URL 或 base64 編碼資料提供。
使用圖片 URL
from openai import OpenAI
client = OpenAI(
api_key="your_mimo_api_key",
base_url="https://api.mimo-v2.com/v1"
)
completion = client.chat.completions.create(
model="mimo-v2-omni",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "這張圖片裡有什麼?"},
{"type": "image_url", "image_url": {"url": "https://example.com/image.jpg"}}
]
}
]
)
print(completion.choices[0].message.content)使用 Base64 編碼圖片
from openai import OpenAI
import base64
client = OpenAI(
api_key="your_mimo_api_key",
base_url="https://api.mimo-v2.com/v1"
)
with open("image.jpg", "rb") as f:
image_data = base64.b64encode(f.read()).decode()
completion = client.chat.completions.create(
model="mimo-v2-omni",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": "描述這張圖片"},
{"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{image_data}"}}
]
}
]
)
print(completion.choices[0].message.content)支援的格式
| 格式 | MIME 型別 |
|---|---|
| JPEG | image/jpeg |
| PNG | image/png |
| GIF | image/gif |
| WebP | image/webp |
圖片 Token 消耗與圖片解析度相關。解析度越高,消耗的 Token 越多。如果關注 Token 用量,建議適當壓縮圖片尺寸。
MiMo API 文件