模型超參

引數	說明	MiMo-V2-Pro	MiMo-V2-Omni	MiMo-V2-Flash
`temperature`	控制隨機性，值越高輸出越有創意	1.0	1.0	1.0
`top_p`	核取樣閾值	0.95	0.95	0.95
`max_completion_tokens`	響應中的最大 Token 數	1024-128000	1024-128000	1024-64000
`frequency_penalty`	對重複 Token 的懲罰係數	0	0	0
`presence_penalty`	對已出現 Token 的懲罰係數	0	0	0
`stream`	是否啟用流式輸出	true/false	true/false	true/false
`stop`	停止序列	null	null	null

引數詳解

控制模型輸出的隨機性。值為 0 時輸出接近確定性結果，值越高則輸出越具創意和多樣性。所有 MiMo-V2 模型的推薦預設值為 1.0。

也稱為核取樣（nucleus sampling）。模型會從累積機率達到 top_p 的最小 Token 集合中進行取樣。0.95 表示模型從累積機率至少為 95% 的最小 Token 集合中取樣。

模型在單次響應中可以生成的最大 Token 數。當啟用思考模式時，此數值包含可見輸出和內部推理 Token。

根據 Token 在已生成文字中出現的頻率進行懲罰。正值可以減少重複。

根據 Token 是否已在生成的文字中出現過進行懲罰，不考慮出現頻率。正值鼓勵模型引入新話題。

設定為 true 時，模型會在生成過程中以伺服器傳送事件（SSE）的形式逐步返回部分響應。這為互動式應用提供了更好的使用者體驗，可以增量顯示輸出內容。

指定一組停止序列，當模型生成到任意一個停止序列時，將停止繼續生成。

引數	說明	MiMo-V2-Pro	MiMo-V2-Omni	MiMo-V2-Flash
`temperature`	控制隨機性，值越高輸出越有創意	1.0	1.0	1.0
`top_p`	核取樣閾值	0.95	0.95	0.95
`max_completion_tokens`	響應中的最大 Token 數	1024-128000	1024-128000	1024-64000
`frequency_penalty`	對重複 Token 的懲罰係數	0	0	0
`presence_penalty`	對已出現 Token 的懲罰係數	0	0	0
`stream`	是否啟用流式輸出	true/false	true/false	true/false
`stop`	停止序列	null	null	null