模型超参

参数	说明	MiMo-V2-Pro	MiMo-V2-Omni	MiMo-V2-Flash
`temperature`	控制随机性，值越高输出越有创意	1.0	1.0	1.0
`top_p`	核采样阈值	0.95	0.95	0.95
`max_completion_tokens`	响应中的最大 Token 数	1024-128000	1024-128000	1024-64000
`frequency_penalty`	对重复 Token 的惩罚系数	0	0	0
`presence_penalty`	对已出现 Token 的惩罚系数	0	0	0
`stream`	是否启用流式输出	true/false	true/false	true/false
`stop`	停止序列	null	null	null

参数详解

控制模型输出的随机性。值为 0 时输出接近确定性结果，值越高则输出越具创意和多样性。所有 MiMo-V2 模型的推荐默认值为 1.0。

也称为核采样（nucleus sampling）。模型会从累积概率达到 top_p 的最小 Token 集合中进行采样。0.95 表示模型从累积概率至少为 95% 的最小 Token 集合中采样。

模型在单次响应中可以生成的最大 Token 数。当启用思考模式时，此数值包含可见输出和内部推理 Token。

根据 Token 在已生成文本中出现的频率进行惩罚。正值可以减少重复。

根据 Token 是否已在生成的文本中出现过进行惩罚，不考虑出现频率。正值鼓励模型引入新话题。

设置为 true 时，模型会在生成过程中以服务器发送事件（SSE）的形式逐步返回部分响应。这为交互式应用提供了更好的用户体验，可以增量显示输出内容。

指定一组停止序列，当模型生成到任意一个停止序列时，将停止继续生成。

参数	说明	MiMo-V2-Pro	MiMo-V2-Omni	MiMo-V2-Flash
`temperature`	控制随机性，值越高输出越有创意	1.0	1.0	1.0
`top_p`	核采样阈值	0.95	0.95	0.95
`max_completion_tokens`	响应中的最大 Token 数	1024-128000	1024-128000	1024-64000
`frequency_penalty`	对重复 Token 的惩罚系数	0	0	0
`presence_penalty`	对已出现 Token 的惩罚系数	0	0	0
`stream`	是否启用流式输出	true/false	true/false	true/false
`stop`	停止序列	null	null	null