小米凌晨官宣MiMo-V2系列模型：Pro逼近Opus 4.6定价仅其1/5，TTS支持粤语唱歌

据 1M AI News 监测，小米今日凌晨正式发布 MiMo-V2 系列，涵盖旗舰推理模型 Pro、全模态基座 Omni 和语音合成 TTS。昨日本频道已报道，以「Hunter Alpha」身份匿名运行于 OpenRouter 的模型被确认为 MiMo-V2-Pro；此次为三款模型同步官宣，并首次公布定价。

MiMo-V2-Pro 总参数量超 1 万亿（42B 激活参数），支持 100 万 Token 超长上下文，专为 Agent 工作场景设计。在 Artificial Analysis 排行榜位列全球第八、国内第二，在 OpenClaw 标准评测 PinchBench 和 ClawEval 上均居全球第三。团队称整体使用体感超越 Claude Sonnet 4.6、逼近 Opus 4.6，输入定价仅为后者 1/5：256K 上下文以内输入 $1、输出 $3/百万 tokens，1M 上下文以内输入 $2、输出 $6/百万 tokens。MiMo Claw 模块已打通金山 WebOffice 生态，WPS 灵犀同步接入。

MiMo-V2-Omni 是全模态基座，支持文本、图像、音频、视频四路输入，256K 上下文，定价输入 $0.4、输出 $2/百万 tokens。音频方面支持超 10 小时连续长音频理解，综合评测超越 Gemini 3 Pro；图像理解超越 Claude Opus 4.6、逼近 Gemini 3 Pro。

MiMo-V2-TTS 基于自研 Audio Tokenizer，经上亿小时语音数据预训练并引入多维度强化学习，支持从整体风格到局部情绪的多粒度控制，同一句话内可完成语气转折和情感递变，并可合成高质量歌声。方言覆盖东北话、四川话、河南话、粤语和台湾腔。

三款模型现已接入 Xiaomi miclaw、MiMo Studio、金山办公和小米浏览器，并可通过 OpenClaw、OpenCode、KiloCode、Blackbox、Cline 五大 Agent 开发框架调用，限时免费一周。

原文链接

纠错/举报