header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP

小米凌晨官宣MiMo-V2系列模型:Pro逼近Opus 4.6定价仅其1/5,TTS支持粤语唱歌

1M AI News 监测,小米今日凌晨正式发布 MiMo-V2 系列,涵盖旗舰推理模型 Pro、全模态基座 Omni 和语音合成 TTS。昨日本频道已报道,以「Hunter Alpha」身份匿名运行于 OpenRouter 的模型被确认为 MiMo-V2-Pro;此次为三款模型同步官宣,并首次公布定价。

MiMo-V2-Pro 总参数量超 1 万亿(42B 激活参数),支持 100 万 Token 超长上下文,专为 Agent 工作场景设计。在 Artificial Analysis 排行榜位列全球第八、国内第二,在 OpenClaw 标准评测 PinchBench 和 ClawEval 上均居全球第三。团队称整体使用体感超越 Claude Sonnet 4.6、逼近 Opus 4.6,输入定价仅为后者 1/5:256K 上下文以内输入 $1、输出 $3/百万 tokens,1M 上下文以内输入 $2、输出 $6/百万 tokens。MiMo Claw 模块已打通金山 WebOffice 生态,WPS 灵犀同步接入。

MiMo-V2-Omni 是全模态基座,支持文本、图像、音频、视频四路输入,256K 上下文,定价输入 $0.4、输出 $2/百万 tokens。音频方面支持超 10 小时连续长音频理解,综合评测超越 Gemini 3 Pro;图像理解超越 Claude Opus 4.6、逼近 Gemini 3 Pro。

MiMo-V2-TTS 基于自研 Audio Tokenizer,经上亿小时语音数据预训练并引入多维度强化学习,支持从整体风格到局部情绪的多粒度控制,同一句话内可完成语气转折和情感递变,并可合成高质量歌声。方言覆盖东北话、四川话、河南话、粤语和台湾腔。

三款模型现已接入 Xiaomi miclaw、MiMo Studio、金山办公和小米浏览器,并可通过 OpenClaw、OpenCode、KiloCode、Blackbox、Cline 五大 Agent 开发框架调用,限时免费一周。

举报 纠错/举报
纠错/举报
提交
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成