据 1M AI News 监测,英伟达在 GTC 大会上发布 Physical AI Data Factory Blueprint,一套面向机器人、视觉 AI Agent 和自动驾驶的开源参考架构,将训练数据的生成、增强和评估统一为自动化流水线。英伟达 Omniverse 和仿真技术副总裁 Rev Lebaredian 称:「在这个新时代,算力就是数据。」
该蓝图由三个模块化组件构成:
1. Cosmos Curator:处理、精炼和标注大规模真实与合成数据集
2. Cosmos Transfer:通过生成环境和光照变体,指数级扩充数据量,覆盖现实中难以采集的长尾场景
3. Cosmos Evaluator:自动对生成数据进行物理准确性评分和筛选,已在 GitHub 开源
编排框架 OSMO 已接入 Claude Code、OpenAI Codex 和 Cursor 等 AI 编程 Agent,使其能自动管理计算资源、疏通瓶颈。微软 Azure 和 Nebius 已将该蓝图集成至各自的云基础设施,FieldAI、Hexagon Robotics、Skild AI、Uber、Teradyne Robotics 等已在使用。
英伟达自身也用该蓝图训练 Alpamayo 1.5,据英伟达称这是首个面向自动驾驶长尾场景的开源推理型视觉语言动作(VLA)模型,支持导航引导、提示条件控制和多摄像头灵活配置。自动驾驶卡车技术公司 PlusAI 已宣布将 Alpamayo 适配至其卡车平台。完整蓝图预计 4 月在 GitHub 开源。