据 1M AI News 监测,英伟达在 GTC 大会上宣布进入太空计算领域,发布 Space-1 Vera Rubin 模块,专为在轨数据中心设计,集成 2 颗 Rubin GPU 和 1 颗 Vera CPU,AI 推理算力最高可达 H100 的 25 倍,使大语言模型和基础模型可直接在轨道上运行。
黄仁勋表示:「太空计算,最后的前沿,已经到来。随着卫星星座的部署和深空探索的推进,智能必须存在于数据产生的地方。」他同时坦言太空散热是一项未解决的工程挑战:「太空中没有传导,没有对流,只有辐射,我们必须搞清楚如何在太空中冷却这些系统。」
Space-1 模块针对尺寸、重量和功耗受限环境设计,支持在轨自主分析、实时数据处理和科学发现。首批合作伙伴包括太空太阳能公司 Aetherflux、私人空间站开发商 Axiom Space、卫星通信公司 Kepler Communications、地球观测公司 Planet Labs、Sophia Space 和云计算卫星公司 Starcloud。具体上市时间尚未公布。
据 1M AI News 监测,英伟达在 GTC 大会上首次公开 2028 年 Feynman 架构的完整组件阵容,这是继 Vera Rubin(2026 年下半年)和 Vera Rubin Ultra(2027 年)之后的下一代平台。
Feynman 平台包含六大核心组件:
1. Feynman GPU:下一代 AI 加速器
2. Rosa CPU:以发现 DNA 双螺旋结构的关键人物 Rosalind Franklin 命名,专为在 Agent AI 基础设施全栈中高效调度数据、工具和 Token 而设计
3. LP40 LPU:第三代语言处理单元(继 Vera Rubin 的 LP30 和 Rubin Ultra 的 LP35 之后),通过 NVLink 连接 Feynman GPU
4. BlueField-5 DPU:下一代数据处理单元
5. CX10:下一代网络控制器
6. Spectrum 7 204T:下一代网络交换芯片
互连方面,Feynman 将采用第八代 NVLink 8,支持铜缆和共封装光学(CPO)两种介质,机架规模从 Vera Rubin 的 NVL144 扩展至 NVL1152。
据 1M AI News 监测,英伟达在 GTC 大会上发布 Dynamo 1.0,一款面向生成式和 Agent 推理的开源分布式软件,定位为 AI 工厂的「操作系统」,负责在集群范围内协调 GPU 和内存资源。在最近的行业基准测试中,Dynamo 将 Blackwell GPU 的推理性能最高提升 7 倍。
黄仁勋表示:「推理是智能的引擎,驱动着每一次查询、每一个 Agent 和每一个应用。通过 Dynamo,我们创造了 AI 工厂的首个'操作系统'。」
Dynamo 通过智能「流量调度」将推理任务拆分到多个 GPU 上,并在 GPU 与低成本存储之间动态搬运数据,减少浪费、缓解内存瓶颈。对于 Agent AI 和长提示场景,Dynamo 可将请求路由到已缓存相关上下文的 GPU 上,不需要时再卸载缓存。核心组件包括 KVBM(内存管理)、NIXL(GPU 间高速数据传输)和 Grove(简化扩展),均可作为独立模块使用。Dynamo 已与 LangChain、llm-d、LMCache、SGLang 和 vLLM 等开源框架原生集成。
采用方覆盖多个层级:
1. 云服务商:AWS、微软 Azure、谷歌云、甲骨文云
2. 英伟达云合作伙伴:阿里云、CoreWeave、Nebius、Together AI 等
3. AI 原生公司:Cursor、Hebbia、Perplexity
4. 全球企业:阿斯利康、贝莱德、字节跳动、Coupang、Instacart、美团、PayPal、Pinterest、Shopee、软银
据 1M AI News 监测,英伟达在 GTC 大会上宣布成立 Nemotron Coalition,联合 8 家全球 AI 实验室共同推进开源前沿基础模型的开发。这是业界首个由模型构建者和 AI 开发者组成的联盟,通过共享研究、专业知识、数据和算力来加速开源 AI 创新。
联盟首批成员包括图像生成公司 Black Forest Labs、AI 编程工具 Cursor、AI Agent 框架 LangChain、法国 AI 公司 Mistral AI、AI 搜索引擎 Perplexity、前 DeepMind 研究员 Misha Laskin 创立的 Reflection AI、印度语言 AI 公司 Sarvam 以及前 OpenAI CTO Mira Murati 创立的 Thinking Machines Lab。
联盟首个项目是由 Mistral AI 与英伟达联合主导训练的基础模型,在英伟达 DGX Cloud 上完成训练后将开源发布,成为即将推出的 Nemotron 4 模型家族的基石。各成员将贡献各自专长:Black Forest Labs 提供多模态能力,Cursor 提供真实使用场景的性能需求和评估数据集,LangChain 专注 Agent 可靠工具调用和长程推理,Perplexity 贡献前沿模型开发经验,Sarvam 专注多语言和语音优先的本地化能力。
黄仁勋表示:「开放模型是创新的命脉,是全球参与 AI 革命的引擎。Nemotron Coalition 联合世界级 AI 实验室,开发倡导透明、协作与主权的前沿开放模型,确保 AI 的未来与世界同行、为世界而建。」
据 1M AI News 监测,英伟达在 GTC 大会上发布 Agent Toolkit 开放平台,核心组件是开源安全运行时 OpenShell,为自主运行的 AI Agent 提供基于策略的安全、网络和隐私护栏。黄仁勋在发布会上表示:「Claude Code 和 OpenClaw 引爆了 Agent 拐点,将 AI 从生成和推理延伸到了行动。员工将被由前沿、专业和定制 Agent 组成的团队所增强,企业软件行业将进化为专业化的 Agent 平台,IT 行业正处于下一次大扩张的临界点。」
Agent Toolkit 还包含与 LangChain 共同构建的开源 AI-Q Blueprint,采用前沿模型负责编排、Nemotron 开放模型负责研究的混合架构,查询成本可降低超过 50%。英伟达使用 AI-Q Blueprint 开发的 Agent 目前在 DeepResearch Bench 和 DeepResearch Bench II 两个排行榜上均排名第一。
安全方面,英伟达正与思科、CrowdStrike、谷歌、微软安全和 TrendAI 合作,使 OpenShell 兼容其网络安全和 AI 安全工具。CrowdStrike 同步发布了「安全设计 AI 蓝图」(Secure-by-Design AI Blueprint),将 Falcon 平台的防护能力直接嵌入英伟达 AI Agent 架构。
17 家软件平台厂商已接入 Agent Toolkit:Adobe、Amdocs、Atlassian、Box、Cadence、思科、Cohesity、CrowdStrike、达索系统、IQVIA、Palantir、Red Hat、SAP、Salesforce、西门子、ServiceNow 和 Synopsys。其中 Salesforce 将以 Slack 作为主界面和编排层运行 Agentforce Agent,西门子推出基于 Nemotron 的 Fuse EDA AI Agent 用于芯片和 PCB 设计全流程自动化。
据 1M AI News 监测,英伟达与 Thinking Machines Lab 宣布达成多年期战略合作,后者将部署至少 1 吉瓦的下一代 Vera Rubin 系统用于前沿模型训练,目标明年初上线。英伟达同时对 Thinking Machines Lab 进行了一笔「重大投资」,具体金额未披露。
Thinking Machines Lab 由前 OpenAI CTO Mira Murati 联合创立并担任 CEO。Murati 在公告中表示:「英伟达的技术是整个领域的基石。这次合作加速了我们构建可被用户塑造和定制的 AI 的能力。」双方合作还包括为英伟达架构设计训练和推理系统,以及为企业、研究机构和科学界拓宽前沿 AI 和开放模型的访问渠道。
黄仁勋称 Thinking Machines 汇聚了一支世界级团队来推进 AI 前沿,并表示英伟达「非常高兴能与 Thinking Machines 合作,实现他们对 AI 未来的愿景」。
据 1M AI News 监测,英伟达在 GTC 大会上宣布扩展 Nemotron 3 开放模型家族,新增三款面向 AI Agent 的多模态模型:
1. Nemotron 3 Ultra:定位前沿级智能,在 Blackwell 平台上以 NVFP4 格式实现 5 倍吞吐效率,面向编程助手、搜索和复杂工作流自动化场景
2. Nemotron 3 Omni:整合音频、视觉和语言理解能力,可从视频和文档中高效提取洞察
3. Nemotron 3 VoiceChat:支持实时对话,AI 可同时监听和回应,将自动语音识别(ASR)、大语言模型处理和语音合成(TTS)整合在单一系统中
英伟达同期还发布了 Nemotron 安全模型与 Agent 检索管线,前者检测文本和图像中的不安全内容,后者提升 Agent 输出的相关性和准确性。此外,英伟达本月 11 日已先行发布 Nemotron 3 Super,一款 1200 亿参数(120 亿活跃参数)的混合 Mamba-Transformer MoE 模型,原生支持 100 万 token 上下文窗口,吞吐量较前代提升 5 倍以上,在 OpenClaw Agent 基准测试 PinchBench 上以 85.6% 的得分成为同类最佳开放模型。
CodeRabbit、CrowdStrike、AI 编程工具 Cursor、Factory、ServiceNow 和 AI 搜索引擎 Perplexity 等公司已在部署 Nemotron 模型用于 Agent 应用。AI 科研平台 Edison Scientific 将 Nemotron 集成到其自主 AI 科学家 Kosmos 中,服务超过 5 万名研究人员,可并行执行数百项研究任务,据其官方表述可将数月研究压缩到一天完成。
据 1M AI News 监测,英伟达在 GTC 大会上发布一系列物理 AI 新产品,并与全球机器人生态的工业巨头、人形机器人先驱和手术机器人厂商展开合作。黄仁勋称「物理 AI 已经到来,每家工业企业都将成为机器人公司」。
核心产品发布:
1. Cosmos 3:首个统一合成世界生成、视觉推理和动作模拟的世界基础模型,用于加速复杂环境下的通用机器人智能开发
2. Isaac Lab 3.0:早期访问版本,支持在 DGX 级基础设施上进行大规模机器人学习,基于全新 Newton 物理引擎 1.0 和 PhysX SDK 构建,新增多物理仿真和复杂灵巧操控支持
3. GR00T N1.7:早期访问版本,附带商业许可,为量产机器人部署提供高级灵巧控制等通用技能
4. GR00T N2(预览):基于 DreamZero 研究的下一代机器人基础模型,采用全新世界动作模型架构,在新任务新环境中的成功率是主流视觉语言动作模型的两倍以上,目前在 MolmoSpaces 和 RoboArena 排行榜上排名第一,计划年底前发布
工业机器人方面,全球装机量超过 200 万台的 FANUC、ABB Robotics、YASKAWA 和 KUKA 正将 Omniverse 库和 Isaac 仿真框架集成到虚拟调试方案中,同时将 Jetson 模块集成到控制器中用于边缘 AI 推理。人形机器人方面,1X、AGIBOT、Agility、波士顿动力、Figure 等公司正使用 Cosmos、Isaac Sim 和 Isaac Lab 加速研发。医疗机器人方面,CMR Surgical 使用 Cosmos-H 仿真训练其 Versius 手术系统,强生医疗使用 Isaac Sim 和 Cosmos 后训练工作流训练 Monarch 泌尿平台,美敦力正探索 IGX Thor 为手术机器人系统提供功能安全。
大会的亮点时刻之一来自迪士尼:迪士尼使用基于英伟达 Warp 框架并集成到 Newton 物理引擎中的 GPU 加速物理模拟器 Kamino,训练雪宝(Olaf)和 BDX 机器人角色的运动策略,让雪宝学会管理自身热量并降低碰撞噪音。黄仁勋在主题演讲中与雪宝机器人同台亮相,雪宝将于 3 月 29 日在巴黎迪士尼乐园首次正式登场。
据 1M AI News 监测,Groq 3 LPU(语言处理单元)是英伟达去年 12 月以约 200 亿美元收购 AI 推理芯片初创公司 Groq 后推出的第一款芯片,预计今年第三季度开始出货。Groq 3 LPX 机架可容纳 256 颗 LPU,配备 128GB 片上 SRAM 和每秒 640TB 的扩展互连带宽。官方称 LPX 与 Vera Rubin NVL72 搭配部署时,每兆瓦推理吞吐量最高可提升 35 倍,同时解锁万亿参数、百万令牌上下文推理场景的营收潜力。黄仁勋将两款处理器描述为"极端差异却相互统一:一个追求高吞吐,一个追求低延迟",LPX 的片上内存则大幅扩展模型可用的总内存容量。LPX 机架计划今年下半年随 Vera Rubin 平台一同上市。
大会上,黄仁勋还展示了代号 Kyber 的下一代机架架构原型。Kyber 将 144 颗 GPU 的计算托盘改为垂直排列,以提升物理密度、降低延迟,将搭载于 Vera Rubin 的继任平台 Vera Rubin Ultra,预计 2027 年推出。
据 1M AI News 监测,英伟达在 GTC 大会上发布 DLSS 5,通过将传统 3D 图形的结构化数据与生成式 AI 模型融合,让 GeForce GPU 在本地实现实时 4K 照片级渲染,无需逐像素光栅化每个场景元素。黄仁勋在演讲中将这一方法描述为"可控 3D 图形与概率性生成式 AI 的融合",称前者"完全可预测"、后者"高度逼真",两者结合可让开发者创作出"既精美又可控"的内容。
黄仁勋将 DLSS 5 的技术路径定位为更广泛范式转移的起点,称"将结构化信息与生成式 AI 融合的做法,将在一个行业接一个行业中复现"。他以 Snowflake、Databricks、BigQuery 等企业数据平台为例,预判未来 AI Agent 将同时调用结构化和生成式数据库处理任务。