header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
扫码下载APP
全部
预测市场
AI
链上侦探
融资
2026-04-01
订阅推送
自动更新

1M AI News 监测,智谱 AI 交出了一份令华尔街侧目的成绩单,全年营收同比暴增逾一倍,但真正让市场震惊的,是财报发布后披露的一个实时数据:截至 2026 年 3 月 31 日,公司开放平台 API 的年度经常性收入(ARR)已飙升至约 17 亿元人民币(约 2.5 亿美元),较 2025 年底的约 5 亿元人民币暴增逾 2.4 倍,较 12 个月前更是增长约 60 倍。摩根士丹利和摩根大通均将此视为本次财报最大的惊喜。更具说服力的是,这一增长并非单纯靠以价换量堆出。


摩根大通在研报中特别指出,智谱 API 平台的 Token 价格年初至今已上涨 83%,而需求仍在持续加速——量价同步攀升,在当前中国大模型价格战白热化的背景下,这一现象极为罕见,直接印证了智谱在编程、智能体等高价值场景中已形成实质性的定价权。

[原文链接]

1M AI News 监测,Claude Code 新宠物功能/buddy 系统上线数小时,开发者社区就从泄露源码中找到了重抽方法,开源工具和教程已在 Linux.do、V2EX、GitHub 等平台传播。

目前至少有两种重抽路径。一种针对宠物生成算法中的固定盐值(salt),该值以 15 个字符硬编码在 Claude Code 的编译产物中,通过同长度替换即可改变随机种子,暴力枚举后找到对应目标宠物的值写入即可。另一种利用认证路径差异:订阅用户正常登录时,服务端下发的 accountUuid 作为宠物种子且无法篡改,但通过环境变量认证时该值不被写入本地配置,系统退而求其次读取可自由编辑的 userID 字段。

改 salt 的方法最脆弱,下次 Claude Code 更新就会被覆盖。改 userID 对订阅用户来说也有保质期,Anthropic 补上环境变量路径的 accountUuid 写入逻辑即可封堵。API 用户(使用自有 API Key 认证)天然没有 accountUuid,可直接修改 userID,窗口相对更长,但 Anthropic 同样可以通过 API Key 哈希生成稳定标识来封堵。骨架数据不存本地,每次启动实时计算,任何服务端补丁都能立刻生效。

另外,userID 不只服务于宠物系统。泄露源码显示遥测上报和 A/B 测试分组同样读取该值,修改后可能导致实验功能异常或使用数据断裂。

[原文链接]

1M AI News 监测,英伟达宣布向半导体公司 Marvell Technology 投资 20 亿美元,同时通过 NVLink Fusion 平台向 Marvell 开放 AI 服务器架构,允许其将定制 AI 芯片和网络设备集成到英伟达系统中。双方还将在硅光子(用光代替铜线传输数据,可大幅提速并降低能耗)和 5G/6G 电信网络 AI 化方面展开合作。

Marvell 的核心业务之一是帮助亚马逊等云计算巨头设计定制 AI 加速芯片,这些芯片本质上是英伟达 GPU 的替代方案。英伟达此举相当于主动拥抱定制芯片趋势:与其让客户在英伟达 GPU 和定制芯片之间二选一,不如让定制芯片也运行在英伟达的基础设施生态中。按照合作分工,Marvell 提供定制加速芯片(XPU)和兼容 NVLink Fusion 的扩展网络,英伟达提供 Vera CPU、网卡、DPU、交换机和机柜级 AI 算力。

黄仁勋在声明中称:「推理拐点已经到来,token 生成需求激增,全世界都在竞相建造 AI 工厂。」Marvell 董事长兼 CEO Matt Murphy 在 CNBC 采访中表示他不认为这是零和博弈,两家公司正在共同扩大整个市场。

这是英伟达近年来沿 AI 供应链的又一笔数十亿美元级投资。去年 5 月黄仁勋宣布开放 AI 服务器架构允许多家合作伙伴(包括 Marvell)部署定制芯片,此次入股是这一开放战略的实质性落地。硅光子合作同样值得关注,Marvell 去年 12 月已收购硅光子初创公司 Celestial AI。消息公布后 Marvell 股价大涨 13% 至 99.05 美元,创三周多以来最大单日涨幅;英伟达涨 5.6% 至 174.40 美元。

[原文链接]

1M AI News 监测,AI 云平台 Together AI 开源 Aurora,一个基于强化学习的推测解码(speculative decoding)自适应框架。推测解码是当前加速大模型推理的主流手段:用一个小型「草稿模型」快速预测 token 序列,再由大模型并行验证,命中的直接采用,未命中的丢弃重来。问题在于,草稿模型是离线训练的静态产物,生产流量一旦漂移(模型升级、用户群变化、任务类型切换),预测准确率就持续下降,而重新离线训练既昂贵又滞后。

Aurora 把推测解码重新建模为强化学习问题:草稿模型是策略,大模型验证器是环境,被接受的 token 是正奖励,被拒绝的是负反馈。系统分推理服务器和训练服务器两个解耦组件,推理端正常处理请求并将验证结果流式写入缓冲区,训练端异步拉取数据更新草稿模型权重后热替换回推理端,全程不中断服务。

在 4 万条跨 5 个领域(数学推理、Text-to-SQL、代码生成、金融、通用对话)的模拟流量测试中,Aurora 在流量域突变后约 1 万条请求内恢复接受长度,比训练充分的静态草稿模型额外提速 1.25 倍。更值得注意的结果是,从零开始在线训练的 Aurora 接受长度达到 3.08,超过静态基线的 2.63 和「先预训练再微调」基线的 2.99,吞吐量稳定在 302.3 tokens/秒,直接挑战了「推测解码必须依赖大规模离线预训练」的既有认知。

端到端实测中,在 Qwen3-Coder-Next(FP8)上 batch size 为 1 时推测解码带来 1.92 倍加速,MiniMax M2.5(FP8)上为 1.63 倍。Aurora 去年发布的前身 ATLAS 奠定了自适应推测器的基础,此次升级为完全自主的闭环系统。代码已在 GitHub 开源。

[原文链接]

1M AI News 监测,阿联酋 Falcon LLM 系列研发机构技术创新研究所(TII)在 Hugging Face 发布 Falcon Perception 和 Falcon OCR 两款视觉模型。两款模型均采用「早期融合」单一 Transformer 骨干:图像块与文本 token 共享参数空间,图像 token 使用双向注意力,文本 token 使用因果注意力,省去传统「视觉编码器 + 文本解码器」的级联设计。这使模型能真正读懂自然语言里的空间限定和对象关系,而不只是对视觉特征做语义检索。

Falcon Perception 参数量 0.6B,定位开放词汇图像分割与定位。在 SA-Co 基准上取得 Macro-F1 68.0,高于 Meta SAM 3 的 62.3。TII 同步发布诊断基准 PBench,按能力维度分层评测。Falcon Perception 在需要语言理解的任务上领先最为明显:

1. L2(OCR 引导识别,如找「标有 168 字样的酒瓶」):38.0 vs SAM 3 的 24.6(+13.4)
2. L3(空间关系,如「左边的黑色汽车」「从左数第三扇窗」):53.5 vs SAM 3 的 31.6(+21.9)
3. L4(交互关系,如「拿着雨伞的人」「使用手机的人」):49.1 vs SAM 3 的 33.3(+15.8)
4. 密集场景(数百实例共存):72.6 vs SAM 3 的 58.4(+14.2)

简单对象(L0)差距仅 +0.8,印证了差距随语言复杂度增大的规律。实例存在性校准(是否存在目标)方面,SAM 3 仍占优:MCC 0.82 vs 0.64。

Falcon OCR 参数量 0.3B,复用相同骨干但从零训练,专为文档理解设计。olmOCR 基准得分 80.3(距榜首 1.7 分),多栏版面(87.1%)和表格提取(90.3%)领跑所有测试模型;OmniDocBench 得分 88.64,超过参数量更大或依赖专有基础设施的 DeepSeek OCR v2、GPT 5.2 和 Mistral OCR 3。据 TII 官方表述,Falcon OCR 是开源 OCR 模型中吞吐量最高的,在单张 A100-80GB 上高并发实测达 5,825 token/秒(全流程约 2.9 张图/秒)。

两款模型均已在 Hugging Face 开源,Falcon Perception 提供在线 Playground。

[原文链接]

1M AI News 监测,甲骨文(Oracle)周二启动大规模裁员。CNBC 援引两名知情人士确认裁员规模达数千人;一名甲骨文员工告诉 BBC,据公司内部 Slack 活跃人数变化推算,约 1 万人已受影响。TD Cowen 分析师今年 1 月估计,甲骨文裁减 2 万至 3 万人可带来 80 亿至 100 亿美元增量自由现金流。截至 2025 年 5 月,甲骨文全球员工约 16.2 万人。

多名员工在社交媒体上描述了裁员过程:凌晨 6 点(美东时间),署名「Oracle Leadership」的解雇邮件到达收件箱,告知当天即为最后工作日,此前没有任何来自主管或人力部门的预告。签署 DocuSign 离职文件后可获一个月遣散金,未归属的限制性股票单位立即作废。甲骨文高级经理 Michael Shepherd 在 LinkedIn 发帖称,被裁人员涵盖高级工程师、架构师、运维负责人、项目经理和技术专家,裁员与绩效无关。

裁员直接服务于甲骨文对 AI 基础设施的激进投入。公司今年 1 月宣布通过债务和股权融资 500 亿美元用于数据中心建设,也是 Stargate 计划(与 OpenAI、软银合作,总投资 5000 亿美元)的参与方。联席 CEO Clayton Magouyrk 本月财报电话会上称,「AI 基础设施的需求,无论 GPU 还是 CPU,都持续超过供应」,公司待确认合同金额已达 5530 亿美元。甲骨文股价今年已下跌 25%,跌幅超过所有科技巨头,但裁员消息公布后当天股价反涨约 5%。甲骨文拒绝置评。

[原文链接]

1M AI News 监测,AI 基础模型公司 Inception Labs 于 3 月 30 日发布 Mercury Edit 2,一款专为代码编辑器「下一处改动预测」设计的扩散语言模型(dLLM)。与传统自回归模型逐 token 生成不同,Mercury Edit 2 用扩散机制并行生成所有 token,速度足以在用户思考时同步完成预测,按 Tab 键接受。

模型结合编辑历史和代码库上下文预测用户下一步改动。训练上,Inception Labs 采用 KTO(一种无配对强化学习方法),以用户接受或拒绝建议的行为作为偏好数据进行对齐。对齐后,模型改动接受率提升 48%,主动出示建议的频率降低 27%,改动更集中、干扰更少。

在涵盖行补全、变量重命名、重构、特性实现等场景的三个开源基准(Instinct、FIM、NEP)及一个内部基准上,Mercury Edit 2 的质量和速度均优于对照的定制下一处改动模型和速度优化前沿模型。代码编辑器 Zed 联合创始人 Max Brunsfeld 称,Mercury Edit 2 带来了「一种有实质差异的扩散式生成路径」。

Mercury Edit 2 现已通过 Inception Platform 开放 API 接入,集成至 Zed 和 ProxyAI。定价为输入 $0.25/百万 token,输出 $0.75/百万 token,缓存输入 $0.025/百万 token;新账号自动获赠 1000 万免费 token;Zed 用户使用官方提供的 API Key 可免费体验一个月。

[原文链接]

1M AI News 监测,Web3智能手机制造商 Nothing 正在开发 AI 智能眼镜,计划于 2027 年上半年发布。彭博援引知情人士称,眼镜将配备摄像头、麦克风和扬声器,不设屏幕,AI 处理依赖智能手机和云端,与 Meta Ray-Ban 的技术路线相近。

有趣的是,CEO 裴宇此前明确抵制这一方向。知情人士称他此后改变想法,近期告知员工公司正专注于向手机和音频产品以外扩展更多品类。Nothing 目前产品线仅涵盖 Android 手机和音频设备。

此次入局时机敏感,三星和谷歌均在 Android XR 生态下规划各自的智能眼镜,Meta Ray-Ban 已率先确立市场标杆。Nothing 以独特工业设计著称,如何在同质化硬件规格下做出差异化,是这款产品能否立足的关键问题。

[原文链接]

1M AI News 监测,谷歌威胁情报团队(GTIG)和 Mandiant 将昨日 axios 供应链攻击归因于 UNC1069,一个自 2018 年起活跃、以金融动机为主的朝鲜背景黑客组织,历史攻击目标以加密货币和 AI 行业为主。归因依据是此次部署的 WAVESHAPER.V2 后门与 UNC1069 历史使用版本的直接代码传承,以及 C2 基础设施(sfrclak[.]com / 142.11.206.73)与其过往活动记录的重叠。

感染影响已在野确认。Huntress 检测到恶意包上线 89 秒后出现首次感染,确认至少 135 个客户系统在约 3 小时暴露期内遭入侵;Wiz 遥测显示安装了受影响版本的环境中约 3% 出现 RAT 执行记录。

调查同时披露了攻击为何能绕过 OIDC 和 2FA:axios 项目已将发布流程迁移至 OIDC Trusted Publishing,但发布配置中同时保留了旧式长期 npm token;npm 在两者并存时默认优先使用旧 token,攻击者只需窃取这个 legacy token 即可绕过所有现代安全措施。axios 主维护者事后发文:「我对几乎所有账号都启用了 2FA/MFA。」这一凭证遗留问题在过去 7 个月内已连续引发三次主要 npm 供应链攻击。

[原文链接]

1M AI News 监测,OpenAI 于 3 月 31 日更新 ChatGPT,新增 CarPlay 支持,成为主要 AI 工具中首个推出专属 CarPlay 应用的。使用须将 iPhone 升级至 iOS 26.4 或更高版本,该系统版本上周发布,首次将「语音对话类应用」纳入 CarPlay 允许的应用类别,并要求开发者申请苹果专项授权后方可接入。

CarPlay 版 ChatGPT 完全以语音为主要交互方式,不显示文字或图像,符合苹果针对驾驶场景的安全设计规范。界面仅有「结束」和静音两个按钮,支持查看历史语音对话列表。目前没有唤醒词,需手动在 CarPlay 界面打开应用才能使用;ChatGPT 也不能控制车辆功能或 iPhone 操作。

对驾驶途中想免持提问的用户来说,这是 Siri 之外的新选择。苹果同样的接入规则对所有第三方语音 AI 应用开放,ChatGPT 只是率先到位。

[原文链接]
查看更多
新增文库
仅自己可见
公开
保存
选择文库
新增文库
取消
完成