据 1M AI News 监测,Anthropic 周二宣布 Project Glasswing 网络安全计划,同时正式公布此前泄露的新模型 Claude Mythos Preview。这个模型没有公开发售,Anthropic 认为它的网络攻防能力太强,需要先让防御方用起来。苹果、微软、谷歌、AWS、英伟达等 11 家机构作为创始合作方,将用 Mythos Preview 扫描自家系统的安全漏洞,另有 40 多家关键软件基础设施机构也拿到了访问权限。
Anthropic CEO Dario Amodei 在发布视频中说:「我们没有专门训练它擅长网络安全,我们训练它擅长编程,但擅长编程的副作用就是也擅长网络安全。更强大的模型会不断从我们和其他公司手中诞生,我们需要一个应对方案。」
过去数周,Mythos Preview 在所有主流操作系统和浏览器中找到了数千个高危零日漏洞,大部分完全自主完成,不需要人类引导。三个已修复的案例:
1. OpenBSD(以安全著称,广泛用于防火墙的操作系统)中一个藏了 27 年的漏洞,攻击者连上目标机器就能远程让它崩溃
2. FFmpeg(被大量软件用于视频编解码的开源库)中一个 16 年的漏洞,自动化测试工具跑过那行代码 500 万次都没发现
3. Linux 内核中多个漏洞的链式利用,能从普通用户权限一路提到完全控制整台机器
创始合作方完整名单:AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金会、微软、英伟达、Palo Alto Networks。Anthropic 投入最高 1 亿美元模型使用额度,另捐 400 万美元给开源安全组织(250 万给 Linux 基金会下的 Alpha-Omega 和 OpenSSF,150 万给 Apache 软件基金会)。
基准测试上,Mythos Preview 全面拉开了与上一代旗舰 Claude Opus 4.6 的差距:
1. 网络安全漏洞复现 CyberGym:83.1% vs 66.6%
2. SWE-bench Verified:93.9% vs 80.8%
3. SWE-bench Pro:77.8% vs 53.4%
4. GPQA Diamond:94.6% vs 91.3%
5. Humanity's Last Exam(含工具):64.7% vs 53.1%
1 亿美元额度用完后,合作方按每百万输入 token 25 美元、输出 125 美元付费,支持 Claude API、Amazon Bedrock、Vertex AI 和 Microsoft Foundry。Anthropic 计划先在下一版 Claude Opus 上部署安全防护,为日后开放 Mythos 级别的模型铺路。
Anthropic 前沿红队负责人 Logan Graham 对《连线》说:「6 到 24 个月内这种能力就会普及,我们现有安全体系依赖的很多假设都可能失效。」Anthropic 承诺 90 天内公开研究成果。
同日 Anthropic 披露年化营收已破 300 亿美元(2025 年底约 90 亿),并宣布与谷歌和博通达成数 GW 级算力协议,据报道最早可能今年 10 月 IPO。