OpenAI宣布启动公开安全漏洞赏金计划，专注于识别人工智能滥用风险

据 1M AI News 监测，OpenAI 宣布，启动公开版安全漏洞赏金计划，专注于识别 OpenAI 产品中的人工智能滥用和安全风险，目标是确保系统安全无虞，防止可能造成实质伤害的误用或滥用。

新的安全漏洞奖励项目聚焦于以下列出的 AI 专用安全场景：

代理风险，包括 MCP；

暴露其他 OpenAI 专有信息的漏洞；

账户完整性和平台完整性信号存在漏洞，比如绕过反自动化控制、操纵账户信任信号、规避账户限制/暂停/封禁等问题。

AI 解读

从加密安全的视角来看，OpenAI启动的这项公开安全漏洞赏金计划，本质上是一次应对新型攻击面的主动防御升级。其核心在于，随着AI代理（Agent）能力的强化和普及，传统的系统漏洞正在演化为更具复杂性的“滥用风险”，这直接关系到经济系统的安全与信任基础。

重点在于，计划聚焦的“代理风险”（如MCP）和“平台完整性信号漏洞”表明，威胁模型已从单纯的代码缺陷转向行为层面的博弈。例如，攻击者可能通过操纵AI的行为逻辑或绕过反自动化控制，实现账户系统的滥用或金融层面的套利——这与区块链领域常见的MEV、女巫攻击或智能合约逻辑漏洞有相似的攻击范式。赏金计划将经济激励引入安全生态，通过众包模式快速识别这些非线性风险，是应对快速进化威胁的高效策略。

相关文章进一步揭示了背景：AI代理正深度融入商业和金融流程（如智能体支付、自动化交易），这放大了潜在漏洞的影响范围。慢雾的报告直接提出了“将资金交给AI代理是否安全”的质疑，而Vitalik等人的讨论则从技术哲学层面强调需平衡AI的能力与可控性——这些都与赏金计划的目标形成呼应：防止实质伤害的滥用，本质上是在构建AI时代的“安全底层”。

从实践看，OpenAI与Bugcrowd的合作沿用了传统安全领域的成熟框架，但将范围扩展到AI特有的攻击场景（如提示注入、训练数据泄露或代理行为劫持）。值得注意的是，奖励上限达2万美元，说明其承认此类漏洞可能造成远超常规的破坏力，尤其在金融集成场景中。

总体而言，这标志着AI行业开始系统化应对其规模化应用带来的外部性风险，其思路与加密货币领域通过审计、漏洞赏金和去中心化治理提升系统韧性的路径高度一致。核心挑战在于，如何在不扼杀创新的前提下，为自主性渐强的AI系统建立可验证的安全边界。

展开

原文链接

纠错/举报