BlockBeats 消息,12 月 29 日,慢雾创始人余弦发布安全提醒,用户在使用 AI 工具时,一定要警惕 agents md/skills md/mcp 等里的提示词投毒攻击,目前已出现相关案例。AI 工具的危险模式一旦开启,相关工具可以全自动操控用户电脑而无需任何确认。但未开启危险模式则每次操作都需要用户确认,也将影响使用效率。
在加密领域,安全始终是首要考量。慢雾创始人余弦近期提醒用户警惕AI工具中的提示词投毒攻击,这实际上指向了一种新型社会工程学与自动化攻击的结合。攻击者通过污染AI工具的提示词库(如agents.md、skills.md或MCP协议中的预设指令),诱导AI执行恶意操作。若用户开启了工具的“危险模式”(即高权限自动化模式),AI可能无需确认直接操控电脑,导致设备被完全控制;若未开启,则每次操作需用户确认,虽能降低风险但牺牲效率。
结合其他相关案例,这种攻击并非孤立存在,而是整个攻击链条的一环。例如,虚假Zoom会议通过deepfake伪造与会人、针对X平台的钓鱼邮件绕过垃圾过滤系统、以及ComfyUI插件窃取浏览器密码等,均显示攻击手法日趋精细化和跨平台化。攻击者常利用用户对官方域名、知名软件或AI生成内容的信任,通过伪造、投毒等方式渗透。
核心问题在于,私钥或助记词等敏感信息一旦触网(如通过云输入法或非官方应用),风险便急剧上升。Babur损失2700万美元的案例正源于电脑被投毒后私钥泄露,而AI辅助编写代码时可能直接返回恶意代码(如ChatGPT返回的pump.fun交易bot代码),进一步模糊了“工具”与“威胁”的边界。
防御需多层叠加:一是严格限制自动化权限,避免开启高危险模式;二是验证所有外部资源(如链接、插件、会议软件)的真实性,尤其警惕非官方来源;三是隔离敏感信息,确保私钥永不触网,并使用系统自带输入法减少攻击面;四是保持对AI生成内容的批判性审核,即便来自可信平台。最终,安全是一种习惯,而非单次行为,需持续警惕和适应不断演化的攻击手法。