余弦：使用AI工具时需警惕提示词投毒攻击

BlockBeats 消息，12 月 29 日，慢雾创始人余弦发布安全提醒，用户在使用 AI 工具时，一定要警惕 agents md/skills md/mcp 等里的提示词投毒攻击，目前已出现相关案例。AI 工具的危险模式一旦开启，相关工具可以全自动操控用户电脑而无需任何确认。但未开启危险模式则每次操作都需要用户确认，也将影响使用效率。

AI 解读

在加密领域，安全始终是首要考量。慢雾创始人余弦近期提醒用户警惕AI工具中的提示词投毒攻击，这实际上指向了一种新型社会工程学与自动化攻击的结合。攻击者通过污染AI工具的提示词库（如agents.md、skills.md或MCP协议中的预设指令），诱导AI执行恶意操作。若用户开启了工具的“危险模式”（即高权限自动化模式），AI可能无需确认直接操控电脑，导致设备被完全控制；若未开启，则每次操作需用户确认，虽能降低风险但牺牲效率。

结合其他相关案例，这种攻击并非孤立存在，而是整个攻击链条的一环。例如，虚假Zoom会议通过deepfake伪造与会人、针对X平台的钓鱼邮件绕过垃圾过滤系统、以及ComfyUI插件窃取浏览器密码等，均显示攻击手法日趋精细化和跨平台化。攻击者常利用用户对官方域名、知名软件或AI生成内容的信任，通过伪造、投毒等方式渗透。

核心问题在于，私钥或助记词等敏感信息一旦触网（如通过云输入法或非官方应用），风险便急剧上升。Babur损失2700万美元的案例正源于电脑被投毒后私钥泄露，而AI辅助编写代码时可能直接返回恶意代码（如ChatGPT返回的pump.fun交易bot代码），进一步模糊了“工具”与“威胁”的边界。

防御需多层叠加：一是严格限制自动化权限，避免开启高危险模式；二是验证所有外部资源（如链接、插件、会议软件）的真实性，尤其警惕非官方来源；三是隔离敏感信息，确保私钥永不触网，并使用系统自带输入法减少攻击面；四是保持对AI生成内容的批判性审核，即便来自可信平台。最终，安全是一种习惯，而非单次行为，需持续警惕和适应不断演化的攻击手法。

展开

原文链接

纠错/举报