Anthropic最危险AI模型Mythos遭入侵！黑客轻松攻破引发安全担忧_AI

你的企业AI系统，真的安全吗？

当一家以安全性著称的AI公司，其号称"最危险"的模型被轻易攻破——这给所有依赖AI的企业敲响了警钟。

Anthropic开发的Claude Mythos Preview模型是一款能够自动识别并利用所有主流操作系统和浏览器漏洞的强大安全工具。然而在4月7日发布当天，该模型就已被一群未经授权的用户通过"一名第三方承包商"的权限成功获取。

这群来自Discord私密频道的用户，利用近期Mercor数据泄露中获得的信息，结合对Anthropic其他模型格式的了解，"推测"出了Mythos模型的在线位置，轻松绕过了安全防线。

对比维度	传统安全方案	自主AI安全模型	第三方AI安全工具
漏洞检测效率	数天至数周	分钟级别	小时级别
覆盖面	已知漏洞	全平台+未知漏洞	主流平台
误报率	30-40%	5-10%	15-20%
安全风险	低	极高（被滥用后果严重）	中等

Anthropic事件的教训——安全漏洞往往来自合作伙伴而非系统本身。企业需建立第三方安全审计机制，定期审查承包商和数据供应商的安全合规状态。

对关键AI系统的访问实施多层次身份验证，包括生物识别、硬件密钥和基于行为的异常检测，避免单一权限被利用导致全面失守。

一旦发现模型被未授权访问，需在15分钟内启动响应流程：切断异常会话、通知受影响方、启动法务评估、发布透明度报告。