英国AI安全研究所：Claude Mythos Preview成首个自主打穿32步企业网络攻击模拟的AI_快讯

据 1M AI News 监测，英国 AI 安全研究所（AISI）发布 Claude Mythos Preview 网络安全能力评测。在专家级 CTF 任务（2025 年 4 月前无任何模型能完成的难度）上，Mythos Preview 成功率达 73%。AISI 还搭建了「The Last Ones」（TLO）这一 32 步企业网络攻击模拟场景，覆盖从初始侦察到完全接管整张网络的全流程，人类完成需约 20 小时。Mythos Preview 是首个全程通关的模型，10 次测试中 3 次完整完成，全部尝试平均完成 22 步。Claude Opus 4.6 排第二，平均完成 16 步。AISI 说明，以上结果均在明确引导并提供网络访问权限的受控条件下取得。测试环境与真实企业网络存在重要差异：没有主动防守方，没有防御工具，触发安全警报也不受惩罚。因此无法确认 Mythos Preview 能否攻破防护严密的系统。两年前，最好的 AI 模型几乎无法完成初级网络任务。AISI 指出，这一进步速度要求安全评估方法必须随之升级，未来将在模拟有主动防守和实时响应的环境中继续测试。

英国AI安全研究所：Claude Mythos Preview成首个自主打穿32步企业网络攻击模拟的AI

相关文章