英国AI安全研究所:Claude Mythos Preview成首个自主打穿32步企业网络攻击模拟的AI

据 1M AI News 监测,英国 AI 安全研究所(AISI)发布 Claude Mythos Preview 网络安全能力评测。在专家级 CTF 任务(2025 年 4 月前无任何模型能完成的难度)上,Mythos Preview 成功率达 73%。AISI 还搭建了「The Last Ones」(TLO)这一 32 步企业网络攻击模拟场景,覆盖从初始侦察到完全接管整张网络的全流程,人类完成需约 20 小时。Mythos Preview 是首个全程通关的模型,10 次测试中 3 次完整完成,全部尝试平均完成 22 步。Claude Opus 4.6 排第二,平均完成 16 步。AISI 说明,以上结果均在明确引导并提供网络访问权限的受控条件下取得。测试环境与真实企业网络存在重要差异:没有主动防守方,没有防御工具,触发安全警报也不受惩罚。因此无法确认 Mythos Preview 能否攻破防护严密的系统。两年前,最好的 AI 模型几乎无法完成初级网络任务。AISI 指出,这一进步速度要求安全评估方法必须随之升级,未来将在模拟有主动防守和实时响应的环境中继续测试。