Anthropic Mythos 模型:CTF 测试创新高,“最后一步”凸显网络攻击潜力

张开发
2026/4/16 22:14:07 15 分钟阅读

分享文章

Anthropic Mythos 模型:CTF 测试创新高,“最后一步”凸显网络攻击潜力
【导语上周人工智能初创公司 Anthropic 限制其 Mythos 预览版模型发布范围。英国人工智能安全研究所AISI对该模型网络攻击能力评估显示Mythos 在单项测试与前沿模型无显著差异但能串联任务发起多步骤攻击。】Mythos 模型限量发布与初步评估上周Anthropic 宣布将 Mythos 预览版模型初始发布范围限制在“一小部分关键行业合作伙伴”以便他们为这个号称“在计算机安全任务方面能力惊人”的模型做准备。如今AISI 发布对该模型网络攻击能力的初步评估为 Anthropic 相关报告提供独立公开验证。CTF 测试Mythos 成绩与竞品对比自 2023 年初以来AISI 通过夺旗赛CTF挑战评估 AI 模型。当时 GPT - 3.5 Turbo 连基础的“学徒级”任务都难完成而 Mythos 预览版如今能完成超过 85%的同等级学徒级 CTF 任务达到 AISI 的 CTF 测试新高点。但近几个月GPT - 5.4、Anthropic 自家的 Opus 4.6 和 Codex 5.3 等竞争模型在多个 CTF 难度级别上也有相当成绩准确率相差在 5%至 10%之间Mythos 的提升幅度似乎不足以支撑其限量发布策略。“最后一步”测试Mythos 潜力凸显Mythos 在“最后一步”TLO测试中展现出更强网络攻击潜力。这是 AISI 为模拟针对企业网络的 32 步数据提取攻击设置的测试场景要求“在多个主机和网络段之间将数十个步骤串联起来”模拟一名训练有素人员约 20 小时才能完成的持续性操作。编辑观点Mythos 模型在网络安全测试中有亮点也有竞争其多步骤攻击能力值得关注未来在安全领域的应用和发展充满想象空间。

更多文章