Anthropic发布神话模型Mythos,却不让你用
Anthropic 发布了 Claude Mythos Preview 模型,它能自主发现藏了 27 年的系统漏洞,却因能力过于危险而拒绝公开。联合 12 家科技巨头发起玻璃翼计划,投入 1 亿美元抢在攻击者之前修复全球软件漏洞。
Anthropic 发布史上最强模型 Claude Mythos,却不敢让我们用
因为它太强了——强到能自主发现并利用藏了 27 年的系统漏洞。
2026 年 4 月 8 日,Anthropic 做了一件 AI 行业前所未有的事:发布了一个模型,公布了它的能力数据,然后明确告诉全世界——你们不能用。
这个模型叫 Claude Mythos Preview("神话"预览版)。
不是因为它不够好。恰恰相反,是因为它好得让 Anthropic 自己都害怕了。
一、它到底有多强?
先看硬指标。

编码能力:碾压式领先
| 基准测试 | Mythos Preview | Opus 4.6(上一代旗舰) | 差距 |
|---|---|---|---|
| SWE-bench Pro(最难级别) | 77.8% | 53.4% | +24.4pp |
| Terminal-Bench 2.0 | 82.0% | 65.4% | +16.6pp |
| SWE-bench Multimodal | 59.0% | 27.1% | +31.9pp |
| SWE-bench Multilingual | 87.3% | 77.8% | +9.5pp |
| SWE-bench Verified | 93.9% | 80.8% | +13.1pp |
SWE-bench Verified 是业界公认的代码工程"金标准"——用真实开源项目的 bug 测试 AI 的修复能力。93.9% 意味着每 20 个真实软件问题,它能独立解决将近 19 个。
SWE-bench Pro 是最难的变体,Mythos 领先上一代超过 24 个百分点。这不是渐进式改善,而是代际跨越。
推理能力:全面登顶
| 基准测试 | Mythos Preview | Opus 4.6 |
|---|---|---|
| GPQA Diamond(研究生级科学推理) | 94.6% | 91.3% |
| USAMO 2026(数学奥赛证明) | 97.6% | 42.3% |
| Humanity's Last Exam(带工具) | 64.7% | 53.1% |
| BrowseComp(复杂网络研究) | 86.9% | 83.7% |
| OSWorld-Verified(桌面自主操作) | 79.6% | 72.7% |
USAMO 2026 的跳跃最为惊人:从 42.3% 到 97.6%,单项提升 55 个百分点。这是一个在真正的数学奥林匹克证明题上几乎满分的 AI。
网络安全:真正让人不安的能力
| 基准测试 | Mythos Preview | Opus 4.6 |
|---|---|---|
| CyberGym(漏洞复现) | 83.1% | 66.6% |
| Cybench | 100%(pass@1 饱和) | — |
CyberGym 测试的是模型发现和复现真实安全漏洞的能力。Mythos 在 Cybench 上达到了 100% 的 pass@1——测试已经无法衡量它的上限。
这些数字意味着什么?用 Anthropic 自己的话说:
AI 模型在代码能力上已经达到了一个水平——它们可以超越绝大多数人类专家来发现和利用软件漏洞。
二、它发现了什么?

过去几周,Anthropic 的安全研究团队用 Mythos Preview 扫描了全球关键基础软件,发现了数千个零日漏洞——软件开发者此前完全不知道的严重安全缺陷。
以下是几个已经确认并修复的案例:
OpenBSD:藏了 27 年的致命漏洞
OpenBSD 被公认为世界上安全性最高的操作系统之一,广泛用于网络防火墙和关键基础设施。
Mythos 在其中发现了一个存在 27 年的底层漏洞。攻击者只需远程连接到运行该系统的计算机,就能使其崩溃。
27 年。无数安全专家审查过这份代码。没人发现。
FFmpeg:500 万次自动测试都没找到的 Bug
FFmpeg 是全球使用最广泛的音视频处理库,被无数软件用于视频的编码和解码。
Mythos 发现了一个隐藏 16 年的深层漏洞。相关代码行曾被自动化测试工具执行过 500 万次,自动化工具从未发现任何异常。
机器智能用了不一样的方式"阅读"代码,捕捉到了所有传统方法都漏掉的问题。
FreeBSD NFS:17 年远程代码执行
FreeBSD 的网络文件系统实现中,Mythos 发现了一个 17 年前引入的远程代码执行漏洞(CVE-2026-4747)——攻击者可以通过网络直接在目标服务器上运行任意代码。
Linux 内核:漏洞链式提权
Linux 内核运行着全球绝大多数服务器和智能设备。Mythos 自主发现了内核中几个看似独立的漏洞,并巧妙地将它们串联在一起,构建出一条从普通用户权限提升到完全控制服务器的攻击路径。
所有这些漏洞的发现和利用程序的编写,全过程不需要任何人类工程师的引导。 模型完全自主完成。
三、为什么不让用?
答案很简单:攻防不对称。
一个能自主发现零日漏洞的 AI 模型,如果被别有用心的人获得,后果不堪设想。全球每年因网络犯罪造成的经济损失已经高达约 5000 亿美元。而 Mythos 的出现,意味着发现和利用漏洞的门槛被彻底打破。
过去,找到一个零日漏洞需要顶尖安全专家投入数月甚至数年。现在,一个 AI 模型在几分钟内就能完成同样的工作。
如果模型全面开放:
- 医院系统可能被勒索软件瘫痪
- 电网可能被远程关闭
- 金融系统可能被大规模渗透
- 政府基础设施可能被攻击
Anthropic 的判断是:在建立足够的安全护栏之前,不能让任何人随意使用这个模型。 这也是 Anthropic 历史上第一次发布了模型系统卡(System Card)却不公开发布模型。
四、玻璃翼计划(Project Glasswing)

既然不能公开发布,那这个模型用来做什么?
Anthropic 的答案是:让防御者先跑起来。
他们发起了 玻璃翼计划(Project Glasswing)——名字来源于玻璃翼蝶,一种翅膀近乎透明的蝴蝶,寓意着让隐藏的漏洞"透明化"。
12 家顶级机构联合创立
| 机构 | 领域 |
|---|---|
| Amazon Web Services | 云计算 |
| Apple | 消费科技 |
| Broadcom(博通) | 芯片与基础设施 |
| Cisco(思科) | 网络设备 |
| CrowdStrike | 端点安全 |
| 云计算与AI | |
| JPMorganChase(摩根大通) | 金融 |
| Linux Foundation | 开源生态 |
| Microsoft | 云计算与操作系统 |
| NVIDIA(英伟达) | GPU与AI基础设施 |
| Palo Alto Networks(派拓网络) | 网络安全 |
| Anthropic | AI 模型开发 |
12 家合作伙伴横跨云计算、芯片、网络、安全、金融和开源——几乎覆盖了全球数字基础设施的每一个关键节点。
此外,还有 40 家组织获得了早期访问权限。
Anthropic 的投入
- 1 亿美元模型使用额度,覆盖研究预览期间的算力成本
- 250 万美元直接捐赠给 Linux 基金会旗下的开源安全组织(Alpha-Omega 和 OpenSSF)
- 150 万美元直接捐赠给 Apache 软件基金会
- 开源维护者可通过专属支持程序免费申请模型访问
预览结束后的定价
| 项目 | 价格 |
|---|---|
| 输入 | $25 / 百万 token |
| 输出 | $125 / 百万 token |
可通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Azure AI Foundry 访问。
五、行业怎么看?
合作伙伴们的反应高度一致——这不是演习。
思科首席安全官:
AI 能力跨越了一个重要门槛,彻底改变了保护关键基础设施免受网络威胁的紧迫性。过往强化网络系统的旧方法已不再足够。技术提供商必须立即采用基于 AI 的新防御方法。
AWS 安全团队:
我们每天分析超过 400 万亿次网络流量来寻找威胁。我们将 Mythos 深度应用于关键代码库,发现 AI 是实现大规模防御的核心力量。
微软网络安全团队:
发现漏洞和被攻击者利用之间的时间差已经完全消失。过去安全人员有几个月的缓冲时间来修补漏洞,现在拥有 AI 的攻击者只需要几分钟就能完成攻击部署。
CrowdStrike:
对手不可避免地会利用相同的机器能力寻找系统弱点。想要安全部署 AI 技术,必须拥有匹配的安全防御能力。
Linux 基金会:
过去昂贵的安全专业知识是拥有庞大安全团队的组织才能享受的专属服务。开源维护者支撑着世界上大部分关键基础设施,却常常只能靠社区志愿者自己摸索。AI 辅助安全系统将成为每个代码维护者值得信赖的贴身助手。
派拓网络:
我们在实际测试中,利用 Mythos 精准识别出了前代技术完全漏掉的复杂漏洞。攻击者很快就能发现更多零日漏洞,并以比以往更快的速度开发利用程序。
六、接下来会怎样?
Anthropic 给出了明确的时间线:
- 90 天内:向全社会公开初步研究成果,披露已修复的关键漏洞和防御改进措施
- 6-18 个月:评估是否扩大访问范围,取决于安全措施的成熟度
- 持续进行:与全球安全组织合作,制定 AI 时代安全实践的指导建议
涵盖的领域包括:
- 漏洞安全披露流程
- 软件自动更新机制
- 开源与供应链生态安全
- 安全设计前置实践(Security by Design)
- 受监管行业的安全新标准
- 安全事件响应自动化
- 系统补丁修复自动化
七、一个值得注意的插曲
据 Yahoo Tech 报道,Mythos 模型的存在其实在 3 月底就被意外泄露了。当时模型的内部代号叫 "Capybara"(水豚),一份关于该模型的博客草稿被留在了一个未加密的公开缓存中。草稿中提到这是"一个新的模型层级——比 Opus 更大、更智能"。
这也许解释了 Anthropic 为什么选择在 4 月 8 日正式公布——与其被动泄露,不如主动掌控叙事。
八、这件事为什么重要?
玻璃翼计划代表了 AI 行业的一个转折点。
过去的思路是: 造更强的模型 → 开放给所有人 → 让市场竞争。
Anthropic 的新思路是: 造更强的模型 → 承认它的破坏力 → 先让防御者用起来 → 建好护栏再逐步开放。
无论你是否认同 Anthropic 的做法,有一件事是确定的——当一个 AI 模型能自主发现藏了 27 年的系统漏洞,能把 500 万次测试都没找到的 Bug 一眼看穿,能自动编写复杂的漏洞利用链——网络安全的游戏规则已经永久改变了。
DARPA 在十年前举办第一届网络大挑战赛时,大概没有想到,人类花了十年才走到 AI 与顶尖安全专家激烈竞争的这一步。而 Mythos 的出现表明,下一步——AI 全面超越人类安全专家——可能只需要几个月。
防患于未然,永远是人类面对未知风险时最明智的战略选择。
参考资料:
- Anthropic 官方公告:https://www.anthropic.com/glasswing
- Anthropic 技术博客:https://red.anthropic.com/2026/mythos-preview/
- WIRED:Anthropic Teams Up With Its Rivals to Keep AI From Hacking Everything
- Yahoo Tech:Anthropic debuts preview of powerful new AI model Mythos