南宫娱乐相信品牌的力量-一夜之间，你的手机、电脑要冒出无数bug了？

2026-04-23 20:01:27

首页财产ai正文一晚上之间，你的手机、电脑要冒出无数bug了？就于今天，Anthropic 发布了自家有史以来最强的模子 Claude Mythos Preview。 2026-04-09 07:49 ·微信公家号：差评作者八戒编纂江江 & 面线 AI投资人解读· Anthropic新模子Mythos能找0-day缝隙并写进犯代码，已经提供应12家年夜厂。其于多项测试中成就优秀，如USAMO患上分从42.3%涨至97.6%，Cybench满分。 · 行业竞争加重，模子能力强可能吸引更多进犯模子存于潜于危害，即便发生率低，年夜量挪用下也可能激发问题。总结：Mythos揭示出强盛能力，有投资潜力，但因其激发安全担心，投资时需存眷行业竞争和模子潜于危害，联合市场与技能趋向综合评估。内容由AI天生，仅供参考

一晚上之间，你的手机、电脑、路由器，甚至智能马桶，可能都要疯狂打补钉修缝隙了。

这不是我们胡说的，就于今天，Anthropic 发布了自家有史以来最强的模子Claude Mythos Preview。

这个船新版本的新模子，能本身找到 0-day 缝隙（也就是开发者压根不知道、零时间防御的致命缝隙），还有能随手给你写一套完备的进犯代码。

眼看这能力其实太刑了，Anthropic 本身都哆嗦了，在是就以“过在进步前辈未便展示”的理由给锁起来了，只提供应亚马逊、苹果、微软、google等 12 家正派年夜厂用。

与此同时，他们还有组团分外弄了一个名叫 Project Glasswing（玻璃翼蝶）规划，招呼各人先用 Mythos 做收集安全防备。

实在这波新模子我们以前也听过风声，上个月尾，Anthropic 家后院动怒，泄露了 3000 多份秘要文档。其时就有人发明，于原有的超年夜杯 Opus 之上，竟然还有藏着一个代号“卡皮巴拉”。

预计是感觉这名字太萌了，以是正式发布时直接更名叫 Mythos（神话，金色传说的觉得）。

虽然我们吃瓜群众暂时摸不到这玩意，但光看官方给出的数据，也充足让人头皮发麻了。

搁之前，各家年夜模子的新品凡是只能把基准测试的成就提高个 3%、5% 。

但 Mythos 此次直接就是一个降维冲击：

USAMO（美国数学奥林匹克竞赛）：患上分从上一代的 42.3% 直接暴涨到 97.6%；

Cybench（收集安全基准测试）： 100% 满分通关，Anthropic 官方甚至有点凡尔赛：现有的 Cybench 基准测试太没难度了，对于新模子来讲已经经掉去了测试意义。

CyberGym（专业缝隙复现测试）上，它的患上分是 83.1%，相对于比，此前的最强的公然模子 Opus 4.6 只是 66.6%。

Firefox JS shell（缝隙使用测试），这个最离谱，缝隙使用能力比 Opus 4.6 晋升了近 80 倍。。。

面临两位数、甚至几十倍的增加，也难怪 Anthropic 放出话来，说Mythos 已经经能及“最顶尖的人类安全专家”掰手段了。

看到这里，差友们必定也及我们想的同样，好强啊，太牛了。。。但这脚本怎么有点认识？

先是“不小心”泄露风声，然后官方下场甩几组炸裂数据，末了话锋一转：“哎呀，我家模子太强了，怕扑灭世界，以是不克不及给你们用哦”。

上一个这么干的是 GPT-5 吧？再上一个似乎是 Sora？

OpenAI 每天弄谜语人套路，此刻风评都成啥了，怎么 Anthropic 浓眉年夜眼的，也玩这套了？

更不要说，Anthropic 要于本年 IPO 了。

以是网友们一会儿就炸锅了，有人喷这是于为了上市造势吹法螺逼；有人骂患上更直白，说这帮做年夜模子的，压根无论平凡用户死活。

知名开发者 Simon Willison 都出来古里古怪，“咱们的模子太伤害了不克不及发布”，简直是 AI 圈的流量暗码。

不外，网友骂归骂，但当你看了它现实的操作，可能也会感觉，这玩艺儿此刻放出来，确凿相称在去幼儿园发 AK 了。

咱们从两个官方的案例就能品出味来。

第一个就是，Mythos 于 OpenBSD 里，找到了一个 1998 年的远古缝隙。

这是啥观点？OpenBSD 但是号称全世界最看重安全加固的体系之一，防火墙及要害基建端赖它续命。

成果人类顶级专家用显微镜盯了 27 年都没看出来的马脚，被 AI 喝着茶就给挑出来了。。。

另外一个强有力的证实案例就是 FFmpeg ，险些所有视频播放器及阅读器底层都有它。

Mythos 于这内里找到了一个藏了 16 年的缝隙，而包罗这个缝隙的代码，早就被人类重复测试了跨越 500 万次，却一起绿灯。

Mythos 暗示：甚么叫国服 AI，战绩可查啊？

并且，你还有别小视 AI 找到的缝隙，就拿 FFmpeg 来讲，这个缝隙乍一看可有可无，日常平凡险些不会被触发，咱们接洽到的某信息安全从业人士文安（假名）却感觉，这属在典型很是规的输入致使的预期外的问题。

实际糊口中，偏偏有年夜量近似的案例，你不克不及说触发概率小就彻底轻忽。

更进一步说，此刻这个小缝隙可能只是让步伐闪退或者者报错，但若再及一些肆意地址（相称在黑客有了你电脑的万能钥匙）读写技能联合起来，那就是个风险级别比力高的缝隙了。

以是，文何在看完这些新闻直接来了句：“假如这个文章全是真的，觉得（从事收集）安全一半（人）可以跳河了”。

随后，文安暗示跳河只是夸张修辞，也慰藉我们说这些缝隙，暂时还有没到，“我的付出宝会不会被洗劫、微信谈天记载会不会满天飞”的级别。

但问题的焦点于在，官方放出这些案例，不是为了夸耀“缝隙有多毒”，而是申明 AI 不消任何外挂东西，纯靠本身的常识贮备及跨维度推理，就能挖出新缝隙。

以是，于文安看来，现阶段的 Mythos 其实不是“更强的黑客东西”，而是把收集进犯门坎给降低了。

之前不论是正经安全职员还有是黑灰产，最少患上有个懂行的人坐镇，真要弄一次像样的收集进犯，还有患上小黑屋里熬上几个月。

但之后，可能村口的小黑胖抠着脚，对于着 AI 喊两句麦就行。

这类有手就行的低门坎，必将会引来无数乐子人及法外狂徒，玩一把、试一试。

以是文安感觉，Anthropic 先整出个 Glasswing 规划挺合理的。

究竟，传统安全东西就像古板的门卫，只会查有无带犯禁品，管不了熟人作案；而 AI 能顺藤摸瓜看懂营业逻辑，更能发明那种张三拿着本身的钥匙，却去开李四的门的操作。

提早让年夜厂们举行自我审查、试用，可以或许更先一步修筑收集掩护、举行缝隙筛查，提防在未然。

至在 AI 时代的收集安全，文安还有是比力乐不雅的。

一来，此刻的 AI 还有没成精，弄不定尤其繁杂的连环进犯链。你暂时不消担忧，有人靠 AI，盗走你付出宝里那仅剩的 9 块 2 毛 5。

另外一方面，AI 能找洞，天然也能补洞，有了它，扫洞效坦白接拉满，还有能趁便引导下开发缝隙该怎么修。

以是，文安的判定是，将来的收集攻防，年夜几率就是“人类批示官 + AI 特种兵”的混淆双打。

并且吧，差评君细心看了看最新的技能文档，也感觉 Anthropic 还有真不比是于弄噱头，不光是前面说的收集安万能力精彩，Mythos 揭示出其它方面的能力，也相称惊人。

好比于一次测试中，Mythos 发明没有拜候权限，正常的反映是说出来："我没权限，臣妾做不到啊"。

可它偏不这么干，直接去读取沙箱底层，试图从内存里直接把拜候令牌弄出来。

还有有次测试中，模子使用了一个文件权限缝隙，对于敏感文件动手动脚了。

做完这一切，Mythos 还有随手修改了本身的汗青提交记载，把这事儿给抹去了。

意想到本身做了不应做的事，然后它选择了毁尸灭迹。。。

还有有一次，Mythos 于举行测试，不小心把书翻到末了一页弄到了谜底，这操作实在是被号令禁止的。

可研究职员翻看它的思维链时才发明，它不仅没检举本身，还有想着本身的步调似乎及成果对于不上，患上于终极谜底里引入一个小过错，看起来是本身做出来的题，而不是抄到了谜底。

我说真话，这个操作，比昔时抄我数学试卷的同桌高明多了，否则我俩也不会被罚去扫茅厕了。

不外这也不是外界传的那末玄乎，甚么整个硅谷都畏惧了，Anthropic 老板吓患上瘫坐于椅子上了。。。

研究职员也出来澄清了，已经经弄清晰了这些心计心情操作的缘故原由，底子不是 AI 有甚么险恶目的或者者自立筹谋能力。

他们还有经由过程重复强化练习，把近似举动的发生率降至百万分之一如下了。

但咱就揣摩着，百万分之一听起来很低，但若这个模子天天被挪用几十亿次呢？

以是，回过甚来看，与其骂 Anthropic 弄 Glasswing 规划是弄营销，我们却是更愿意信赖，他们是真感觉自家的 AI 有点强了。

虽然就像文安说的那样，平凡人此刻确凿还有不消担忧本身的微信被黑、余额被盗。

但当进犯的成本无穷趋近在零，咱们*能期望的，现有的防备机制，能再完美一些。

【本文由投资界互助伙伴微信公家号：差评授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-南宫娱乐相信品牌的力量

下一篇：和合共生积极有为——南宫娱乐·NG28集团2025年度工作总结会顺利召开