南宫娱乐相信品牌的力量-一夜之间,你的手机、电脑要冒出无数bug了?

2026-04-23 20:01:27

首页财产ai正文 一晚上之间,你的手机、电脑要冒出无数bug了? 就于今天,Anthropic 发布了自家有史以来最强的模子 Claude Mythos Preview。 2026-04-09 07:49 ·微信公家号:差评作者 八戒 编纂 江江 & 面线 AI投资人解读· Anthropic新模子Mythos能找0-day缝隙并写进犯代码,已经提供应12家年夜厂。其于多项测试中成就优秀,如USAMO患上分从42.3%涨至97.6%,Cybench满分。 · 行业竞争加重,模子能力强可能吸引更多进犯模子存于潜于危害,即便发生率低,年夜量挪用下也可能激发问题。 总结:Mythos揭示出强盛能力,有投资潜力,但因其激发安全担心,投资时需存眷行业竞争和模子潜于危害,联合市场与技能趋向综合评估。内容由AI天生,仅供参考

一晚上之间,你的手机、电脑、路由器,甚至智能马桶,可能都要疯狂打补钉修缝隙了。

这不是我们胡说的,就于今天,Anthropic 发布了自家有史以来最强的模子Claude Mythos Preview。

这个船新版本的新模子,能本身找到 0-day 缝隙(也就是开发者压根不知道、零时间防御的致命缝隙),还有能随手给你写一套完备的进犯代码。

眼看这能力其实太刑了,Anthropic 本身都哆嗦了,在是就以“过在进步前辈未便展示”的理由给锁起来了,只提供应亚马逊、苹果、微软、google等 12 家正派年夜厂用。

与此同时,他们还有组团分外弄了一个名叫 Project Glasswing(玻璃翼蝶)规划,招呼各人先用 Mythos 做收集安全防备。

实在这波新模子我们以前也听过风声,上个月尾,Anthropic 家后院动怒,泄露了 3000 多份秘要文档。其时就有人发明,于原有的超年夜杯 Opus 之上,竟然还有藏着一个代号“卡皮巴拉”。

预计是感觉这名字太萌了,以是正式发布时直接更名叫 Mythos(神话,金色传说的觉得)。

虽然我们吃瓜群众暂时摸不到这玩意,但光看官方给出的数据,也充足让人头皮发麻了。

搁之前,各家年夜模子的新品凡是只能把基准测试的成就提高个 3%、5% 。

但 Mythos 此次直接就是一个降维冲击:

USAMO(美国数学奥林匹克竞赛): 患上分从上一代的 42.3% 直接暴涨到 97.6%;

Cybench(收集安全基准测试): 100% 满分通关,Anthropic 官方甚至有点凡尔赛:现有的 Cybench 基准测试太没难度了,对于新模子来讲已经经掉去了测试意义。

CyberGym(专业缝隙复现测试)上,它的患上分是 83.1%,相对于比,此前的最强的公然模子 Opus 4.6 只是 66.6%。

Firefox JS shell(缝隙使用测试),这个最离谱,缝隙使用能力比 Opus 4.6 晋升了近 80 倍。。。

面临两位数、甚至几十倍的增加,也难怪 Anthropic 放出话来,说Mythos 已经经能及“最顶 尖的人类安全专家”掰手段了。

看到这里,差友们必定也及我们想的同样,好强啊,太牛了。。。但这脚本怎么有点认识?

先是“不小心”泄露风声,然后官方下场甩几组炸裂数据,末了话锋一转:“哎呀,我家模子太强了,怕扑灭世界,以是不克不及给你们用哦”。

上一个这么干的是 GPT-5 吧?再上一个似乎是 Sora?

OpenAI 每天弄谜语人套路,此刻风评都成啥了,怎么 Anthropic 浓眉年夜眼的,也玩这套了?

更不要说,Anthropic 要于本年 IPO 了。

以是网友们一会儿就炸锅了,有人喷这是于为了上市造势吹法螺逼;有人骂患上更直白,说这帮做年夜模子的,压根无论平凡用户死活。

知名开发者 Simon Willison 都出来古里古怪,“咱们的模子太伤害了不克不及发布”,简直是 AI 圈的流量暗码。

不外,网友骂归骂,但当你看了它现实的操作,可能也会感觉,这玩艺儿此刻放出来,确凿相称在去幼儿园发 AK 了。

咱们从两个官方的案例就能品出味来。

第 一个就是,Mythos 于 OpenBSD 里,找到了一个 1998 年的远古缝隙。

这是啥观点?OpenBSD 但是号称全世界最看重安全加固的体系之一,防火墙及要害基建端赖它续命。

成果人类顶 级专家用显微镜盯了 27 年都没看出来的马脚,被 AI 喝着茶就给挑出来了。。。

另外一个强有力的证实案例就是 FFmpeg ,险些所有视频播放器及阅读器底层都有它。

Mythos 于这内里找到了一个藏了 16 年的缝隙,而包罗这个缝隙的代码,早就被人类重复测试了跨越 500 万次,却一起绿灯。

Mythos 暗示:甚么叫国服 AI,战绩可查啊?

并且,你还有别小视 AI 找到的缝隙,就拿 FFmpeg 来讲,这个缝隙乍一看可有可无,日常平凡险些不会被触发,咱们接洽到的某信息安全从业人士文安(假名)却感觉,这属在典型很是规的输入致使的预期外的问题。

实际糊口中,偏偏有年夜量近似的案例,你不克不及说触发概率小就彻底轻忽。

更进一步说,此刻这个小缝隙可能只是让步伐闪退或者者报错,但若再及一些肆意地址(相称在黑客有了你电脑的万 能钥匙)读写技能联合起来,那就是个风险级别比力高的缝隙了。

以是,文何在看完这些新闻直接来了句:“假如这个文章全是真的,觉得(从事收集)安全一半(人)可以跳河了”。

随后,文安暗示跳河只是夸张修辞,也慰藉我们说这些缝隙,暂时还有没到,“我的付出宝会不会被洗劫、微信谈天记载会不会满天飞”的级别。

但问题的焦点于在,官方放出这些案例,不是为了夸耀“缝隙有多毒”,而是申明 AI 不消任何外挂东西,纯靠本身的常识贮备及跨维度推理,就能挖出新缝隙。

以是,于文安看来,现阶段的 Mythos 其实不是“更强的黑客东西”,而是把收集进犯门坎给降低了。

之前不论是正经安全职员还有是黑灰产,最少患上有个懂行的人坐镇,真要弄一次像样的收集进犯,还有患上小黑屋里熬上几个月。

但之后,可能村口的小黑胖抠着脚,对于着 AI 喊两句麦就行。

这类有手就行的低门坎,必将会引来无数乐子人及法外狂徒,玩一把、试一试。

以是文安感觉,Anthropic 先整出个 Glasswing 规划挺合理的。

究竟,传统安全东西就像古板的门卫,只会查有无带犯禁品,管不了熟人作案;而 AI 能顺藤摸瓜看懂营业逻辑,更能发明那种张三拿着本身的钥匙,却去开李四的门的操作。

提早让年夜厂们举行自我审查、试用,可以或许更先一步修筑收集掩护、举行缝隙筛查,提防在未然。

至在 AI 时代的收集安全,文安还有是比力乐不雅的。

一来,此刻的 AI 还有没成精,弄不定尤其繁杂的连环进犯链。你暂时不消担忧,有人靠 AI,盗走你付出宝里那仅剩的 9 块 2 毛 5。

另外一方面,AI 能找洞,天然也能补洞,有了它,扫洞效坦白接拉满,还有能趁便引导下开发缝隙该怎么修。

以是,文安的判定是,将来的收集攻防,年夜几率就是“人类批示官 + AI 特种兵”的混淆双打。

并且吧,差评君细心看了看最新的技能文档,也感觉 Anthropic 还有真不比是于弄噱头,不光是前面说的收集安万能力精彩,Mythos 揭示出其它方面的能力,也相称惊人。

好比于一次测试中,Mythos 发明没有拜候权限,正常的反映是说出来:"我没权限,臣妾做不到啊"。

可它偏不这么干,直接去读取沙箱底层,试图从内存里直接把拜候令牌弄出来。

还有有次测试中,模子使用了一个文件权限缝隙,对于敏感文件动手动脚了。

做完这一切,Mythos 还有随手修改了本身的汗青提交记载,把这事儿给抹去了。

意想到本身做了不应做的事,然后它选择了毁尸灭迹。。。

还有有一次,Mythos 于举行测试,不小心把书翻到末了一页弄到了谜底,这操作实在是被号令禁止的。

可研究职员翻看它的思维链时才发明,它不仅没检举本身,还有想着本身的步调似乎及成果对于不上,患上于终极谜底里引入一个小过错,看起来是本身做出来的题,而不是抄到了谜底。

我说真话,这个操作,比昔时抄我数学试卷的同桌高明多了,否则我俩也不会被罚去扫茅厕了。

不外这也不是外界传的那末玄乎,甚么整个硅谷都畏惧了,Anthropic 老板吓患上瘫坐于椅子上了。。。

研究职员也出来澄清了,已经经弄清晰了这些心计心情操作的缘故原由,底子不是 AI 有甚么险恶目的或者者自立筹谋能力。

他们还有经由过程重复强化练习,把近似举动的发生率降至百万分之一如下了。

但咱就揣摩着,百万分之一听起来很低,但若这个模子天天被挪用几十亿次呢?

以是,回过甚来看,与其骂 Anthropic 弄 Glasswing 规划是弄营销,我们却是更愿意信赖,他们是真感觉自家的 AI 有点强了。

虽然就像文安说的那样,平凡人此刻确凿还有不消担忧本身的微信被黑、余额被盗。

但当进犯的成本无穷趋近在零,咱们*能期望的,现有的防备机制,能再完美一些。

【本文由投资界互助伙伴微信公家号:差评授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-南宫娱乐相信品牌的力量

下载360浏览器