南宫娱乐相信品牌的力量-马斯克说漏嘴了！Claude Opus参数5T，Sonnet 1T

2026-04-15 20:51:44

首页财产ai正文马斯克说漏嘴了！Claude Opus参数5T，Sonnet 1T 马斯克发帖吐露xAI的Colossus 2超算练习的模子参数，网友据此推测Claude参数，最新版Claude 4.6 Sonnet ~1-2T、Opus ~1.5-2.5T/2-5T与之一致。 2026-04-10 16:16 ·微信公家号：量子位存眷前沿科技 AI投资人解读· 文章先容了xAI的Colossus 2超算正于练习的7个模子参数，还有提到网友对于Claude系列模子参数范围的推测。如Claude 3 Haiku约20B、Claude 3 Sonnet约70B、Claude 3 Opus约2TClaude 3.5 Sonnet约175BClaude 4 Opus约300–500B、Claude Sonnet 4约50B-100B等。· 模子参数可能因版本更新而变化行业竞争激烈，新模子不停涌现，Claude面对较年夜竞争压力。总结：文章提供了富厚的模子参数信息，但模子参数处在动态变化中，且行业竞争激烈，需连续存眷模子成长和行业竞争态势，联合更大都据评估其投资价值与危害。内容由AI天生，仅供参考

哦豁，马斯克一个“不小心”，把Claude参数抖出来了？？？

长话短说：Sonnet 1T、Opus 5T。

因由是老马发帖暗示，xAI的Colossus 2超算正于练习7个模子，此中*的一款，参数目直接冲到了10万亿。

完备清单：

Imagine V2

2个1万亿（1T）参数的变体模子

2个1.5 万亿（1.5T）参数的变体模子

6万亿（6T）参数模子

10万亿（10T）参数模子

P.S. Colossus 2，就是老马巨硬规划（Macrohard）的一部门。据2025年8月披露的信息，Colossus 2已经经安装了119台风冷式冷水机组，提供约200MW的冷却能力，足以撑持约11万个GB200 NVL72 GPU。

根据其时计划，Colossus 2*阶段部署11万个英伟达GB200 GPU，终极方针是跨越55万个GPU，峰值功率需求估计跨越1.1GW。

此次发推文，也是马斯克为数未几地对于外公然Colossus超算的详细练习规划。

动静一出，网友开启好奇宝宝模式，马斯克也是表情不错的样子，看到发问也答复了不少。

好比有人问“练习一个10T模子，年夜概要花多久？”，马斯克说预练习阶段约莫需要2个月。

哎，就有这么一段对于话呈现了。

Grok 4.2的参数目，仅为xAI今朝于训*模子的5%。也就是5000亿（500B）对于比10万亿（10T），后者是前者20倍。

Grok 4.2真的是总参数目500B吗？还有是说只是于一个更年夜的MoE里，激活的参数目是500B亿？

面临疑难，老马又亲自回应了：

总参数目就是0.5T（5000亿）。此刻的Grok，参数目是Sonnet的一半、Opus的十分之一。以它的范围来讲，长短常强的模子。

网友一眼瞄到显眼信息，这不就是说Sonnet是1T，Opus是5T。

在是有人追问：

纯好奇，你（马斯克）怎么知道Sonnet、Opus巨细？

对于此老马闭麦了，网友提出的点倒不无原理，“*人材于这么几家公司间流动，好像也没甚么奥秘能藏过久”。

Claude各版本参数，来自网友推测

自打Claude系列模子问世，Anthropic就一直严酷保密参数范围，不论是Opus还有是Sonnet，愣是一点没披露。

越不说，网友会商患上越起劲。

咱们用AI总结了一下网友们阐发会商的差别版本的Claude参数范围。

你还有别说，你还有真别说。最新模子Claude 4.6 Sonnet ~1-2T、Claude 4.6 Opus ~1.5-2.5T/2-5T，还有真及老马手滑泄露的“Sonnet1T、Opus5T”对于上了。

详细来看网友都会商出来了啥。

今朝主流推测要领有四类：

推理成本与吞吐量反推法：模子推理成本与激活参数目呈类似线性瓜葛，而总参数目则可经由过程架构类型及行业经验系数推算。

机能基准对于标法：经由过程与已经知参数的开源模子于尺度化基准上的体现对于比，揣度闭源模子的参数范围。

内部文件泄露与传说风闻阐发法：官方不测袒露的信息一些小道动静。

架构特征阐发法：经由过程对于模子举动特征的不雅察，揣度其采用的架构类型，进而缩小参数预计规模。

起首来看Claude 3系列，2024年3月发布，这是*形成清楚产物矩阵的Claude系列，包罗三个定位差别的版本。

小杯Haiku、中杯Sonnet以和年夜杯Opus，成本及机能依次递增。

对于在它们的参数范围，LifeArchitect.ai开创人Alan D. Thompson曾经给出估算：

Claude 3 Haiku (~20B)、Claude 3 Sonnet (~70B)、Claude 3 Opus (~2T)。

对于在Claude 3 Sonnet，Reddit社区后续也睁开了连续会商，也有网友基在机能等推测Claude 3 Sonnet参数目于150-250B之间。

再来看Claude 3.5，这是Claude的一次庞大进级，多个要害指标吊打GPT-4o。

不外，Anthropic最初只发布了独苗Claude 3.5 Sonnet。

其速率是Claude 3 Opus的两倍，成本却仅为后者的1/5。

关在模子参数目，微软等曾经发布了一篇论文。

此中指出据行业估算，Claude 3.5 Sonnet参数约175B。

顺带附上其它模子估算参数：ChatGPT约175B、GPT-4约1.76T、GPT-4o约200B、o1-mini约100B、o1-preview约300B。

以后，Anthropic跳过了3.5定名，未发布3.5 Opus，于Claude Sonnet 3.7后直接进入4系列，发布了两个模子：

Claude Opus 4及Claude Sonnet 4。

圈内对于在Claude 4的参数预计，存于较年夜不合。

行业估算Claude Opus 4参数约于300–500B之间，Claude Sonnet 4约于50B-100B之间。

接下来Claude Opus 4.1发布。

其编程机能再次冲破，逾越Claude Opus 4，于Agent使命及推理方面也进一步进级。

不外发布时，官方暗示规划于将来几周对于模子举行更年夜范围进级与改良，看来4.1真就只是一次小更新，替换Opus 4。

甚至网友会商，Anthropic可能原来不想发模子，可是何如GPT-5/Gemini-3的动静太多，为了连结市场竞争力以是先更新一波。

这可能也是关在其参数会商其实不多的缘故原由之一。

Hacker News有网友认为，其多是Anthropic测验考试超年夜参数范围的试验性产物，后续4.5版本反而缩小了参数范围以优化效率。

Anthropic对于Opus 4/4.1举行了蒸馏，获得了Opus 4.5。这也是该模子的运行速率比Opus 4快约3倍，同时API挪用成本仅为后者的三分之一的焦点缘故原由。

整个AI行业的成长标的目的，正于摒弃万亿参数范围的超年夜模子。当下的焦点命题是晋升现有参数范围的使用效率。

Opus 4.5参数目撑死也就于2T摆布。Opus 4/4.1的参数目也许能到达约6T（MoE架构）。

再往下就是4.5系列了。

Claude Sonnet 4.5先发布，计较机操作方面，于OSWorld测试中取患了60.2分的SOTA成就，比Sonnet 4晋升了近一半。

Claude Opus 4.5后脚根上，前端开发、视觉能力显著晋升，更擅长利用电脑；于深度研究、PPT建造与电子表格处置惩罚等一样平常使命方面的体现也周全进级。

本年2月刚发布的最新4.6系列，各项能力再上一个台阶。

Anthropic暗示，对于填写繁杂Excel、网页清单等计较机操作使命，Sonnet 4.6已经经靠近人类程度。

而Opus 4.6，于GDPval-AA（一项评估金融、法令及其他范畴经济价值常识事情使命的机能指标）上，比GPT-5.2超出跨越144Elo；编程依旧独领风流，于Agent编程评估Terminal-Bench 2.0中取患了最高分，并于“人类末了测验”中*所有其它前沿模子。

越日后，技能迭代步入深水区，底层技能及模子架构还有一个劲地弄立异，想估算模子参数目，愈来愈难了。

近来，一篇发表于Substack的技能逆向工程阐发，经由过程OpenRouter于Google Vertex及Amazon Bedrock上的Token吞吐数据，估算了Claude Opus 4.5及4.6的激活参数目。

作者签名unexcitedneurons，他以3个开源MoE模子为校准基准，推算出Vertex平台的有用内存带宽约为4.0–4.5TB/s，进而患上出：

Opus 4.6于FP8精度下的激活参数目为93–105B。

若假定模子采用FP8精度浓厚层+FP4精度混淆专家层的配置，Opus 4.6的激活参数目约为127–154B。

联合差别专家稀少度方案，终极他认为，Opus 4.5绝非网传的10T+范围，它是一款体量小患上多的模子，由Claude Opus 4/4.1蒸馏而来，参数目范围应落于1.5T-2T之间。

这一点也能从API订价中获得印证，Claude Opus 4.1的输入/输出订价为每一百万Token 15美元/75美元，而Claude Opus 4.5/4.6今朝的订价仅为每一百万Token 5美元/25美元，价格直接降至原先的三分之一。

作者也提到，Claude Opus 4/4.1参数目年夜几率于5T-6T摆布。

除了了已经发布模子的模子外，头几天Anthropic团队因权限配置掉误，把自家未发布模子泄露了。

模子Claude Mythos（内部代号Capybara）。

泄露文件中，曾经屡次利用质的奔腾这类说法来形容Mythos，于详细能力上，相较在Claude Opus 4.6，Mythos于软件编码、学术推理及收集安全等测试中的患上分显著更高。

Claude Mythos，被称为是迄今为止公司开发过的最强盛的AI模子。

传言称模子参数达10T。

参考链接：[1]https://x.com/lifetimization/status/2042285703162397167[2]https://www.reddit.com/r/ClaudeAI/co妹妹ents/1ixuxln/estimate_of_model_size_for_claude_37/[3]https://lifearchitect.substack.com/p/the-memo-special-edition-claude-3[4]https://arxiv.org/pdf/2412.19260v1[5]https://medium.com/@bob.mashouf/claude-4-vs-llama-4-benchmarking-55b99c17d3f7[6]https://news.ycombinator.com/item?id=47319205[7]https://unexcitedneurons.substack.com/p/estimating-the-size-of-claude-opus

【本文由投资界互助伙伴微信公家号：量子位授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-南宫娱乐相信品牌的力量

下一篇：和合共生积极有为——南宫娱乐·NG28集团2025年度工作总结会顺利召开