菜单
首页财产ai正文 罗福莉:该竣事token虚伪狂欢了 近日“Anthropic封禁OpenClaw”的动静传出,比拟在过错理解成“封禁”并第 一时间遐想到“不知恩义”的一堆会商,小米 MiMo 年夜模子卖力人罗福莉的一篇长文是少有的对于这个工作真正当真阐发,并聊到点子上的。 2026-04-07 13:23 ·微信公家号:硅星人董道力 AI投资人解读· Anthropic住手OpenClaw经由过程固定付费定阅方式挪用能力,因其粉碎算力分配平衡,使成本年夜增。罗福莉认为此举可鞭策改良,且低价token计谋不成连续。小米MiMo的Token Plan按现实token耗损计费,用量与成本瓜葛更透明。 · 行业竞争加重,年夜模子公司若订价不妥或者盲目降价,可能堕入恶性轮回。 总结:Anthropic的调解对于行业影响深远,凸显算力高效使用的主要性。小米MiMo的模式值患上存眷,各企业需从头审阅订价与成本布局,晋升工程效率,以顺应新竞争阶段。内容由AI天生,仅供参考
这两天,所谓“Anthropic封禁OpenClaw”的报导遮天蔽日,但事实上Anthropic 是住手了OpenClaw这类第三方产物直接经由过程Claude Pro等固定付费的定阅方式来挪用能力的路径。
你真的想用Anthropic 的模子及产物,要末经由过程官方来利用这类定阅模式,要末可使用按量充费的API额度,封禁是没有封禁,只是限定了挪用及对于应的“收费”方式。
比拟在过错理解成“封禁”并第 一时间遐想到“不知恩义”的一堆会商,小米 MiMo 年夜模子卖力人罗福莉的一篇长文是少有的对于这个工作真正当真阐发,并聊到点子上的。
她认为,Anthropic 的动作其实不不测,此前咱们一直于一场没法连续的虚伪token耗损狂欢里,此刻该醒醒了。

一、定阅制不合适第三方 Agent
罗福莉起首对于 Claude Code 的定阅设计给出正面评价,认为这是业内少有的、当真看待算力分配问题的产物设计。其逻辑是:轻度用户用的少,补助重度用户,整体平衡。
但她随即指出,这套逻辑有一个隐蔽条件:用户用的必需是 Anthropic 本身的框架。一旦离开 Claude Code,就会出问题。
她以 OpenClaw 作为案例,指出第三方 harness 同时粉碎了两个层面的平衡。
第 一层是哀求次数。她于推文中写道:"我没措施严酷计较第三方 harness 接入酿成的丧失,但我近间隔看过 OpenClaw 的上下文治理,很糟糕糕。于单次用户查询里,它会触发多轮低价值东西挪用,每一轮作为自力 API 哀求发出,每一个哀求携带的上下文窗口往往跨越 100K tokens。现实哀求次数是 Claude Code 原生框架的数倍。折算成 API 订价,真实成本年夜概是定阅价格的数十倍。"
简朴说,统一件事,OpenClaw 要跑十趟,原生框架跑一趟。

第二个层面是缓存效率。她于评论区增补道:"更年夜的问题是,许多第三方 harness 于靠近上下文长度限定时,每一隔几步就压缩一次东西返回成果,致使 cache 掷中率极低。"
Claude 的缓存机制依靠上下文前缀的一致性,前缀匹配,才能复用缓存、跳太重复计较。但每一次压缩城市改写上下文内容,致使前缀掉配,缓存作废,模子被迫从头全量读入。
两个问题叠于一路,把每一一次查询的现实 token 耗损都推向极值。
OpenClaw 的用户险些清一色是重度用户,而即即是轻度用户,经由过程 OpenClaw 发出的每一一次哀求,于成本布局上也等同在重度用户。
定阅制赖以建立的漫衍假定就此坍塌,补助瓜葛不复存于,Anthropic 片面负担成本缺口。
就像健身房办卡,就是赌一些用户办了卡但不来,从而补助每天去健身房用户的成本,而 OpenClaw 让每一个用户 7x24 小时的都去高强度练习,健身房成本就下不来了。
二、短时间阵痛,持久改善工程规律
而对于在用户的愤慨,罗福莉认为这个短痛是有效的。
她写道:"第三方 harness 还有是可以挪用 Claude,只是不克不及再搭定阅的便车了。短时间内,这批用户会感触感染到成本打击,轻松跳升数十倍。但这个压力,偏偏会鞭策这些 harness 去改良上下文治理、最 年夜化 prompt cache 掷中率、削减无效 token 耗损。疾苦终极会转化为工程规律。"
定阅制的问题于在,它让 harness 开发者从来不需要为单次哀求的 token 耗损卖力。上下文治理差不要紧,cache 掷中率低不要紧,横竖成本由 Anthropic 的办事器暗暗接收。
但一旦回到 API 计费,这个布局就变了。token 华侈会直接表现于账单上,"优化效率"从可做可不做,酿成了有贸易压力驱动的工程需求。
每一个开发者零丁决议计划时都偏向在多用,总体生态的挪用质量是以连续恶化。计费布局的转变,是把外部性内部化的强迫手腕。

三、Tokens 价格战只会致使恶性轮回
比拟在感触Anthropic 不知恩义,剽窃OpenClaw后要用本身第 一方东西收割用户的会商,罗福莉提出了一个越发有点“天子新衣”味道的提示:
今天纯真为了token耗损而狂欢,以和模子厂商们由此出发打的各类价格战,将难以为继。是时辰醒醒了。
她写道:"我劝 LLM 公司不要于还有没弄清晰 coding plan 怎么订价以前,就随着降价内卷。低价卖 token、同时向第三方周全开放,对于用户看起来很友爱,但那是一个陷阱。Anthropic 刚从这个陷阱里走出来。假如用户于劣质 harness、不不变推理办事、降配模子上重复碰鼻,终极甚么都没做成,用户体验及留存都不会都雅。"
这个陷阱的机制是:年夜模子公司推出 coding plan 向第三方 harness 开放,及 Claude 同样会入不够出。为了节制成本,平台只能降低算力或者换用更自制的低智模子。用户外貌上有足够的额度,但甚么都做欠好,留存天然也不消说。
问题的泉源于在计费布局。Coding Plan 素质上是按定阅周期加哀求次数的粗放额度包,开发者买的是一段时间内的大略利用权,感触感染不到单次哀求的真实成本。
当第三方 harness 接入时,上下文治理粗放、冗余哀求、低 cache 掷中率酿成的算力华侈,成本彻底由平台默默接收。
定阅制堵截了用量与成本之间的旌旗灯号传导,重度用户经由过程低效 harness 透支的算力,终极迫使平台要末封禁第三方,要末靠降速、限流、降配模子来止损,这恰是 Anthropic 走到今天这一步的路径。

固然,罗福莉的另外一个目的也是为她于小米做的测验考试及方案“做告白”。
MiMo 的 Token Plan 走的是另外一条路。MiMo 没有封失第三方进口,而是转变了计费布局:按现实 token 耗损量配额,开发者采办以 Credit 为单元的 token 额度。
不管利用原生框架还有是 OpenClaw 品级三方 harness,每个华侈的 token 都直接从用户的额度包里扣。平台再也不为低效 harness 买单,用患上多付患上多,用患上糙成本高,"用量-成本"的瓜葛从头透明起来。
她将这套逻辑定位为:不是不让用,而是让计费布局自己成为约束机制,鞭策生态向高效率标的目的演化。
低价定阅的问题不于在自制自己,而于在它堵截了旌旗灯号传导。于订价逻辑没想清晰以前跟进,复制的可能不是 Anthropic 的上风,而是它方才踩过的坑。
四、竞争正式进入下一个阶段
罗福莉于推文末了把视线拉到了更年夜的框架上。
她写道:"全世界算力的供应速率,已经经追不上 Agent 场景下 token 耗损的增速。真实的前途不是更自制的 token,而是协同进化,更高 token 效率的 agent harness,乘以更强盛、更高效的模子。Anthropic 此次,无论主不雅用意是甚么,客不雅上把整个生态,不管开源还有是闭源,都推向了这个标的目的。Agent 时代不属在烧算力至多的人,而属在用算力最智慧的人。"

罗福莉于推文末了恰是于挑战已往几年 AI 行业信仰的"算力竞赛"叙事。
主流逻辑一直是:算力更多,模子更强,成本更低,用户更多,形成正向飞轮。
但 Agent 场景打破了这个等式。当一次用户查询可以触发数十次 API 挪用,每一次携带跨越 100K tokens 的上下文,算力耗损的增速就再也不是线性的。纯真压低 token 价格,只会加快这个耗损,而不会转变其布局。
这象征着,下一轮竞争的焦点指标,可能再也不是"每一 token 多自制",而是"每一 token 能完成几多有用事情"。谁先于这个维度上成立上风,谁就能于全世界算力供应跟不上 Agent 需求增速的窗口期里,盘踞真正有益的位置。
Anthropic 此次调解,不管出在甚么念头,都于客不雅上把整个生态推向了这个标的目的。
快把烧token酿成某种喜好及社交展示本钱的人们吐槽吐槽Anthropic 就而已,对于在各种Harness产物以和模子厂商们来讲,这事真实的旌旗灯号意义实在很强,假如还有是想着趁乱靠免费量年夜管饱去接住一波流量用户,就太不达时宜了。
一个阶段性的狂欢是时辰让位在于工程及基础举措措施设计上的真正主要的事情了。
【本文由投资界互助伙伴微信公家号:硅星人授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-南宫娱乐相信品牌的力量