南宫娱乐相信品牌的力量-DeepSeek连夜改页面,免费的AI用不长了

2026-04-21 13:40:22

首页财产ai正文 DeepSeek连夜改页面,免费的AI用不长了 4月8日凌晨,DeepSeek暗暗上线了一种新的分层模式界面。 2026-04-09 17:24 ·凤凰网作者 路春锋 编纂 董雨晴 AI投资人解读· DeepSeek上线新分层模式界面,或者为新一代V4模子预热,可削减无效Token耗损、降低成本。截至2026年3月,中国AI年夜模子日均Token挪用量增加超千倍。Anthropic封杀第三方集成东西,实现发作式增加。· 算力供需掉衡,芯片出口管束与成本约束致供应受限,免费模式使平台算力扩容滞后。行业从“免费烧钱换用户”转向“算力邃密化运营”,用户或者面对API价格不降、免费额度收紧等环境。总结:AI行业算力成本压力年夜,成长模式改变。DeepSeek新功效与Anthropic举措有亮点,但行业面对诸多挑战,投资需综合考量行业趋向、企业成本节制与成长计谋。内容由AI天生,仅供参考

4月8日凌晨,DeepSeek暗暗上线了一种新的分层模式界面:于网页版/App中呈现了“快速模式(Fast)”及“专家模式(Expert)”两个进口,同时还有有一个带图标的“视觉模式(Vision)”选项正于灰度测试。

图|Deepseek网页版截图

新的功效分工十分明确:快速模式面向一样平常对于话及低延迟相应;专家模式针对于繁杂推理及深度使命,可能触发更长推理时间但相应慢;而视觉模式则开启了图象输入等多模态能力,不外凤凰网科技检索发明,被灰度到视觉模式的人很是之少。

外界遍及认为,这是为行将发布的新一代V4模子做的功效及体验预热。但比拟发新模子,当前的分级轨制也许更值患上存眷,作为一种“按需挪用算力”的调理机制,就是将简朴使命交由低成本路径处置惩罚,仅于须要时启用高算力推理,从而削减无效Token耗损,实现总体成本的布局性降落。

一、年夜模子公司的算力焦急

年夜概于一周前,Anthropic公布自4月5日起,旗下年夜模子Claude的定阅办事将再也不笼罩包括龙虾于内的第三方集成东西。用户如想继承利用该模子,只能经由过程与定阅办事分隔计费的按需付费方案,并为此付出分外用度。

暗地里的逻辑很是好理解,跟着黄仁勋于GTC年夜会上高呼Token经济学。全世界科技年夜厂一时间把token耗损量酿成了查核尺度,更有海内的互联网年夜厂拉了月度token耗损排行,唯token耗损论甚嚣尘上。

据Anthropic表述,定阅制的订价模子原本是基在“小我私家用户正常利用强度”设计的,而OpenClaw这种主动化代办署理东西的利用强度远超预期——有重度用户每个月仅付出200美元定阅费,却耗损了价值5000美元的算力资源,给Anthropic带来了巨年夜的成本压力。

小米AI卖力人、前DeepSeek焦点成员罗福莉对于这个理念举行了拆解,认为Anthropic终究走出了天坑。其于社交平台X上发布长文,认为全世界算力供应已经经跟不上Agent创造的token需求增速。真实的前途不是更自制的token,而是“更高token效率的Agent框架”叠加“更强盛高效的模子”之间的协同进化。

据行业数据显示,截至2026年3月,中国AI年夜模子日均Token挪用量已经冲破140万亿,较2024年头增加超千倍。

罗福莉算了一笔账:按API订价折算,这种框架的真实成本年夜概是定阅价格的数十倍。她感觉这一差距“不是缺口,而是天坑”。

更值患上海内AI公司留意的是,Anthropic于4月7日公布,其年化收入(ARR)冲破300亿美元,正式反超OpenAI的250亿美元。

从2025年末的90亿到如今300亿,其仅用三个多月就实现了233%的发作式增加,即便云云,Anthropic仍于算一笔邃密的账。

于罗福莉看来,Anthropic封杀“龙虾”的真正价值于在:让效率低下的成本真实可见,从而倒逼整个生态走向工程自律。短时间阵痛不是坏事,它会鞭策框架开发者当真改良上下文治理、最 年夜化prompt缓存掷中率、减少无效token耗损。

二、发新模子眼下可能没那末主要

DeepSeekR1最初的冷艳,原本也是架构的立异,极年夜的实现了token的勤俭。其时,低价token的源头虽然是DeepSeek,但其本意从来不是为了价格战,只是厥后者把这类立异完成为了价格战游戏。

2025年头的爆红,也让DeepSeek几度面对容量不足的拮据,时常宕机。

于第 一拨年夜范围用户涌入后,曾经有DeepSeek内部人士告诉凤凰网科技,由于其时资源不敷,以是用户看起来被限定了利用次数,厥后内部经由过程优化要领,从头分配资源。

但这类内部架构的立异已经经难以满意当前的token挪用需求。

国金证券于研报中指出,算力供需正于发出要害旌旗灯号——需求端以指数级膨胀,供应端却受限在芯片出口管束与成本约束,难以同步扩张。

免费模式,成为了这场危机的加快器。年夜模子运营成本极高,免费模式让平台算力扩容始终滞后在用户增加。

于2026年开年以来,DeepSeek已经经上演了至少7次年夜范围办事中止。3月29日晚至30日上午,平台再度突发全局瓦解,网页端与APP端同时没法利用,宕机时间连续约12小时,直至越日9时13分才恢复正常。

也许是压力之下,DeepSeek于4月8日低调更新了对于话界面,于输入框上方新增了“快速模式”及“专家模式”选项。于行业人士看来,分层设计既可以经由过程算力分流减缓峰值压力,也能为后续搭建付费系统、限额限流铺路。

不久前,OpenAI公布下线Sora,将有限的算力资源从头聚焦在焦点办事,与DeepSeek开启分层、Anthropic的岑岭限流办法配合展现了一个实际:需求增速已经远超基础举措措施的扩张能力。

三、AI赛道的“房间里的年夜象”

从DeepSeek的免费模式难以为继,到Anthropic的封杀令,再到罗福莉的价格战正告,这些看似自力的事务配合指向统一个布局性抵牾:AI赛道的token用量正于以指数级速率膨胀。

海外的AI数据中央年夜手笔抢购存储芯片,再向华尔街开出账单,如同一场没有终点的赌注游戏。

现实上,不止是芯片,电力危机也于叠加:AI算力耗电占全社会用电量增速的46%,远超总体6.1%的增加程度,电力弹性不足成为硬约束。

于这类配景下,行业正于履历一场从“免费烧钱换用户”到“算力邃密化运营”的范式切换。阿里云、腾讯云早前已经启动算力涨价,最高涨幅达34%。但提及来是涨价,现实也只不外是把以前价格战期间的优惠给抹失了,恢复了正常订价。

4月8日,于智谱发布旗舰开源模子GLM-5.1之际,再度提价10%,此前其已经经举行过两次提价。

假如说已往两年,年夜模子行业的要害词是“范围”及“速率”,那末此刻,要害词已经经悄然酿成了两个字:成本。

即即是像OpenAI及Anthropic如许的海外明星企业,今朝都还有处在高投入阶段,算力、人材、基础举措措施等等开支巨年夜。于连续依靠融资的同时,它们都必需回覆一个实际问题:这弟子意何时能自我造血?

在是,行业最先呈现一个较着转向:当AI最先赚钱,第 一步不是赚更多,而是少亏一点。

以OpenAI为代表的一类玩家,选择的是更激进的线路:产物快速迭代、能力优先、生态开放,同时经由过程连续融资维持扩张节拍;而以Anthropic为代表的另外一类,则较着更克制,把重点放于成本布局、不变性及企业办事上,经由过程工程优化来晋升效率。

二者的差异,可以简朴理解为:一个是“先做出来再说”,一个是“先算清晰再做”。

这类变化,对于平凡用户实在也会孕育发生直接影响。

起首,API价格未必会像许多人预期的那样连续年夜幅降落。虽然单元价格于降低,但成本节制的压力并无消散,企业更可能经由过程优化布局,而不是无穷降价来消化成本。

其次,免费额度及补助可能慢慢收紧。已往依靠“烧钱换增加”的阶段正于竣事,当每个Token都需要被切确计量时,激昂大方的免费计谋自己就变患上不成连续。

再次,于体验层面,用户也可能感触感染到变化:模子答复会更克制、更精简;长文本、繁杂推理或者高频挪用,可能被更严酷地限定或者分层订价。你看到的“更短回覆”,暗地里往往不是模子变“懒”,而是体系于自动做成本优化。

从某种意义上说,Token被省下来的那一刻,成本并无消散,而是被从头分配——于模子厂商、企业客户与终端用户之间流动。

说到底,AI正于完成一次从“试验品”到“商品”的改变。年夜模子从来不是纯技能问题,而是一门重资孕育发生意。当增加神话退去,算账就成为最焦点、最实际、也最没法逃避的问题。

这,才是“抠Token”暗地里真实的行业逻辑。

【本文由投资界互助伙伴凤凰网授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-南宫娱乐相信品牌的力量

下载360浏览器