|
|
|
|
|
|
|
| 2026-07-01 第04版:四版
| 【字体】 | 大 | | 默认 | | 小 |
|
DeepSeek引入峰谷计费,头部企业多次上调API服务价格 |
算力租赁市场乘风而起 |
|
| 作者:
■本报记者蒋元锐 来源:中华工商时报 字数:2198 |
|
|
|
|
|
|
|
|
|
随着生成式AI技术的快速发展,AI大模型逐渐成为推动各行业数字化转型的重要引擎。大模型的训练与推理对算力的需求异常庞大,这也导致算力资源逐步成为推动AI发展的关键变量。 日前,DeepSeek面向开发者邮件通知宣布涨价。记者获悉,DeepSeek本次价格调整引入峰谷计费机制,以DeepSeek-v4-pro为例,其输入价格(缓存命中)平时为0.025元/百万Tokens,高峰时期为0.05元/百万Tokens;输入价格(缓存未命中)平时为3元/百万Tokens,高峰时期为6元/百万Tokens;输出价格平时为6元/百万Tokens,高峰时期为12元/百万Tokens。高峰时间为每日9时至12时和14时至18时。 这意味着,DeepSeek v4pro/flash模型在高峰时刻(9-12/14-18)价格全面翻倍,v4pro输出最高可达12元/百万tokens。 业内人士认为,随着今年以来算力设备价格走高,以及国内外大模型公司均对盈利或减亏有着较明确的诉求,算力资源持续处于紧张状态,未来token价格出现内卷式降价的可能性较低,定价将相对理性。 DeepSeek引入峰谷计费 尽管此次峰谷计费机制在一定程度上调高了API(应用程序接口)价格,DeepSeek的性价比依然惊人,尤其在国内云厂商持续涨价的背景下。 与DeepSeek类似,今年以来,国内外领军AI企业纷纷对产品价格进行不同程度的调整。如腾讯云、智谱等行业头部企业已多次上调API服务价格。 此前火山引擎公布的豆包2.1Pro定价为例:豆包2.1Pro每百万Tokens输入价格为6元、输出价格为30元,缓存命中价格1.2元;面向高频调用场景的豆包2.1Turbo,价格则是Pro的一半。 4月13日,阿里云宣布,旗下大数据开发治理平台DataWorks对标准版、专业版用户取消每日调用API的数量限制。其中,DataWorks标准版调用API的免费额度调整为10万次/月,DataWorks专业版调用API的免费额度调整为50万次/月,超出部分采用OpenAPI按量付费的方式。 今年以来,腾讯云连续2次宣布涨价。继3月11日对部分模型启动正式收费及涨价后,4月9日,腾讯云称鉴于全球AI算力需求持续激增,核心硬件供应链成本大幅上涨,将于2026年5月9日起,对AI算力、容器服务及弹性MapReduce(EMR)相关产品刊例价进行调整。 此外,国产大模型厂商智谱已在年内进行3次API价格上调。2月12日,智谱对GLM Coding Plan套餐实施结构性调价,整体涨幅30%起。智谱在价格调整函中明确表示,涨价源于“市场需求持续强劲增长,用户规模与调用量快速提升”。 算力租赁市场开启涨价行情 近年来,AI算力资源的紧张程度正在快速攀升。从芯片制造端到算力租赁市场,无论是全球范围还是国内,供需矛盾的加剧均直接推升了算力成本,进而传导至大模型企业的定价策略。 DeepSeek全新推出峰谷阶梯定价规则,高峰时段Pro与Flash两大版本调用单价直接翻倍,产业链盈利正向飞轮启动。 这一变化也传导至资本市场。6月30日,协创数据、宏景科技、东阳光、智微智能等算力租赁企业迎来大涨。 据了解,现阶段国内算力租赁价格依旧在持续上涨,处于供不应求的“卖方市场”。 业内人士认为,算力租赁企业上涨离不开互联网大厂对算力租赁的刚需需求,目前算力租赁已经成为其在AI市场中必争的核心赛道。 OpenRouter数据显示,DeepSeek V4Flash单模型周调用规模已连续6周登顶全球单模型调用榜首,海量企业级需求充分验证大模型成熟的生产力工具价值,付费黏性逐渐形成,头部模型厂商掌握定价权。 从成本端来看,算力供需缺口不断扩大,国内外算力租赁市场已开启涨价行情。模型收费上调后,现金流有望持续改善,这将反哺上游算力采购需求,算力租赁厂商进入量价齐升通道。 国外算力租赁方面也有合作进展。近日,Anthropic与亚马逊重新谈判达成新协议,计费方式从按计算小时收费改为按Token收费。新协议下,亚马逊可能为Anthropic技术支付更高费用。 打造差异化竞争力 国内AI大模型企业的商业化步伐不只是单点的价格调整,而是放大到整个产业链的深刻变化。 目前国内大模型企业正在释放对算力市场的需求拉动力。业内人士认为,从现有趋势看,国内算力租赁企业已经具备了“量价齐升”的基础。 在成本压力与盈利需求的双重驱动下,国产AI企业正在加速从技术和商业模式两方面寻求破局。其中,通过优化AI推理框架来提升token生产效率正成为提升竞争力的关键途径之一。 以DeepSeek团队为例,其和北大团队联合推出的DSpark框架通过引入推测性解码模块,提高了token生产效率,较优化前可以提升60%至85%,体现了推理框架优化对Token效率和成本的影响。 业内人士认为,Token工厂类企业,具备推理优化能力可获得较为明显的竞争优势。虽然单Token的价格有所上升,但每个Token所创造的价值提升得更快,从整体上看,性价比实际上是在不断提高。
|
|
|
|
|
|
|
|