PG(中国电子)-官方网站

算力租赁全面涨价:推理需求爆发产业链最直接受益的公司(附名单)—PG电子平台|官方网站
算力租赁全面涨价:推理需求爆发产业链最直接受益的公司(附名单)
发布时间:2026-04-26
 人工智能技术正在从模型训练阶段全面转向推理应用阶段。过去大模型主要用于简单的对话问答;现在的模型开始具备阅读文件、编写代码、自主测试甚至规划执行复杂任务的能力。这种变化直接导致底层计算资源的消耗呈现指数级增长。面对旺盛的需求,国内外算力硬件的采购成本大幅上升,各大云服务商纷纷上调算力租用和模型调用的价格。以下从AI推理的发展阶段、Token调用量的增长、算力租赁的商业模式、供需失衡导致的涨价、

  人工智能技术正在从模型训练阶段全面转向推理应用阶段。过去大模型主要用于简单的对话问答;现在的模型开始具备阅读文件、编写代码、自主测试甚至规划执行复杂任务的能力。这种变化直接导致底层计算资源的消耗呈现指数级增长。面对旺盛的需求,国内外算力硬件的采购成本大幅上升,各大云服务商纷纷上调算力租用和模型调用的价格。以下从AI推理的发展阶段、Token调用量的增长、算力租赁的商业模式、供需失衡导致的涨价、以及国内企业的融资扩产等方面分别梳理,希望对小伙伴们有所帮助。

  根据英伟达GTC 2026大会披露的信息,人工智能的发展已经走过了三个阶段。

  第一阶段是生成式AI时代。这个阶段以ChatGPT为代表,计算方式从“基于检索”转向“基于生成”。用户输入问题,模型返回答案。这一转变改变了计算机的架构、供应和建设方式。但此时模型的能力还比较初级,主要完成生成文本、回答问题等任务。

  第二阶段是推理AI时代。以o1/o3为代表的模型出现后,AI开始拥有反PG电子官方网站 PG电子网址思、规划和分解问题的能力。模型不再只是简单生成回答,而是会“思考”如何解决问题。为了完成思考过程,模型需要消耗大量的输入Token和输出Token,计算量比生成式AI时代大幅增加。这个阶段标志着“推理拐点”的到来。

  第三阶段是代理AI时代。以Claude Code为代表,这是首个具备代理能力的模型。它可以自主阅读文件、编写代码、编译、测试并进行迭代。代理AI能够执行极其高效的实际工作,比如辅助编程。目前,英伟达内部每个工程师都在使用AI代理辅助编程。代理AI的出现,正在改变软件行业的传统格局。

  过去两年里,计算需求增长了约1万倍,实际使用量增长了约100倍。推理阶段的到来,使算力需求不再局限于模型训练,而是渗透到日常应用的各个环节。

  Token调用量的快速增长是算力需求旺盛的最直接体现。Token可以理解为模型处理信息的最小单位,每次用户提问或模型回答都会消耗Token。随着模型能力的提升,单次交互消耗的Token量也在增加。以开源AI智能体OpenClaw为代表的工具,单次互动的Token消耗量可达传统AI的10至100倍。视频生成等新兴场景也成为Token消耗的重要增长点。

  从国内企业的数据看,字节跳动旗下的火山引擎披露,其豆包大模型在2026年3月的日均Token调用量突破120万亿,三个月内翻了一倍,相比2024年5月首次推出时增长了1000倍。这一增速说明国内AI应用的渗透速度非常快。

  从海外企业看,Anthropic公司的Claude Opus 4.6和Claude Code需求激增,其年度经常性收入在2026年4月达到300亿美元,一个季度内增长超过三倍。Anthropic的智能体工具调用量数据显示,软件工程领域占比49.7%,后台自动化占9.1%,市场营销与文案写作占4.4%,销售与客户关系管理占4.3%,金融与会计占4.0%,数据分析与商业智能占3.5%,学术研究占2.8%。这些数据说明,AI代理已经渗透到多个行业的具体业务中。

  中国拥有庞大的用户基础。截至2025年12月,我国网民规模达11.25亿人,互联网普及率突破80%。生成式AI用户规模达6.02亿人,同比增长141.7%,普及率达42.8%。这为国产大模型的发展提供了良好的市场条件。

  国产大模型在海外市场的表现同样非常亮眼。根据OpenRouter平台的数据,在2026年3月30日至4月5日这一周内,全球调用量排名前六的大模型全部是中国的AI大模型,合计周调用量达到12.96万亿Token。在随后的4月6日至4月12日期间,全球排名前九的大模型中,中国大模型的周调用量虽然有所下滑,但已连续六周超越美国。

  具体到企业层面,Kimi的海外收入截至2026年2月已超过国内收入。受新模型和工具火爆出圈带动,Kimi在1月底至2月23日的近20天内,收入超过2025年全年,估值在不到三个月内翻了四倍,达到180亿美元。另一家公司MiniMax在2025年约73%的收入来自国际市场,共计5766万美元,国内收入约2138万美元。智谱模型被国内头部互联网公司及海外主流应用平台接入,使用深度持续提升。这些数据说明,国产大模型在技术能力和商业化方面已经具备全球竞争力。

  算力租赁企业为AI开发者提供算力服务。以海外标杆企业CoreWeave为例,其产品组合涵盖基础设施、管理软件和应用服务。

  在基础设施层面,核心产品是裸金属GPU租赁。客户可以直接访问H100、A100等芯片,这种方式避免了传统云计算中虚拟化带来的性能损耗。CoreWeave的集群采用英伟达InfiniBand网络架构,计算密度高,非常适合AI训练和渲染等高强度任务。但这要求用户具备较高的技术能力。

  在管理软件层面,CoreWeave提供预配置的GPU驱动托管环境,简化虚拟私有云部署,利用英伟达BlueField 3 DPU实现网络隔离和加速,降低管理复杂性。在应用服务层面,包括推理加速、及时监控等,帮助客户提高效率、降低技术壁垒。

  算力租赁的收费模式以承诺制长期合同为主。合同期限通常为2至5年(截至2024年,加权平均期限约为4年)。客户需在合同期内预留算力容量并支付固定费用,计价单位为“每签约GPU每小时”。合同期内价格固定,每月按客户预留的使用承诺计费。客户通常在签约时支付预付款,金额占合同总价值的15%至25%。此外,按需付费模式作为补充,按实际使用量实时计费,适配突发工作负载。

  从财务角度看,算力租赁企业在业务初期需要先支付数据中心租金、电费等成本,并承担设备折旧,而收入要到后续才会逐步确认。业务进入常态化运营后,长期利润率可达25%至30%。随着服务器折旧逐步计提完毕,核心成本大幅下降,后续稳定的租金收入大部分将转化为净利润,企业有望迎来利润阶梯式增长。此外,不同应用场景对GPU的要求不同:推理任务在最新系统上运行效果最佳,训练任务在H100系列显卡上性价比最高,因此较老的显卡仍有旺盛需求,算力设备折旧期满后的残值有望获得重估。

  硬件采购成本的上升加剧了算力租赁市场的供需紧张。据SemiAnalysis数据,LPDDR5和DDR5的合同价格在2026年第一季度分别同比上涨约4倍和5倍。服务器制造商为应对组件成本快速上涨带来的利润风险,大幅上调AI服务器售价,涨幅远高于组件成本的增长。这使得部分运营商放缓甚至放弃部署计划,新增算力供给受限。

  GPU租赁价格随之大幅上涨。原本业内预期,随着计算成本更低的Blackwell架构开始部署,Hopper架构(H100和H200)的租赁价格将会下降。但实际情况恰恰相反,由于爆款应用不断发布,H100需求不仅没有减弱,反而进一步增强。H100一年期租约价格从2025年10月的每GPU每小时1.70美元升至2026年3月的2.35美元,涨幅接近40%。按需租赁容量在所有GPU类型中均已售罄。

  这股涨价潮迅速蔓延到国内头部云服务商。腾讯云于2026年3月13日起,将GLM 5、MiniMax 2.5、Kimi 2.5三个模型结束限时免费公测,转为正式商用服务;混元系列模型的两款产品价格涨幅超过400%。5月9日起,将AI算力、容器服务及弹性MapReduce相关产品刊例价上调5%。阿里云于4月18日起,将平头哥线E等算力卡产品价格上调5%至34%,文件存储产品CPFS(智算版)上涨30%。5月15日起,对部分模型单元的服务价格进行2%至7%的上调。百度云于4月18日起,将AI算力相关产品服务价格上调约5%至30%,并行文件存储等上涨约30%。这说明涨价不是个别厂商的行为,而是整个行业供需格局发生变化的明确信号。量价齐升的趋势具备较强的持续性。

  在算力稀缺且租赁价格持续走高的背景下,国内代表性企业正在利用资金和渠道优势,加速算力集群布局。稳定的采购渠道和充足的融资支撑,使企业能够快速落地算力产能,配合行业长期合同锁定,未来业绩增长具有较强的可预见性。

  多家企业获得了大额授信支持。协创数据2025年累计申请授信额度不超过515亿元,2026年已累计申请不超过500亿元,并推进H股上市。宏景科技2025年累计申请综合授信200亿元,2026年拟申请600亿元,同时拟定增12.9亿元,其中9.9亿元用于智能算力集群建设及运营项目。盛视科技2026年已累计申请授信不超过230亿元。利通电子拟申请注册发行不超过5亿元超短期融资券及不超过5亿元中期票据,已成功发行2亿元科技创新债,募集资金专项用于算力设备及备件采购。盈峰环境拟申请注册发行不超过6亿元超短期融资券及不超过24亿元中期票据。智微智能2025年拟申请授信不超过90亿元,2026年已申请不超过140亿元。

  从资本开支看,北美五大云服务商(谷歌、微软、亚马逊、Meta、甲骨文)合计资本开支2024年达2611亿美元,同比增长62%;2025年达4490亿美元,增长72%;预计2026年达7295亿美元,增长约62%。国内三大云服务商(腾讯、阿里、字节)合计资本开支2024年达3523亿元人民币,同比增长54%;2025年达4244亿元,增长20%。这部分资本开支主要用于AI基础设施的建设,为算力租赁行业提供了长期需求。

  1. 算力租赁及云计算:协创数据、宏景科技、利通电子、盈峰环境、盛视科技、网宿科技、首都在线. 超节点OEM:浪潮信息、中科曙光、紫光股份、华勤技术、工业富联、联想集团、软通动力、烽火通信、中国软件国际。

  10. 数据中心:云赛智联、世纪互联、大位科技、润泽科技、光环新网、奥飞数据、数据港。

  11. ICT智能制造设备:联讯仪器、罗博特科、博众精工、华盛昌、优利德、鼎阳科技、强瑞技术。