聚结器

DeepSeek带火英伟达GPU “库存的禁售型号都抢空了”

来源：星空体育最新官网发布时间：2025-02-19 20:00:34

2月13日，一位英伟达代理商告诉经济观察网记者，春节后第一周，两家中国科技公司为支撑开源大模型DeepSeek的推理服务，紧急向他们公司采购了L20 GPU算力设备。“去年，客户下单总要反复考虑和比价，现在连库存的禁售型号都抢空了”。

DeepSeek的出现颠覆了市场将高性能GPU视为AI赛道核心的传统认知，导致作为高性能GPU垄断者的英伟达率先被市场看空。

然而，更多产业人士发现，近期，无论是高性能的H系列GPU，还是RTX 40系列的高端显卡，英伟达的GPU重新变得供不应求。

前述英伟达代理商目前正加紧为客户调配英伟达的产品。他发现，英伟达芯片在中国市场全线紧缺，一些已经禁售的H800系列存货一卡难求。

此时，接入DeepSeek的中外企业已达数百家，国内云服务、互联网、手机、芯片、金融、医疗、汽车等行业都在上线和部署DeepSeek。

迅速增长的用户量为上述公司能够带来“泼天富贵”：云服务借此兜售算力、芯片企业借此推广产品、车企以更低成本升级自己的软件、上市公司借此推升市值。

一家IT厂商对经济观察网记者称，其调用DeepSeek的平台在上线首日增加了上万个用户，服务器几乎崩溃，现有算力已经跟不上用户的需求。团队为缓解压力，不得不紧急调配更多英伟达GPU。许多上线DeepSeek的平台显示服务器繁忙，其实就是平台提供的算力跟不上飞速增长的用户需求。

向金融、科研、航空航天等公司可以提供超算云服务的并行科技（839493.BJ）董事长陈健称，模型的生命周期通常是先训练，然后部署为服务，最后进行推理。目前是企业在DeepSeek模型推理过程中爆发了大量算力需求。

据经济观察网记者统计，英伟达在中国合法销售的型号包括：H20、L20，T4；游戏显卡涵盖RTX 40系列（除RTX 4090外）和RTX 30系列及更早型号，还有新推出的RTX 5090限制版5090D。

目前市面上有十几款国产GPU品牌，但普遍在性能、稳定性和生态上与英伟达存在一定差距，英伟达卡仍是企业们的最优选择。

DeepSeek的R1模型发布后，英伟达股价遭遇过去一年来最大跌幅17%，但自2月3日慢慢的出现反弹，目前回升了13%。

国内某模型厂商一位人士对经济观察网记者称，DeepSeek的出现让业界反思算力泡沫，AI训练是不是能够不再依赖大规模的高端GPU集群，但是随着提供模型和使用模型的个人和企业都在爆发式增长，大量的模型推理再一次推升了对英伟达卡的需求。

陈健认为，DeepSeek带给产业界的震动是AIGC大模型训练、推理算力消耗大幅度降低。相比模型推理，模型训练的需求并没有在短期内出现爆发式增长。

DeepSeek展现出强大的推理能力与优秀的文采，但是提供DeepSeek服务的代价也很大。

上述国内模型厂商的人说，目前DeepSeek满血版对硬件配置要求非常高，至少需要两台H800卡才能运行起来，而国内大多数基础模型只需要一台4090卡就能运行。

通常来说，模型能力与参数量和精度紧密关联，参数量影响AI的知识量，精度影响AI的准确性和推理能力，这也是为什么很多平台上线的DeepSeek看起来“智商”不足，因为背后的算力不足以支持模型在参数量和精度上达到最佳状态。

不过，上述国内模型厂商的人表示，这种急迫的算力需求未必持续很久。在实际应用中，开发者通常会将超过600B参数量的模型进行蒸馏，压缩到更低参数规模，再用于商业化。而DeepSeek发展得太快以至于团队还没有来得及完成蒸馏，可能后续几个月蒸馏好后，那些上线DeepSeek的公司能够节约一些推理算力。

大科创新闻部记者关注硬科技领域，包括机器人及人工智能、无人机、虚拟现实（VR/AR）、智能穿戴，以及新材料领域。擅长企业深度报道及上市公司分析报道。发现前沿技术、发展的新趋势投资价值。