Deprecated: Creation of dynamic property db::$querynum is deprecated in /www/wwwroot/www.boyupeixun.com/inc/func.php on line 1413

Deprecated: Creation of dynamic property db::$database is deprecated in /www/wwwroot/www.boyupeixun.com/inc/func.php on line 1414

Deprecated: Creation of dynamic property db::$Stmt is deprecated in /www/wwwroot/www.boyupeixun.com/inc/func.php on line 1453

Deprecated: Creation of dynamic property db::$Sql is deprecated in /www/wwwroot/www.boyupeixun.com/inc/func.php on line 1454
DeepSeek带火英伟达GPU “库存的禁售型号都抢空了”_星空体育最新官网_在线登录入口_app官网下载安卓
聚结器

DeepSeek带火英伟达GPU “库存的禁售型号都抢空了”

来源:星空体育最新官网    发布时间:2025-02-19 20:00:34

  2月13日,一位英伟达代理商告诉经济观察网记者,春节后第一周,两家中国科技公司为支撑开源大模型DeepSeek的推理服务,紧急向他们公司采购了L20 GPU算力设备。“去年,客户下单总要反复考虑和比价,现在连库存的禁售型号都抢空了”。

  DeepSeek的出现颠覆了市场将高性能GPU视为AI赛道核心的传统认知,导致作为高性能GPU垄断者的英伟达率先被市场看空。

  然而,更多产业人士发现,近期,无论是高性能的H系列GPU,还是RTX 40系列的高端显卡,英伟达的GPU重新变得供不应求。

  前述英伟达代理商目前正加紧为客户调配英伟达的产品。他发现,英伟达芯片在中国市场全线紧缺,一些已经禁售的H800系列存货一卡难求。

  此时,接入DeepSeek的中外企业已达数百家,国内云服务、互联网、手机、芯片、金融、医疗、汽车等行业都在上线和部署DeepSeek。

  迅速增长的用户量为上述公司能够带来“泼天富贵”:云服务借此兜售算力、芯片企业借此推广产品、车企以更低成本升级自己的软件、上市公司借此推升市值。

  一家IT厂商对经济观察网记者称,其调用DeepSeek的平台在上线首日增加了上万个用户,服务器几乎崩溃,现有算力已经跟不上用户的需求。团队为缓解压力,不得不紧急调配更多英伟达GPU。许多上线DeepSeek的平台显示服务器繁忙,其实就是平台提供的算力跟不上飞速增长的用户需求。

  向金融、科研、航空航天等公司可以提供超算云服务的并行科技(839493.BJ)董事长陈健称,模型的生命周期通常是先训练,然后部署为服务,最后进行推理。目前是企业在DeepSeek模型推理过程中爆发了大量算力需求。

  据经济观察网记者统计,英伟达在中国合法销售的型号包括:H20、L20,T4;游戏显卡涵盖RTX 40系列(除RTX 4090外)和RTX 30系列及更早型号,还有新推出的RTX 5090限制版5090D。

  目前市面上有十几款国产GPU品牌,但普遍在性能、稳定性和生态上与英伟达存在一定差距,英伟达卡仍是企业们的最优选择。

  DeepSeek的R1模型发布后,英伟达股价遭遇过去一年来最大跌幅17%,但自2月3日慢慢的出现反弹,目前回升了13%。

  国内某模型厂商一位人士对经济观察网记者称,DeepSeek的出现让业界反思算力泡沫,AI训练是不是能够不再依赖大规模的高端GPU集群,但是随着提供模型和使用模型的个人和企业都在爆发式增长,大量的模型推理再一次推升了对英伟达卡的需求。

  陈健认为,DeepSeek带给产业界的震动是AIGC大模型训练、推理算力消耗大幅度降低。相比模型推理,模型训练的需求并没有在短期内出现爆发式增长。

  DeepSeek展现出强大的推理能力与优秀的文采,但是提供DeepSeek服务的代价也很大。

  上述国内模型厂商的人说,目前DeepSeek满血版对硬件配置要求非常高,至少需要两台H800卡才能运行起来,而国内大多数基础模型只需要一台4090卡就能运行。

  通常来说,模型能力与参数量和精度紧密关联,参数量影响AI的知识量,精度影响AI的准确性和推理能力,这也是为什么很多平台上线的DeepSeek看起来“智商”不足,因为背后的算力不足以支持模型在参数量和精度上达到最佳状态。

  不过,上述国内模型厂商的人表示,这种急迫的算力需求未必持续很久。在实际应用中,开发者通常会将超过600B参数量的模型进行蒸馏,压缩到更低参数规模,再用于商业化。而DeepSeek发展得太快以至于团队还没有来得及完成蒸馏,可能后续几个月蒸馏好后,那些上线DeepSeek的公司能够节约一些推理算力。

  大科创新闻部记者关注硬科技领域,包括机器人及人工智能、无人机、虚拟现实(VR/AR)、智能穿戴,以及新材料领域。擅长企业深度报道及上市公司分析报道。发现前沿技术、发展的新趋势投资价值。

上一篇:大疆折叠无人机(DJI Flip)多个套装组合图片以及其他标准信息走漏
下一篇:政府工作报告