最新活动专区,涵盖免费试用、新手大礼、企业特惠,惊喜优惠抢先体验,超低成本、超高性价比,您可通过活动专区了解更多优惠福利
携手合作伙伴,实现业务上的双向合作共赢
我们为您提供全方位的支持与服务,确保您在使用我们的云服务时无忧无虑。
10+年商誉沉淀,深耕中国香港及海外高端资源
事情是这样的,上周leader突然说要我调研一下A100和4090跑大模型推理到底哪个划算。我当时心想,这不就查查参数算算账的事吗?结果搞了三天,真的会谢。
先说结论吧:没有标准答案,看你跑什么模型、什么场景。但我可以把我踩的坑和算的账都摊开说说。
A100 80G那个显存带宽2TB/s,4090是1TB/s。FP16算力A100是312 TFLOPS(开了TF32),4090大概330 TFLOPS。单看算力其实差不多,但显存容量差太多了——A100有80G,4090只有24G。
跑7B的模型两张卡都能塞下,没啥区别。但你要跑70B的,4090得搞个三四张做tensor parallel,A100一张就够。这个通信开销一上来,4090的优势就没了。
一张A100现在二手都要六七万,4090一万出头。你拿四张4090的钱还买不到一张A100。所以问题变成了:四张4090打得过一张A100吗?