文章来源于互联网:个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?







-
GitHub 地址:https://github.com/exo-explore/exo




-
Project DIGITS:250 TFLOPS / $3,000 ≈ 0.083 TFLOPS/美元 -
M4 Pro Mac Mini:17 TFLOPS / $2,200 ≈ 0.0077 TFLOPS/美元
不过知乎用户 Karminski – 牙医也指出了 Project DIGITS 的一大不足。他表示「它是统一内存,即 CPU 和 CPU 共享 LPDDR5X。它不是 GDDR6,也不是 HBM2 的。」
虽然该设备的内存有 128 GB,「但是根据 Grace 架构 CPU 的 Product Brief,单 CPU 的内存带宽最大只有 512GB/s。所以如果用这个设备来运行大语言模型,瓶颈就会变成这个内存带宽。」

他也做了一番计算,得出的结论是「在 512GB/s 的情况下,运行 70b-4bit 规模的模型,生成速度理论最大值是 512/40=12.8 token/s。如果想要运行 200B 规模的模型 (200B4bit 量化大概是 114GB),理论生成速度是 512/114≈4.5token/s」。
因此,Project DIGITS 可能也暗暗经受了老黄擅长的刀法。
Project DIGITS 果真赛高


文章来源于互联网:个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?