268
309
1600
金牌会员
吊打华伪 发表于 2025-4-12 15:04 你跑的时最小的吧,几GB的那种。 单凡你跑个10GB的, 就不可能有这个速度。 理论最好的情况10-6=4GB要传 ...
使用道具 举报
17
94
329
中级会员
杜甫 发表于 2025-4-12 15:30 16B,模型大小8.9G
吊打华伪 发表于 2025-4-12 16:07 你这个是moe的,每次只读取激活的权重,远远小于8.9. 大概率都小于6GB. 其他模型每次都要读取8.9GB. ...
杜甫 发表于 2025-4-12 16:15 不懂。 128G的内存,能跑32B的模型了吧
吊打华伪 发表于 2025-4-12 17:03 能是能,就是超级慢。 你也不用折腾了,就跑i现在这个moe最合适了,换其他的8.9G 最多2token/s. 换更大 ...
45
467
1385
杜甫 发表于 2025-4-12 17:11 就是说去掉烂显卡,反而会快很多?
吊打华伪 发表于 2025-4-12 14:35 香菇肥牛,有印象 记得以前看过你博客的一篇教程。 没有独显,纯核显。
本版积分规则 发表回复 回帖后跳转到最后一页
|Archiver|手机版|小黑屋|主机论坛
GMT+8, 2025-5-5 13:54 , Processed in 0.079189 second(s), 16 queries .
Powered by Discuz! X3.4
© 2001-2023 Discuz! Team.