清华团队突破算力难题:4090显卡单枪匹马就能跑“满血版”DeepSeek-R1!有用户称整套方案成本不到7万元,直降95%以上
小微
2025月07月31日
阅读数 49157
2月10日,清华KVCache.AI团队联合趋境科技发布KTransformers开源项目更新,支持24G显存在本地运行DeepSeek-R1、V3的671B“满血版”。更新发布后,不少开发者测试发现,显存消耗比技术文档中提到的还要少,实际内存占用约380G,显存占用约14G。有用户对方案成本进行分项分析后称,只要不到7万元就能实现R1模型的本地运行,与A100/H100服务器动辄200万元的价格相比,便宜了95%以上。不过,该方案也有诸多限制,如推理速度和适用模型等。
图片来源于网络,如有侵权,请联系删除
推荐阅读:
版权声明
本文仅代表作者观点,不代表xx立场。
本文系作者授权xx发表,未经许可,不得转载。