清华团队突破算力难题:4090显卡单枪匹马就能跑“满血版”DeepSeek-R1!有用户称整套方案成本不到7万元,直降95%以上

小微 2025月07月31日 阅读数 49157

2月10日,清华KVCache.AI团队联合趋境科技发布KTransformers开源项目更新,支持24G显存在本地运行DeepSeek-R1、V3的671B“满血版”。更新发布后,不少开发者测试发现,显存消耗比技术文档中提到的还要少,实际内存占用约380G,显存占用约14G。有用户对方案成本进行分项分析后称,只要不到7万元就能实现R1模型的本地运行,与A100/H100服务器动辄200万元的价格相比,便宜了95%以上。不过,该方案也有诸多限制,如推理速度和适用模型等。

清华团队突破算力难题:4090显卡单枪匹马就能跑“满血版”DeepSeek-R1!有用户称整套方案成本不到7万元,直降95%以上
图片来源于网络,如有侵权,请联系删除

推荐阅读:

新三板融资排行榜:华强方特募资近15亿用于项目建设等

新三板做市商排行榜:中信证券累计做市投入减少1100万

专访旷视AI治理研究院院长徐云程:AI产业不可套用互联网“先发展后治理”思路

版权声明

本文仅代表作者观点,不代表xx立场。
本文系作者授权xx发表,未经许可,不得转载。