找回密码
 注册
快捷导航
查看: 264|回复: 23

[其它] 【原创】在P52上用外置显卡继续探索deepseek-r1

[复制链接] |自动提醒
阅读字号:

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
发表于 2025-2-16 12:30:55| 字数 826| - 中国–北京–北京 移动 | 显示全部楼层 |阅读模式
上文书说到,P52上的P2000显卡只有4G显存,一次性只能装下1.5b的模型,否则就是CPU和GPU集成运算,速度比较着急


deepseek-r1的模型中,1.5b就是玩具,7b-14b算一个等级,32b-70b算是一个等级,门槛在32b

32b模型20G,需要24G显存,有人说2080TI魔改版22G也能运行,
我想提升一下机器,尤其是显卡,
一是内核高级点,怎么也得图灵之后的,对应tesla系列就是T系列,对应Quadro就是RTX,对应GeForce就是20系
二是显存大些,最好24G往上,
三是不想功耗太高,噪音太大,

条件所限,只能用笔记本。
先是查了市场上笔记本显卡配置,发现显存最大16G,核心RTX5000ada,配它的都是旗舰机,价格很美丽,
低一些的,比如P15gen2 2021年款也不便宜,而且这些机器内存还没突破128G,
再加上Intel12代CPU过热,13-14代CPU故障,感觉当前不是购买笔记本的时候。

不得不考虑外置显卡,有24G的显卡一共三款,Titan RTX、3090、4090,
Titan RTX在4000元价位,3090在5300元,4090要13000元,
其实,显存如果上48G,就可以用70b了,最低的RTX8000也有4090的价位,
估计受到deepseek的冲击,后边的显卡显存可能会越来越大,价格也会下滑,
另一方面,国内支持deepseek的算力平台越来越多,价格战已经出现,有些计算可以转到网上,
对我这摸索性质,需求没那么高,能跑起来就行。

于是,经过比较,我买了外置显卡坞和一张3080Ti移动芯片改的外置显卡,显存16G,功耗上限115W,驱动需要手动安装。
现在,我的P52里有两个独立显卡,集成的在BIOS里关了,要不然P2000和3080无法共存。

装上后,用鲁大师做了测试,鲁大师竟然说我的P2000不支持AI,好在有3080还能做AI测试。
这回再跑14b就很轻松了,32b还是集成计算,不过也好像快了点。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2

9249

回帖

91

积分

1万

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2005-4-18
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)
发表于 2025-2-16 12:37:12| 字数 15| - 美国–加利福尼亚州–洛杉矶–洛杉矶 IT7网络 来自iOS客户端 | 显示全部楼层
写得清楚,小白表示:好像理解了
X220 i7 IPS 8G 480G
T430s i7 NVS5200 IPS 8G 480G
T440P 4810MQ 730M IPS 16G
回复 支持 反对

使用道具 举报

1万

回帖

238

积分

6万

资产值

至尊会员II Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2011-9-6
铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)月全勤勋章
发表于 2025-2-16 14:07:36| 字数 9| - 中国–上海–上海 电信 | 显示全部楼层
看来只有台式机了。
Go ahead and live your live!
回复 支持 反对

使用道具 举报

3asayhi - 专门网民

4723

回帖

42

积分

1万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2006-9-12
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2025-2-16 15:38:01| 字数 34| - 中国–上海–上海 移动 | 显示全部楼层
台式机是最佳解法,但大部分人都在移动需求,还是P系统列是个不错的选择
常玩: P53 | T480s 2K | Station 伪E30 | Magicbook 15 | MBA
抽屉:T61躯壳 | 送人:T450s 改嫁:T30 | 570 | 600E 扔了: 390E
回复 支持 反对

使用道具 举报

3asayhi - 专门网民

4723

回帖

42

积分

1万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2006-9-12
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2025-2-16 15:39:08| 字数 167| - 中国–上海–上海 移动 | 显示全部楼层
QUOTE:
panyl 发表于 2025-2-16 12:30
上文书说到,P52上的P2000显卡只有4G显存,一次性只能装下1.5b的模型,否则就是CPU和GPU集成运算,速度比较 ...

楼主有没有在Linux内核下调用GPU算力,如果有好的方法望分享下,Linux内核下不会调,Windows下也不会调,毕竟不是码农出身,只是单纯想玩玩.
常玩: P53 | T480s 2K | Station 伪E30 | Magicbook 15 | MBA
抽屉:T61躯壳 | 送人:T450s 改嫁:T30 | 570 | 600E 扔了: 390E
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-16 18:55:23| 字数 517| - 中国–北京–北京 移动 | 显示全部楼层
本帖最后由 panyl 于 2025-2-17 20:15 编辑
QUOTE:
3asayhi 发表于 2025-2-16 15:39
楼主有没有在Linux内核下调用GPU算力,如果有好的方法望分享下,Linux内核下不会调,Windows下也不会调,毕竟 ...

linux没试过,win10可以试试以下设置。

1. 打开环境变量设置:
右键点击 开始菜单 → 系统 → 高级系统设置 → 环境变量。

2. 新建系统变量:
变量名: OLLAMA_GPU_LAYER,变量值: cuda(NVIDIA)

3. 制定GPU设备:
我有两个显卡,为了强制指定 GPU 设备,也添加了系统环境变量
变量名: CUDA_VISIBLE_DEVICES,变量值: 0
系统的GPU顺序是什么,可以反复试试,变量值从0,1,2到更多,我开始用的1发现没效果。

重启ollama,装入模型,观察“任务管理器”的“性能”页面可以看到模型装入过程。

我设置完后,用ollama装入了14b的模型,整个模型装入3080显存,没用到p2000
问了个问题,在3080显卡里运行很快,在任务管理器里看占用率没超过2%,但是nvidia-smi监测图到了88%,这88%不是在装入模型时的截图,就是回答问题过程中的截图
问题及回答见附件。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-16 19:59:25| 字数 58| - 中国–北京–北京 移动 | 显示全部楼层
QUOTE:
sharman 发表于 2025-2-16 12:37
写得清楚,小白表示:好像理解了

感谢,读者的评价最重要哈!
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

344

回帖

11

积分

3万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2004-6-9
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章金牌荣誉勋章(注册20年以上会员)
发表于 2025-2-17 00:30:33| 字数 26| - 亚太地区 | 显示全部楼层
16G显存还是不太够啊...32B的没法全加到显存跑
回复 支持 反对

使用道具 举报

3asayhi - 专门网民

4723

回帖

42

积分

1万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2006-9-12
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2025-2-17 00:38:01| 字数 152| - 中国–上海–上海 移动 | 显示全部楼层
QUOTE:
panyl 发表于 2025-2-16 18:55
linux没试过,win10可以试试以下设置。

1. 打开环境变量设置:

按你的方法刚试了下,我的效果还是不太理想,还是以CPU为主,看任务中共享显存利用很高,可能是调用了核显,还要再调试,有空了再按你的思路去摸索GPU的顺序,我的P53是T1000显卡
常玩: P53 | T480s 2K | Station 伪E30 | Magicbook 15 | MBA
抽屉:T61躯壳 | 送人:T450s 改嫁:T30 | 570 | 600E 扔了: 390E
回复 支持 反对

使用道具 举报

1298

回帖

12

积分

6930

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2024-3-25
月全勤勋章
发表于 2025-2-17 08:21:37| 字数 22| - 中国–江苏–南京 电信 | 显示全部楼层
我手头上还真没有可以跑这个的小黑,全都是核显
07年高中生,24年新入坑的萌新
t60 14.1正屏 t7200 集成显卡 指纹 X230 i5 3210(已出) W510 i7 820qm(剩余配件已出)  W520 2920xm Q1000m 友达v4 校色仪(w510升级成w520)  t440p i3 4000m gt730 背光键盘 三键触摸板 BOE(已出)  t440p i5 4210m gt730 三键触摸板 (送人)  t420 17 2760QM 集成显卡  t480 i5 8250 集成显卡 指纹 背光键盘 BOE 人脸识别  t470 i7-7600U 集成显卡 指纹 高分屏
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-17 20:16:44| 字数 89| - 中国–北京–北京 移动 | 显示全部楼层
QUOTE:
wangbin_yh 发表于 2025-2-17 00:30
16G显存还是不太够啊...32B的没法全加到显存跑

是啊,其实比较合适的是3090,不过功耗太高,又眼瞅要淘汰。
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-17 20:17:19| 字数 90| - 中国–北京–北京 移动 | 显示全部楼层
QUOTE:
Gaoth2007 发表于 2025-2-17 08:21
我手头上还真没有可以跑这个的小黑,全都是核显

可以考虑外置显卡,有雷电3接口就行,好像现在的外置显卡坞都需要这个接口。

点评

我用T480s做了简单测试,半速雷电应该也能用,已在另贴发布  发表于 2025-2-18 21:34
我目前最新的机器是t480不是全速雷电,  发表于 2025-2-17 21:57
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-17 20:23:24| 字数 129| - 中国–北京–北京 移动 | 显示全部楼层
QUOTE:
3asayhi 发表于 2025-2-17 00:38
按你的方法刚试了下,我的效果还是不太理想,还是以CPU为主,看任务中共享显存利用很高,可能是调用了核显,还 ...

T1000显卡也是4G显存吧,不知道对AI的支持怎么样,比我的P2000 4G提升多少。
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

3asayhi - 专门网民

4723

回帖

42

积分

1万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2006-9-12
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2025-2-17 21:57:12| 字数 136| - 中国–上海–上海 移动 | 显示全部楼层
QUOTE:
panyl 发表于 2025-2-17 20:23
T1000显卡也是4G显存吧,不知道对AI的支持怎么样,比我的P2000 4G提升多少。

是的 4G显存,主要是要先调通过后才能给你参考数据,以前用没有发现,认为是平台太老,随着对AI模型的认知才发现我没有调用GPU的算力
常玩: P53 | T480s 2K | Station 伪E30 | Magicbook 15 | MBA
抽屉:T61躯壳 | 送人:T450s 改嫁:T30 | 570 | 600E 扔了: 390E
回复 支持 反对

使用道具 举报

2504

回帖

59

积分

1万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2007-8-8
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2025-2-17 23:20:24| 字数 114| - 中国–广东–汕头 电信 | 显示全部楼层
QUOTE:
panyl 发表于 2025-2-16 18:55
linux没试过,win10可以试试以下设置。

1. 打开环境变量设置:

任务管理器要选择cuda占用或其他的具体你自己看着办,默认显示的那个是3D占用。你这个跑32B速度有多少
志不在本子,只玩台式,本子纯工具。尽量克制厌蠢,感谢傻子NPC构成了这个世界。

自己IBM 560(2001~2002)→只玩台式的13年→公资私机x220(2014~2020)→自己置换T450s(2020~2021)→换工作卖了,TP空窗期3年→公有P14s Gen3
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-18 21:54:39| 字数 340| - 中国–北京–北京 移动 | 显示全部楼层
QUOTE:
StormBolt 发表于 2025-2-17 23:20
任务管理器要选择cuda占用或其他的具体你自己看着办,默认显示的那个是3D占用。你这个跑32B速度有多少 ...

我用这个命令,问了个问题
C:\Users\P52>ollama run deepseek-r1:32b --verbose

total duration:       1m59.1082793s
load duration:        18.7467ms
prompt eval count:    46 token(s)
prompt eval duration: 2.603s
prompt eval rate:     17.67 tokens/s
eval count:           391 token(s)
eval duration:        1m56.485s
eval rate:            3.36 tokens/s
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-18 22:03:41| 字数 110| - 中国–北京–北京 移动 | 显示全部楼层
QUOTE:
StormBolt 发表于 2025-2-17 23:20
任务管理器要选择cuda占用或其他的具体你自己看着办,默认显示的那个是3D占用。你这个跑32B速度有多少 ...

谢谢指点,知道把任务管理器的3D改为CUDA了
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-18 22:17:01| 字数 249| - 中国–北京–北京 移动 | 显示全部楼层
我又测了一下14b的速度
C:\Users\P52>ollama run deepseek-r1:14b --verbose

total duration:       7.6745916s
load duration:        18.5174ms
prompt eval count:    144 token(s)
prompt eval duration: 9ms
prompt eval rate:     16000.00 tokens/s
eval count:           277 token(s)
eval duration:        7.638s
eval rate:            36.27 tokens/s
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

2504

回帖

59

积分

1万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2007-8-8
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2025-2-18 23:12:44| 字数 111| - 中国–广东–汕头 电信 | 显示全部楼层
QUOTE:
panyl 发表于 2025-2-18 21:54
我用这个命令,问了个问题
C:%users\P52>ollama run deepseek-r1:32b --verbose

速度慢得有点不正常,显存那里占用共享显存了?
志不在本子,只玩台式,本子纯工具。尽量克制厌蠢,感谢傻子NPC构成了这个世界。

自己IBM 560(2001~2002)→只玩台式的13年→公资私机x220(2014~2020)→自己置换T450s(2020~2021)→换工作卖了,TP空窗期3年→公有P14s Gen3
回复 支持 反对

使用道具 举报

659

回帖

14

积分

2万

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2012-11-16
 楼主| 发表于 2025-2-19 19:52:31| 字数 84| - 中国–北京–北京 移动 | 显示全部楼层
QUOTE:
StormBolt 发表于 2025-2-18 23:12
速度慢得有点不正常,显存那里占用共享显存了?

是啊,32b要40G,超过显存容量了,我这3080只有16G
W530-3840/T480s/X1 Tablet EVO/P52/X230/X1C2018/W530-3940/X200/T400/T400/T60-IPS/T60-IPS/X301/X61/T60P
MBP MD104x2
回复 支持 反对

使用道具 举报

2504

回帖

59

积分

1万

资产值

钻石会员 Rank: 3Rank: 3Rank: 3

注册时间
2007-8-8
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)月全勤勋章
发表于 2025-2-19 20:29:43| 字数 130| - 中国–广东–汕头 电信 | 显示全部楼层
QUOTE:
panyl 发表于 2025-2-19 19:52
是啊,32b要40G,超过显存容量了,我这3080只有16G

不,显存占到16G就可以了,剩下让CPU跑,放内存里,共享显存要弄成0速度才能最大化

但是ollama我不知道怎么调占比,我用的是LMStudio
志不在本子,只玩台式,本子纯工具。尽量克制厌蠢,感谢傻子NPC构成了这个世界。

自己IBM 560(2001~2002)→只玩台式的13年→公资私机x220(2014~2020)→自己置换T450s(2020~2021)→换工作卖了,TP空窗期3年→公有P14s Gen3
回复 支持 反对

使用道具 举报

457

回帖

15

积分

8084

资产值

黄金会员 Rank: 3Rank: 3Rank: 3

注册时间
2007-7-13
银牌荣誉勋章(注册10年以上会员)铜牌荣誉勋章(注册8年以上会员)
发表于 2025-2-20 16:20:51| 字数 38| - 中国–广西–北海 电信 | 显示全部楼层
我的也是P52回头也整一个外接的,安装的的7b,和网站回复感觉还是有一差距。
X32-2672KL 2.0/2G/HT160G+500G/BT/WIFI+DOCKII
w500 8G/9400
W520 16G/2960XM
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Powered by Discuz! X3.5 © 2001-2023 Comsenz Inc

GMT+8, 2025-2-20 17:11 , Processed in 0.132141 second(s), 54 queries , Gzip On, OPcache On.

手机版|小黑屋|安卓客户端|iOS客户端|Archiver|备用网址1|备用网址2|在线留言|专门网

返回顶部