深度学习服务器装机回忆录
没卡是没法做深度学习的,所以决定斥资装一台服务器.
关于本文
本想边装边写指南,但是由于自己也是第一次装PC,还不定会成功呢,再者也不想写成流水账.所以在成功使用了一段时间之后以回忆录的方式记一下.
因为不是按装机步骤记录的指南,所以可能对装机也没什么参考价值.仅饭后小文而已.
前言
本来由于已经有一台MBP了,所以还考虑过的方案是给它配外接GPU,链接网站(egpu.io)是专门给MBP配eGPU的大神们分享经验的地方,如果有这个需求或许可以参考.
后来之所以放弃是因为:
- MBP的CPU也不是很强(17款)
- 内存也只有16G
- 需要完全对接机器硬件、系统、GPU、电源等一些问题(会略复杂)
- MBP是需要便携移动的,eGPU有点烦了
- 干脆弄一台服务器,MBP来做数据探索、特征处理,服务器来跑代码,拓展性足够,两不耽搁(只是钱包略痛)
成本
成本来说的话,打算用于长期学习的话肯定自购硬件比较划算,毕竟随着时间的流逝,边际成本越来越低.
如果只是用个一时半会的肯定直接租用云平台了,在超出本地服务器要求时的短期需求也可以直接放在云平台上运行.
结果
过程虽有坎坷,结果还是OK的,但还有几个坑要提一下.
由于选了华硕x299主板,只能装win10(其实我想装Ubuntu啊++),系统原因又会导致一系列问题,比如NV、深度学习框架等等兼容性.在初学者的路上,任何一个小问题都可能使计划夭折在半路上,所以要慎重.主板的选择基本决定了系统,系统基本决定了平台和框架.所以要慎重.(选的时候注意主板和CPU/GPU的兼容基本就没啥问题了)
由于装的win10系统(在深度学习界并不是公认主流),导致TF-GPU安装一直报错失败,虽然参考官方文档进行了多次check,但依然没有解决,这就导致了keras基本处于不可用的状态.所幸Pytorch是可用的,不然我真是要洒泪了++,也就是现实将我逼上了Pytorch这座梁山.
装win系统还需要克制自己想装游戏的冲动,目前我还能克制.
过程
资料准备
资料来源主要参考了知乎上关于深度学习的装机指南帖子(https://www.zhihu.com/question/33996159?sort=created).
列配置
(此配置不具有参考性,请参考阅读时间当前的最新硬件及其兼容性[既然要装,这些也是逃不掉要学的,或早或晚,或交学费或没有])
- 主板: WS X299
- CPU: Inter i7 7820x
- GPU: RTX 2080
- 内存: 金士顿 16G*2
- SSD: SAMSUNG
- 水冷: 海盗船
- 硬盘: WD 4T
- 电源: CORSAIR
- 显示器: PHILIPS 27
- 机箱: AIR540
- 鼠键: 罗技
插线
设备买好之后,按照操作手册把线插好就行了.
当然,最复杂就是如何接主板上的接口,要多看两遍主板手册.
(走线不是关键,走线再漂亮,点不亮也是白搭)
装系统
本以为,虽没装过操作系统,应该也能搞定.
殊不知,没搞定.
然后找了个专业装系统的,花了120,++.(没有启动盘).
真是惭愧~
装软件
软件就比较简单了(但也不尽然,比如TF-GPU就没装好😢,道行还是不够啊).
写代码跑起来
测测GPU的安装成功与否.运行CUDA sample下的deviceQuery代码.
后记
平台搭好,只是开始.
后面的路还长.