深度学习服务器装机回忆录

没卡是没法做深度学习的,所以决定斥资装一台服务器.

关于本文

本想边装边写指南,但是由于自己也是第一次装PC,还不定会成功呢,再者也不想写成流水账.所以在成功使用了一段时间之后以回忆录的方式记一下.
因为不是按装机步骤记录的指南,所以可能对装机也没什么参考价值.仅饭后小文而已.

前言

本来由于已经有一台MBP了,所以还考虑过的方案是给它配外接GPU,链接网站(egpu.io)是专门给MBP配eGPU的大神们分享经验的地方,如果有这个需求或许可以参考.
后来之所以放弃是因为:

  • MBP的CPU也不是很强(17款)
  • 内存也只有16G
  • 需要完全对接机器硬件、系统、GPU、电源等一些问题(会略复杂)
  • MBP是需要便携移动的,eGPU有点烦了
  • 干脆弄一台服务器,MBP来做数据探索、特征处理,服务器来跑代码,拓展性足够,两不耽搁(只是钱包略痛)

成本

成本来说的话,打算用于长期学习的话肯定自购硬件比较划算,毕竟随着时间的流逝,边际成本越来越低.
如果只是用个一时半会的肯定直接租用云平台了,在超出本地服务器要求时的短期需求也可以直接放在云平台上运行.

结果

过程虽有坎坷,结果还是OK的,但还有几个坑要提一下.
由于选了华硕x299主板,只能装win10(其实我想装Ubuntu啊++),系统原因又会导致一系列问题,比如NV、深度学习框架等等兼容性.在初学者的路上,任何一个小问题都可能使计划夭折在半路上,所以要慎重.主板的选择基本决定了系统,系统基本决定了平台和框架.所以要慎重.(选的时候注意主板和CPU/GPU的兼容基本就没啥问题了)
由于装的win10系统(在深度学习界并不是公认主流),导致TF-GPU安装一直报错失败,虽然参考官方文档进行了多次check,但依然没有解决,这就导致了keras基本处于不可用的状态.所幸Pytorch是可用的,不然我真是要洒泪了++,也就是现实将我逼上了Pytorch这座梁山.
装win系统还需要克制自己想装游戏的冲动,目前我还能克制.

过程

资料准备

资料来源主要参考了知乎上关于深度学习的装机指南帖子(https://www.zhihu.com/question/33996159?sort=created).

列配置

(此配置不具有参考性,请参考阅读时间当前的最新硬件及其兼容性[既然要装,这些也是逃不掉要学的,或早或晚,或交学费或没有])

  • 主板: WS X299
  • CPU: Inter i7 7820x
  • GPU: RTX 2080
  • 内存: 金士顿 16G*2
  • SSD: SAMSUNG
  • 水冷: 海盗船
  • 硬盘: WD 4T
  • 电源: CORSAIR
  • 显示器: PHILIPS 27
  • 机箱: AIR540
  • 鼠键: 罗技

Markdown

插线

设备买好之后,按照操作手册把线插好就行了.
当然,最复杂就是如何接主板上的接口,要多看两遍主板手册.
Markdown
(走线不是关键,走线再漂亮,点不亮也是白搭)

装系统

本以为,虽没装过操作系统,应该也能搞定.
殊不知,没搞定.
然后找了个专业装系统的,花了120,++.(没有启动盘).
Markdown
真是惭愧~

装软件

软件就比较简单了(但也不尽然,比如TF-GPU就没装好😢,道行还是不够啊).

写代码跑起来

测测GPU的安装成功与否.运行CUDA sample下的deviceQuery代码.
Markdown

后记

平台搭好,只是开始.
Markdown
后面的路还长.