最近训练了深度学习模型,CPU比GPU太慢了,想了也不会花太长时间,准备在网上租个云,刚看到百度云GPU服务器双十一特价便宜NVIDIA Tesla T4,2560个CUDA双十一折扣726包月。
别误会,这不是广告!想了想,先买一个按小时收费的体验。NVIDIA Tesla T4 8G最便宜的型号约4.73元/小时。让我们分享试用经验。主要根据以下入门文件操作:创建虚拟机
第一步:注册用户(此处省略)。
第二步:创建实例:
付款方式选择后付款(先付款是月/年,后付款是小时付款)配置,重点选择型号,一开始选择最便宜的,架构选择异构计算GPU、FPGA,型号如下所示。镜像选择GPU镜像中的16.04 LTS amd ** ( ** bit)-CUDA10.我用的0镜像PyTorch需要CUDA10.在弹性资源中,选择购买弹性公网IP否则,没有外网IP,无法使用ssh连接到网页上的服务器VNC连接。配置完成后,直接打开远程虚拟机,可用于浏览器VNC如下图所示,连接效果如下:
安装工具连接后,安装了一些与深度学习相关的工具:
先用ssh连接远程服务器:
$ ssh root@公网IP地址安装常用工具
$ apt install unzip$ apt install python3-pip # python包管理工具更换pip源(如不更换pip安装软件会很慢)
$ mkdir ~/.pip$ vi ~/.pip/pip.conf输入以下内容:
[global]index-url = ** /[install]trusted-host=mirrors.aliyun.com安装深度学习工具pytorch
$ pip3 install torch$ pip3 install torchvision看一下torch是否可用,在Python程序运行:
import torchtorch.cuda.is_available()如果输入为True,则CUDA可正常使用。pytorch-example中的mnist,跑步大约三五分钟。
其他常用库(版本匹配,比较麻烦,也可以直接安装conda)
$ apt install lib ** 6$ pip3 install opencv-python$ pip3 install ** tplotlib==3.0$ pip3 install pandas==0.22.0$ pip3 install scikit-i ** ge==0.14.4$ pip3 install Cython安装Jupyter 有些镜像本身包含jupyter notebook,可跳过安装,直接操作。
$ pip3 install jupyter启动jupyter notebook
$ jupyter notebook --allow-root --ip 0.0.0.0注意设置--ip打开远程访问,否则可能无法连接;如无法连接,建议在安全组检查88端口是否允许访问。
查看GPU使用情况
$ nvidia- ** i$ nvcc-V总结环境是Ubuntu 16.04加CUDA,系统比较干净,Apt还配备了软件源;使用;Docker或者Python需要自行安装Ssh Jupyter连接服务器的方式与本地开发几乎没有区别。百度智能云APP您可以随时查看收费情况。最小计费单位为分钟。只要创建实例(虚拟机),无论启动或关闭,只要不释放,都会计费和云磁盘CDS和弹性公网IP也是如此。换句话说,如果发布例子,以前建造的环境将消失。如果不发布,将收取费用。百度云支持用当前环境创建镜像,即40G该系统一次生成大约十分钟的新镜像。建议将常用环境制成镜像,以保持开发环境,比不释放资源便宜得多。GPU服务器更贵。在战略上,亚马逊和美团的服务器使用相似,主要取决于价格。Linux对于程序员来说,租用服务器比使用他人建造的服务器要好Web服务(如SinaAppEngine)好多了。假设有一天你觉得租的机器还不够快,可以申请顶级服务器,用自己的镜像启动,挂云盘的数据直接运行,就像在自己的机器上运行一样。更换模型非常方便。最后,省钱的方法是将开发环境制成镜像,并将数据存储在云盘上。每次使用前申请虚拟机,使用后立即释放。这样,当您不使用时,您只需支付每100左右的镜像和云盘存储费G每天一块多钱。如果长时间使用,用便宜的主机处理下载、转码、配置环境等日常事务,而GPU主机只做运算,挂云磁盘CDS共享数据。虽然每月的折扣比每小时的租金便宜得多,但建议新手一开始每小时的租金,因为他们不确定一开始使用多少,如何使用它。