深度学习框架及开通说明
深度学习框架说明
阿里云机器学习平台上支持深度学习框架,同时后端提供了功能强大的GPU(型号M40、P100)计算集群。用户可以使用这些框架及硬件资源来运行深度学习算法。
目前支持的框架包括 TensorFlow(兼容开源TF1.4、1.8版本),MXNet 0.9.5, Caffe rc3。TensorFlow 和 MXNet 支持用户自己编写的 Python 代码, Caffe 支持用户自定义网络文件。
在使用深度学习框架训练数据之前,需要将训练的数据上传至阿里云对象存储OSS中,算法在运行时从指定的OSS目录中读取数据。需要注意的是阿里云机器学习目前只在华东2和华北2部署了GPU 集群,算法在执行时访问同一区域下OSS 中数据时不产生流量费用,访问其它地域的OSS会产生流量费用。
深度学习开通
深度学习组件包含 TensorFlow、Caffe、MXNet 三个框架。开通方式如下图所示,进入机器学习控制台,在相应项目下勾选GPU资源即可使用。
开通GPU资源的项目会被分配到公共的资源池,可以动态地调用底层的GPU计算资源。