新建包含cuda和cudnn的docker
背景:服务器的cudnn版本太低了,没有权限去修改。故新建包含cuda和cudnn的docker步骤。
背景:服务器的cudnn版本太低了,没有权限去修改。故新建包含cuda和cudnn的docker
步骤
一、拉取镜像及创建docker
- 拉取相关的镜像
-
从镜像列表选出相关版本的镜像https://gitlab.com/nvidia/container-images/cuda/blob/master/doc/supported-tags.md
-
在ubuntu系统中拉取镜像
docker pull nvidia/cuda:12.0.1-cudnn8-devel-ubuntu20.04
(按照官方docker pull nvidia/cuda
拉取最近的镜像会报错)
-
- 根据镜像创建docker
docker run -itd --gpus gpu数量 \
--name=新建docker名 \
--shm-size=指定共享内存大小 \
端口映射
-v 服务器地址:映射地址 镜像名
docker run -itd --gpus 4 \
--name="cuda_1201" \
--shm-size=4g \
-p 38040:38040 -p 38041:38041 -p 38042:38042 \
-v /data/cv:/mount nvidia/cuda:12.0.1-cudnn8-devel-ubuntu20.04
二、docker内配置网络
- apt install 无法安装包
- 备份docker中的
source.lst
- 在docker中执行
cp /etc/apt/sources.list /etc/apt/sources.list.bk
- 从清华源下载配置文件
- 备份docker中的
- 根据上述的选项得到的文本,复制到
/etc/apt/sources.list
中
- 在dockers中执行
apt update
和apt upgrade
进行完上述步骤后,就可以用apt进行安装包了apt install vim python3 pip3 git
参考链接
- CUDA 安装教程
- Error response from daemon: manifest for nvidia/cuda:latest not found: manifest unknown: manifest
安装Anaconda以及使conda命令有效
- 下载Anaconda。清华源https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive,我这里下载的是
Anaconda3-5.1.0-Linux-x86_64.sh
- 在docker中执行
bash Anaconda3-5.1.0-Linux-x86_64.sh
- 一直enter/yes后,anaconda安装的位置是
/root/anaconda3
,配置文件所在的位置/root/.bashrc
- 使conda命令生效
export PATH="/root/anaconda3/bin:$PATH"
- 新建conda环境
conda create -n bert python=3.8
- 激活conda环境
source activate bert
docker中安装字体
apt-get update && apt-get install -y fonts-dejavu fonts-liberation fonts-indic
查看本机支持的字体
import matplotlib.font_manager as fm
def list_system_fonts():
font_list = fm.findSystemFonts(fontpaths=None, fontext='ttf')
font_names = sorted(set([fm.FontProperties(fname=fname).get_name() for fname in font_list]))
return font_names
报错1
Solving environment: failed
CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/noarch/repodata.json>
Elapsed: -
An HTTP error occurred when trying to retrieve this URL.
HTTP errors are often intermittent, and a simple retry will get you on your way.
SSLError(MaxRetryError(‘HTTPSConnectionPool(host=‘mirrors.tuna.tsinghua.edu.cn’, port=443): Max retries exceeded with url: /anaconda/pkgs/free/noarch/repodata.json (Caused by SSLError(SSLError(“bad handshake: Error([(‘SSL routines’, ‘ssl3_get_server_certificate’, ‘certificate verify failed’)],)”,),))’,),)
————————————————
参考链接Conda 清华源连接失败原因与解决
解决方案:conda config --set ssl_verify false
报错2
无法创建conda环境
临时禁用SSL验证:注意,这不是推荐的长期解决方案,因为它会降低安全性,但可以帮助诊断问题。在执行conda命令时添加–no-verify-ssl选项,例如:
conda config --set ssl_verify false
在完成你的操作后,记得重新开启SSL验证以保障安全:
conda config --set ssl_verify true
参考链接https://blog.csdn.net/weixin_44245188/article/details/139768378
欢迎来到由智源人工智能研究院发起的Triton中文社区,这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂,为推动人工智能技术的普及与深化应用贡献力量。
更多推荐
所有评论(0)