背景:服务器的cudnn版本太低了,没有权限去修改。故新建包含cuda和cudnn的docker
步骤

一、拉取镜像及创建docker

  1. 拉取相关的镜像
  2. 根据镜像创建docker
docker run -itd --gpus gpu数量  \
--name=新建docker名 \
--shm-size=指定共享内存大小 \
端口映射
-v 服务器地址:映射地址 镜像名
docker run -itd --gpus 4  \
--name="cuda_1201" \
--shm-size=4g \
-p 38040:38040 -p 38041:38041 -p 38042:38042 \
-v /data/cv:/mount nvidia/cuda:12.0.1-cudnn8-devel-ubuntu20.04

二、docker内配置网络

  1. apt install 无法安装包
    • 备份docker中的source.lst
    • 在docker中执行cp /etc/apt/sources.list /etc/apt/sources.list.bk
    • 清华源下载配置文件
      在这里插入图片描述
  • 根据上述的选项得到的文本,复制到/etc/apt/sources.list
    在这里插入图片描述
  • 在dockers中执行apt updateapt upgrade
    进行完上述步骤后,就可以用apt进行安装包了apt install vim python3 pip3 git
参考链接
  1. CUDA 安装教程
  2. Error response from daemon: manifest for nvidia/cuda:latest not found: manifest unknown: manifest
安装Anaconda以及使conda命令有效
  1. 下载Anaconda。清华源https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive,我这里下载的是Anaconda3-5.1.0-Linux-x86_64.sh
  2. 在docker中执行 bash Anaconda3-5.1.0-Linux-x86_64.sh
  3. 一直enter/yes后,anaconda安装的位置是/root/anaconda3,配置文件所在的位置/root/.bashrc
  4. 使conda命令生效export PATH="/root/anaconda3/bin:$PATH"
  5. 新建conda环境conda create -n bert python=3.8
  6. 激活conda环境source activate bert
docker中安装字体

apt-get update && apt-get install -y fonts-dejavu fonts-liberation fonts-indic
查看本机支持的字体

import matplotlib.font_manager as fm

def list_system_fonts():
    font_list = fm.findSystemFonts(fontpaths=None, fontext='ttf')
    font_names = sorted(set([fm.FontProperties(fname=fname).get_name() for fname in font_list]))
    return font_names
报错1
Solving environment: failed

CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/noarch/repodata.json>
Elapsed: -

An HTTP error occurred when trying to retrieve this URL.
HTTP errors are often intermittent, and a simple retry will get you on your way.
SSLError(MaxRetryError(‘HTTPSConnectionPool(host=‘mirrors.tuna.tsinghua.edu.cn’, port=443): Max retries exceeded with url: /anaconda/pkgs/free/noarch/repodata.json (Caused by SSLError(SSLError(“bad handshake: Error([(‘SSL routines’, ‘ssl3_get_server_certificate’, ‘certificate verify failed’)],)”,),))’,),)
————————————————

参考链接Conda 清华源连接失败原因与解决
解决方案:conda config --set ssl_verify false

报错2

无法创建conda环境
临时禁用SSL验证:注意,这不是推荐的长期解决方案,因为它会降低安全性,但可以帮助诊断问题。在执行conda命令时添加–no-verify-ssl选项,例如:
conda config --set ssl_verify false
在完成你的操作后,记得重新开启SSL验证以保障安全:
conda config --set ssl_verify true
参考链接https://blog.csdn.net/weixin_44245188/article/details/139768378

Logo

欢迎来到由智源人工智能研究院发起的Triton中文社区,这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂,为推动人工智能技术的普及与深化应用贡献力量。

更多推荐