cuda driver和runtime

Runtime是建立在Driver上的, 它里面的接口实际都可以拆解为Driver的接口。CUDA driver相比runtime需要做显式的device初始化, 以及context、module的管理, 这些概念在runtime中是不存在, 也是不希望用户关心的。CUDA的接口分三个层次: CUDA Library, CUDA Runtime 和CUDA Driver. 而我们的程序可以在任意一

zwhdldz

672人浏览 · 2023-07-28 16:48:35

zwhdldz · 2023-07-28 16:48:35 发布

在这里插入图片描述
上图表示了CUDA程序调用中间API的层次结构和所处设备情况。
CUDA的接口分三个层次: CUDA Library, CUDA Runtime 和CUDA Driver. 而我们的程序可以在任意一个层次上调用CUDA.层次最高的Library自不必多言,诸如cudnn等。
CUDA Driver 与 CUDA Runtime 相比更偏底层，就意味着 Driver API 有着更灵活的控制，也伴随着更复杂的编程。我们平时常用的 nvidia-smi 调用的是 Driver API。最开始 Driver API 是与显卡沟通的底层 API，但是人们发现 Driver API 太过底层，由此引入了 Runtime API。Runtime是建立在Driver上的, 它里面的接口实际都可以拆解为Driver的接口。两者之间并没有显著的性能差异, 但接口相互排斥,不能同时调用。相比之下，Runtime抽象层次更高,更容易编写。因此可以由Runtime实现的功能, 推荐使用Runtime进行编写。CUDA driver相比runtime需要做显式的device初始化, 以及context、module的管理, 这些概念在runtime中是不存在, 也是不希望用户关心的。

接口	封装层次	常用API	include和lib
CUDA Driver	更底层	cu+:cuMemAlloc、cuMemset…	cuda.h\libcuda.so
CUDA Runtime	更高级	cuda+:cudaMalloc、cudaMemset…	cuda_runtime.h/ libcudart.so

Triton中文社区

欢迎来到由智源人工智能研究院发起的Triton中文社区，这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂，为推动人工智能技术的普及与深化应用贡献力量。

更多推荐

Stable Diffusion 针对50系显卡CUDA 12.9 的cuda error解决办法

笔者新买了RTX 5080，自然是要整AI 绘画的，但新的CUDA版本一直报错，终于在今天解决，于是写一篇文章来分享一下。

Triton中文社区

jetson agx orin 刷机、cuda、pytorch配置指南【亲测有效】

2.刷机时需准备ubuntu系统，可以是虚拟机，注意安装SDK Manager刷机时，JetPack版本要选对，JetPack6.0的对应ubuntu22，cuda12版本，对应pytorch支持2.0以上的，如果你要使用pytorch2.0以下版本（pytorch1.12），则需要安装JetPack5.0，对应ubuntu20，cuda11版本，更推荐这个版本。刷机完成后，需要进行cuda环境配