Triton Inference Server PyTorch 后端使用教程

Triton Inference Server PyTorch 后端使用教程pytorch_backend项目地址:https://gitcode.com/gh_mirrors/py/pytorch_backend 1. 项目的目录结构及介绍.├── github│└── workflows│├── cmake│└── src├── tools│...

荣钧群

505人浏览 · 2024-08-25 07:43:07

荣钧群 · 2024-08-25 07:43:07 发布

Triton Inference Server PyTorch 后端使用教程

pytorch_backend项目地址:https://gitcode.com/gh_mirrors/py/pytorch_backend

1. 项目的目录结构及介绍

.
├── github
│   └── workflows
│       ├── cmake
│       └── src
├── tools
│   └── clang-format
├── .gitignore
├── .pre-commit-config.yaml
├── CMakeLists.txt
├── LICENSE
├── README.md
├── pyproject.toml

github/workflows: 包含项目CI/CD工作流的配置文件。
tools/clang-format: 包含代码格式化工具的配置文件。
.gitignore: 指定Git版本控制系统忽略的文件和目录。
.pre-commit-config.yaml: 预提交钩子的配置文件。
CMakeLists.txt: CMake构建系统的配置文件。
LICENSE: 项目的许可证文件。
README.md: 项目的主文档，包含项目的基本信息和使用说明。
pyproject.toml: 项目构建和包管理的配置文件。

2. 项目的启动文件介绍

项目中没有明确的“启动文件”，因为Triton Inference Server的PyTorch后端主要是通过配置和构建来使用的。具体的启动和运行过程通常涉及以下步骤：

构建项目：使用CMake进行构建。
配置模型：在Triton Inference Server中配置模型和后端。
启动服务器：运行Triton Inference Server以加载配置的模型并提供推理服务。

3. 项目的配置文件介绍

CMakeLists.txt: 用于配置和构建项目的CMake文件。
.pre-commit-config.yaml: 用于配置预提交钩子，确保代码提交前通过一系列检查。
pyproject.toml: 用于配置项目构建和包管理的文件。

这些配置文件共同确保了项目的正确构建和运行，以及代码的质量和一致性。

pytorch_backend项目地址:https://gitcode.com/gh_mirrors/py/pytorch_backend

Triton中文社区

欢迎来到由智源人工智能研究院发起的Triton中文社区，这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂，为推动人工智能技术的普及与深化应用贡献力量。

更多推荐

Triton入门教程：安装与编写和运行简单Triton内核

Triton中文社区

终于成功Windows 下安装 triton 教程

Triton中文社区

大模型推理框架Triton使用教程：从青铜到王者的修炼

所谓自定义backend就是自己写推理过程，正常情况下整个推理过程是通过模型直接解决的，但是有一些推理过程还会包含一些业务逻辑，比如：整个推理过程需要2个模型，其中要对第一个模型的输出结果做一些逻辑判断然后修改输出才能作为第二个模型的输入，最简单的做法就是我们调用两次triton服务，先调用第一个模型获取输出然后进行业务逻辑判断和修改，然后再调用第二个模型。不过在triton中我们可以自定义一个b