登录社区云,与社区用户共同成长
邀请您加入社区
联系作者
欢迎来到由智源人工智能研究院发起的Triton中文社区,这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂,为推动人工智能技术的普及与深化应用贡献力量。
更多推荐
Windows下安装triton
1、triton官方只支持Linux 2、Windows下安装triton,只能通过whl安装,且必须使用严格对应python版本 3、建议使用triton-windows的版本 https://github.com/woct0rdho/triton-windows 4、下载地址 https://github.com/woct0rdho/triton-windows/releases ------
【flask框架学习】解决Flask框架浏览器默认会记录最后一次请求,即2次发送POST请求问题
PyTorch博客 《使用 Triton 加速 2D 动态块量化 Float8 GEMM 简介》
2025年01月19日 23:14日本博客来源:https://pytorch.org/blog/accelerating-gemms-triton/ 这里做了翻译。这篇博客主要讲了如何用 Triton 来优化 Float8 格式的矩阵乘法(GEMM)运算。文章提出了一个叫 GridQuant 的方法,通过把大矩阵分成 256x256 的小块,然后再把每个小块分成更小的 32x32 的格子来处理数
扫一扫分享内容
所有评论(0)