pytorch并行报错:cuda unknown error 以及 daemonic processes are not allowed to have children
两个pytorch的并行报错
·
今天同时运行俩并行,每个并行4个pytorch进程。结果两个小时后报错了:cuda unknown error 有可能是显存爆了,但是不太像,因为最开始才70%。
此外,在使用multiprocess库并行的情况下,每个子进程的dataloader的num_worker只能设为0,否则会报错:daemonic processes are not allowed to have children。
欢迎来到由智源人工智能研究院发起的Triton中文社区,这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂,为推动人工智能技术的普及与深化应用贡献力量。
更多推荐
已为社区贡献2条内容
所有评论(0)