您现在的位置是：首页 > 名人名句

mmdet里workers_per_gpu和sampers_per_gpu的作用

作者：欧阳逸时间：2024-04-15 18:25:27分类：名人名句

简介　　文章浏览阅读6.1k次，点赞17次，收藏18次。python进程、mmdet里的worker_per_gpu和随机操作的一些理解_workers_per_gpu

点击全文阅读

背景：

最近用mmdet的时候发现一个问题，在pipeline里进行一些随机操作（例如随机裁剪）的时候，设定一个随机种子random seed，理论上每次随机操作的结果都不同，但是实际上发现会有2张图的操作结果是一样的。

本来以为是batch_size的问题，就去修改了sampers_per_gpu 。结果发现实际上是workers_per_gpu的问题。因此就来好好研究下这俩个参数的作用和意义。

实际上科班的应该对进程比较熟悉，但是也考虑到有很多像我一样非科班的小白，可能对进程workers不是很理解，故此记录下，也欢迎大佬交流指正

这俩个参数具体出现在configs文件里

sampers_per_gpu

这个参数会传入在mmdet/datasets/builder.py里

if dist:        # When model is :obj:`DistributedDataParallel`,        # `batch_size` of :obj:`dataloader` is the        # number of training samples on each GPU.        batch_size = samples_per_gpu        num_workers = workers_per_gpu    else:        # When model is obj:`DataParallel`        # the batch size is samples on all the GPUS        batch_size = num_gpus * samples_per_gpu        num_workers = num_gpus * workers_per_gpu

可以看到sampers_per_gpu就是控制batch_size的，决定了dataloader一次从dataset里取几个样本（几张图）。

注意这里单卡和多卡不一样，简单说sampers_per_gpu是决定每张卡取多少sampers，总的batch_size要乘以你用的gpu显卡数目

workers_per_gpu

这个参数决定读取数据时每个gpu分配的线程数。

数据加载时每个 GPU 使用的子进程（subprocess）数目。

因此如果workers=2，那就会把一个相同的随机种子seed同时作用于两个samper，因此就会导致出现两个分支（进程），就会产生不同组的图做的随机操作完全一样的情况。

点击全文阅读

郑重声明：

本站所有活动均为互联网所得，如有侵权请联系本站删除处理

mmdet里workers_per_gpu和sampers_per_gpu的作用

随便看看

我来说两句

本栏最新

本栏热门

全站热门