vjeronymo2
/

mColBERT

Model card Files Files and versions

mColBERT / colbert /utils /distributed.py

vjeronymo2's picture

Adding model and checkpoint

828992f over 2 years ago

history blame contribute delete

688 Bytes

	import os
	import random
	import torch
	import numpy as np


	def init(rank):
	nranks = 'WORLD_SIZE' in os.environ and int(os.environ['WORLD_SIZE'])
	nranks = max(1, nranks)
	# nranks = -1
	# is_distributed = nranks > 0
	is_distributed = False

	if rank == 0:
	print('nranks =', nranks, '\t num_gpus =', torch.cuda.device_count())

	if is_distributed:
	num_gpus = torch.cuda.device_count()
	torch.cuda.set_device(rank % num_gpus)
	torch.distributed.init_process_group(backend='nccl', init_method='env://')

	return nranks, is_distributed


	def barrier(rank):
	if rank >= 0:
	torch.distributed.barrier()