DenseLabelDev / projects /mllm_labeling /configs /qwen_72b_vertify_whole_1.py

Upload folder using huggingface_hub

032e687 verified 8 months ago

2.48 kB

	# Copyright (c) OpenMMLab. All rights reserved.
	from mmengine.dataset import DefaultSampler
	from mmengine.hooks import (CheckpointHook, DistSamplerSeedHook, IterTimerHook,
	LoggerHook, ParamSchedulerHook)

	from vlm.engine.runner.loops import AnnoLoop
	from xtuner.dataset import ConcatDataset

	from projects.mllm_labeling.models import LLM_Annotor
	from projects.mllm_labeling.datasets.text_dataset_vertify import SAM2TextDataset_Vertify, SAM2TextDataset_Vertify_whole

	#######################################################################
	# PART 1 Settings #
	#######################################################################

	llm_name_or_path = './pretrained/internvl/Qwen2-72B-Instruct-AWQ/' # Please change to your own path
	save_folder = './whole_pesudo_cap/folder1_filter/'

	# Data paths
	json_folders = ['./whole_pesudo_cap/folder1/', ]

	model = dict(
	type=LLM_Annotor,
	model=llm_name_or_path,
	save_folder=save_folder,
	)

	test_dataset = [dict(
	type=SAM2TextDataset_Vertify_whole,
	json_folders=json_folders,
	bs=16,
	)]

	test_dataloader = dict(
	batch_size=1,
	num_workers=1,
	drop_last=False,
	sampler=dict(type=DefaultSampler, shuffle=False),
	dataset=dict(type=ConcatDataset, datasets=test_dataset),
	)

	test_evaluator = dict()
	test_cfg = dict(type=AnnoLoop, select_metric='first')

	custom_hooks = []

	# configure default hooks
	default_hooks = dict(
	# record the time of every iteration.
	timer=dict(type=IterTimerHook),
	# print log every 10 iterations.
	logger=dict(type=LoggerHook, log_metric_by_epoch=False, interval=10),
	# enable the parameter scheduler.
	param_scheduler=dict(type=ParamSchedulerHook),
	# save checkpoint per `save_steps`.
	sampler_seed=dict(type=DistSamplerSeedHook),
	)

	# configure environment
	env_cfg = dict(
	# whether to enable cudnn benchmark
	cudnn_benchmark=False,
	# set multi process parameters
	mp_cfg=dict(mp_start_method='fork', opencv_num_threads=0),
	# set distributed parameters
	dist_cfg=dict(backend='nccl'),
	)

	# set visualizer
	visualizer = None

	# set log level
	log_level = 'INFO'

	# load from which checkpoint
	load_from = None

	# whether to resume training from the loaded checkpoint
	resume = False

	# Defaults to use random seed and disable `deterministic`
	randomness = dict(seed=None, deterministic=False)

	# set log processor
	log_processor = dict(by_epoch=False)