DenseLabelDev / vlm /datasets /evaluation /mme_dataset.py

Upload folder using huggingface_hub

032e687 verified 7 months ago

4.46 kB

	import os
	import os.path as osp

	import pandas as pd
	from mmengine.dist import (master_only)
	from .base_eval_dataset import BaseEvalDataset

	from xtuner.dataset.utils import decode_base64_to_image
	from xtuner.registry import BUILDER
	from mmengine.logging import print_log
	from .utils import YOrN_Extraction, MME_rating, custom_data_process


	class MMEDataset(BaseEvalDataset):

	METAINFO: dict = dict(name='mme')

	def __init__(self, data_file,
	image_processor,
	pad_image_to_square=True,
	metainfo=None,):
	super().__init__(metainfo)
	self.data_file = data_file
	self.df = pd.read_csv(data_file, sep='\t')

	skip_noimg = True
	if skip_noimg:
	self.df = self.df[~pd.isna(self.df['image'])]

	self.image_processor = BUILDER.build(image_processor)
	self.pad_image_to_square = pad_image_to_square
	self.name = os.path.splitext(os.path.basename(data_file))[0]
	self.results_xlsx_path = os.path.splitext(os.path.basename(data_file))[0] + '-results.xlsx'
	self.data = self.load_data_list()

	def load_data_list(self):
	data_list = []
	for idx in range(len(self.df)):
	index = self.df.iloc[idx]['index']
	image = self.df.iloc[idx]['image']
	image_path = self.df.iloc[idx]['image_path']

	question = self.df.iloc[idx]['question']
	# if self.for_llava_prompt:
	# question = question.replace(' Please answer yes or no.',
	# '\nAnswer the question using a single word or phrase.')

	category = self.df.iloc[idx]['category']
	answer = self.df.iloc[idx]['answer'] if 'answer' in self.df.iloc[
	0].keys() else None

	data = {
	'img': image,
	'image_path': image_path,
	'question': question,
	'answer': answer,
	'category': category,
	'index': index,
	'img_id': idx
	}
	data_list.append(data)
	return data_list

	def get_image(self, image):
	while len(image) < 16:
	image = self.df[self.df['index'] == int(image)]['image'].values
	assert len(image) == 1
	image = image[0]
	image = decode_base64_to_image(image)
	return image

	def __len__(self):
	return len(self.df)

	def __getitem__(self, idx):
	data = self.data[idx]
	data_dict = custom_data_process(self, data)
	return data_dict

	@master_only
	def evaluate(self, results, work_dir):
	orig_index = [x['img_id'] for x in self.data]
	new_results = []
	for pred_dict in results:
	index = pred_dict['img_id']
	new_index = orig_index.index(index)
	filtered_rows = self.data[new_index]

	cur_result = {}
	cur_result['question'] = filtered_rows.get('question')
	cur_result['prediction'] = pred_dict['prediction']
	cur_result['category'] = filtered_rows['category']
	cur_result['index'] = filtered_rows.get('index')
	cur_result['answer'] = filtered_rows.get('answer')
	cur_result['image_path'] = filtered_rows.get('image_path')
	new_results.append(cur_result)

	results_df = pd.DataFrame(new_results)
	with pd.ExcelWriter(osp.join(work_dir, self.results_xlsx_path), engine='openpyxl') as writer:
	results_df.to_excel(writer, index=False)

	data = results_df.sort_values(by='index')
	data['prediction'] = [str(x) for x in data['prediction']]

	ans_map = {k: YOrN_Extraction(v) for k, v in zip(data['index'], data['prediction'])}
	# 不使用 gpt
	data['extracted'] = [ans_map[x] for x in data['index']]
	data['score'] = (data['answer'] == data['extracted'])

	results_df = pd.DataFrame(data)
	with pd.ExcelWriter(osp.join(work_dir, self.results_xlsx_path), engine='openpyxl') as writer:
	results_df.to_excel(writer, index=False)

	score = MME_rating(data)
	print_log('============================================', 'current')
	print_log(score, 'current')
	print_log('============================================', 'current')
	print_log(f'MME YOrN_eval successfully finished evaluating', 'current')
	return score