Spaces:

flax-community
/

multilingual-image-captioning

Runtime error

weights and model

668c729 over 3 years ago

1.53 kB

	import copy

	from transformers import CLIPVisionConfig, MBartConfig
	from transformers.configuration_utils import PretrainedConfig
	from transformers.utils import logging

	logger = logging.get_logger(__name__)


	class CLIPVisionMBartConfig(PretrainedConfig):

	model_type = "clip-vision-mbart"
	is_composition = True

	def __init__(self, **kwargs):
	super().__init__(**kwargs)

	if "mbart_config" not in kwargs:
	raise ValueError("`mbart_config` can not be `None`.")

	if "clip_vision_config" not in kwargs:
	raise ValueError("`clip_vision_config` can not be `None`.")

	mbart_config = kwargs.pop("mbart_config")
	clip_vision_config = kwargs.pop("clip_vision_config")

	self.mbart_config = MBartConfig(**mbart_config)

	self.clip_vision_config = CLIPVisionConfig(**clip_vision_config)

	self.is_encoder_decoder = True

	@classmethod
	def from_clip_vision_mbart_configs(
	cls,
	clip_vision_config: PretrainedConfig,
	mbart_config: PretrainedConfig,
	**kwargs
	):
	return cls(
	clip_vision_config=clip_vision_config.to_dict(),
	mbart_config=mbart_config.to_dict(),
	**kwargs
	)

	def to_dict(self):
	output = copy.deepcopy(self.__dict__)
	output["clip_vision_config"] = self.clip_vision_config.to_dict()
	output["mbart_config"] = self.mbart_config.to_dict()
	output["model_type"] = self.__class__.model_type
	return output