AlexHung29629
/

test_mllama_11B_v2.bak

Feature Extraction

Model card Files Files and versions Community

AlexHung29629 commited on Oct 30, 2024

Commit

7454ffa

·

verified ·

1 Parent(s): 8bc220a

Update mllama_audio_model.py

Files changed (1) hide show

mllama_audio_model.py +1 -1

mllama_audio_model.py CHANGED Viewed

@@ -14,7 +14,7 @@ class Llama3Embedding(Wav2Vec2BertPreTrainedModel):
         assert config.output_hidden_size == text_config.hidden_size
         self.text_embeddings = nn.Embedding(text_config.vocab_size, text_config.hidden_size, text_config.pad_token_id)
         self.audio_embedding = Wav2Vec2BertModel(config)
-        assert self.text_embeddings.weight.shape[-1] == text_config.hidden_size, f"{self.text_embeddings.weight.shape=}, {text_config.hidden_size=}"
         self.start_of_audio = nn.Parameter(data=torch.zeros((1, config.output_hidden_size)), requires_grad=True)
         self.end_of_audio = nn.Parameter(data=torch.zeros((1, config.output_hidden_size)), requires_grad=True)
         self.text_config = text_config

         assert config.output_hidden_size == text_config.hidden_size
         self.text_embeddings = nn.Embedding(text_config.vocab_size, text_config.hidden_size, text_config.pad_token_id)
         self.audio_embedding = Wav2Vec2BertModel(config)
+        assert self.text_embeddings.data.weight.size(-1) == text_config.hidden_size, f"{self.text_embeddings.weight}, {text_config.hidden_size=}, {text_config.vocab_size=}"
         self.start_of_audio = nn.Parameter(data=torch.zeros((1, config.output_hidden_size)), requires_grad=True)
         self.end_of_audio = nn.Parameter(data=torch.zeros((1, config.output_hidden_size)), requires_grad=True)
         self.text_config = text_config