Aniemore
/

wavlm-bert-base-s-emotion-russian-resd

Feature Extraction

Model card Files Files and versions Community

Ar4ikov commited on Apr 15, 2023

Commit

7a19cc0

•

1 Parent(s): 2f67ef5

Update audio_text_multimodal.py

Files changed (1) hide show

audio_text_multimodal.py +9 -9

audio_text_multimodal.py CHANGED Viewed

@@ -21,7 +21,7 @@ class MultiModalConfig(PretrainedConfig):
         super().__init__(**kwargs)
-class Wav2Vec2BertConfig(MultiModalConfig):
     ...
@@ -187,27 +187,27 @@ class AudioTextModelForSequenceBaseClassification(BaseClassificationModel):
         )
-class Wav2Vec2BertForSequenceClassification(AudioTextModelForSequenceBaseClassification):
     """
-    Wav2Vec2BertForSequenceClassification is a model for sequence classification task
      (e.g. sentiment analysis, text classification, etc.)
     Args:
-        config (Wav2Vec2BertConfig): config
     Attributes:
-        config (Wav2Vec2BertConfig): config
-        audio_config (Wav2Vec2Config): wav2vec2 config
         text_config (BertConfig): bert config
-        audio_model (Wav2Vec2Model): wav2vec2 model
         text_model (BertModel): bert model
         classifier (torch.nn.Linear): classifier
     """
     def __init__(self, config):
         super().__init__(config)
-        self.audio_config = Wav2Vec2Config.from_dict(self.config.Wav2Vec2Model)
         self.text_config = BertConfig.from_dict(self.config.BertModel)
-        self.audio_model = Wav2Vec2Model(self.audio_config)
         self.text_model = BertModel(self.text_config)
         self.classifier = torch.nn.Linear(
             self.audio_config.hidden_size + self.text_config.hidden_size, self.num_labels

         super().__init__(**kwargs)
+class WavLMBertConfig(MultiModalConfig):
     ...
         )
+class WavLMBertForSequenceClassification(AudioTextModelForSequenceBaseClassification):
     """
+    WavLMBertForSequenceClassification is a model for sequence classification task
      (e.g. sentiment analysis, text classification, etc.)
     Args:
+        config (WavLMBertConfig): config
     Attributes:
+        config (WavLMBertConfig): config
+        audio_config (WavLMConfig): wav2vec2 config
         text_config (BertConfig): bert config
+        audio_model (WavLMModel): wav2vec2 model
         text_model (BertModel): bert model
         classifier (torch.nn.Linear): classifier
     """
     def __init__(self, config):
         super().__init__(config)
+        self.audio_config = WavLMConfig.from_dict(self.config.WavLMModel)
         self.text_config = BertConfig.from_dict(self.config.BertModel)
+        self.audio_model = WavLMModel(self.audio_config)
         self.text_model = BertModel(self.text_config)
         self.classifier = torch.nn.Linear(
             self.audio_config.hidden_size + self.text_config.hidden_size, self.num_labels