PantagrueLLM
/

jargon-general-legal

Inference Endpoints

Model card Files Files and versions Community

TCMVince commited on Sep 15, 2023

Commit

20587cc

•

1 Parent(s): 93645f7

Update flaubert2_model.py

Files changed (1) hide show

flaubert2_model.py +4 -0

flaubert2_model.py CHANGED Viewed

@@ -390,6 +390,10 @@ class Flaubert2Model(RobertaModel):
         pooled_output = self.pooler(sequence_output) if self.pooler is not None else None
         if not return_dict:
             return (sequence_output, pooled_output) + encoder_outputs[1:]

         pooled_output = self.pooler(sequence_output) if self.pooler is not None else None
+        # Fairseq Linformer implementation works with transposed hidden states -> we transpose them back for HF implementation.
+        if output_hidden_states:
+            encoder_outputs.hidden_states = [h.transpose(0,1) for h in encoder_outputs.hidden_states]
         if not return_dict:
             return (sequence_output, pooled_output) + encoder_outputs[1:]