nm-testing
/

OLMoE-1B-7B-0924-Instruct-FP8

File size: 144 Bytes

0b1f6cd

DEFAULT_stage:
  DEFAULT_modifiers:
    QuantizationModifier:
      ignore: [lm_head, 're:.*mlp.gate$']
      targets: Linear
      scheme: FP8