TheBloke/Yi-34B-200K-GPTQ · safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge

I encounter this error when loading Yi-34B-200K-GPTQ model. How can I deal with it ?

(yi) [root@node4 yi]# python demo/text_generation.py  --model /data/models/Yi-34B-200K-GPTQ
Namespace(model='/data/models/Yi-34B-200K-GPTQ', tokenizer='', max_tokens=512, streaming=False, prompt='Let me tell you an interesting story about cat Tom and mouse Jerry,', eos_token='<|endoftext|>')
Traceback (most recent call last):
  File "/data/app/yi/demo/text_generation.py", line 78, in <module>
    main(args)
  File "/data/app/yi/demo/text_generation.py", line 49, in main
    model = AutoModelForCausalLM.from_pretrained(
            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/data/anaconda3/envs/yi/lib/python3.11/site-packages/transformers/models/auto/auto_factory.py", line 560, in from_pretrained
    return model_class.from_pretrained(
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/data/anaconda3/envs/yi/lib/python3.11/site-packages/transformers/modeling_utils.py", line 3019, in from_pretrained
    state_dict = load_state_dict(resolved_archive_file)
                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "/data/anaconda3/envs/yi/lib/python3.11/site-packages/transformers/modeling_utils.py", line 463, in load_state_dict
    with safe_open(checkpoint_file, framework="pt") as f:
         ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge