Spaces:

Dovakiins
/

qwerrwe

Build error

winglian commited on Jan 25, 2024

Commit

badda37

unverified ·

1 Parent(s): a01b998

make sure to register the base chatml template even if no system message is provided (#1207)

Files changed (4) hide show

.github/workflows/tests.yml CHANGED Viewed

@@ -106,3 +106,7 @@ jobs:
       - name: GPU Unit Tests monkeypatched w docker image
         run: |
           docker run --privileged --gpus "all" --env WANDB_DISABLED=true --rm ${{ steps.metadata.outputs.tags }}-py${{ matrix.python_version }}-cu${{ matrix.cuda }}-${{ matrix.pytorch }} pytest /workspace/axolotl/tests/e2e/patched/

       - name: GPU Unit Tests monkeypatched w docker image
         run: |
           docker run --privileged --gpus "all" --env WANDB_DISABLED=true --rm ${{ steps.metadata.outputs.tags }}-py${{ matrix.python_version }}-cu${{ matrix.cuda }}-${{ matrix.pytorch }} pytest /workspace/axolotl/tests/e2e/patched/
+      - name: Prune image from docker
+        if: github.ref != 'refs/heads/main'
+        run: |
+          docker rmi -f ${{ steps.metadata.outputs.tags }}-py${{ matrix.python_version }}-cu${{ matrix.cuda }}-${{ matrix.pytorch }}

src/axolotl/cli/preprocess.py CHANGED Viewed

@@ -40,6 +40,8 @@ def do_cli(config: Path = Path("examples/"), **kwargs):
             f"ChatML set. Adding default system message: {parsed_cfg.default_system_message}"
         )
         register_chatml_template(parsed_cfg.default_system_message)
     if not parsed_cfg.dataset_prepared_path:
         msg = (

             f"ChatML set. Adding default system message: {parsed_cfg.default_system_message}"
         )
         register_chatml_template(parsed_cfg.default_system_message)
+    else:
+        register_chatml_template()
     if not parsed_cfg.dataset_prepared_path:
         msg = (

src/axolotl/cli/train.py CHANGED Viewed

@@ -43,7 +43,10 @@ def do_train(cfg, cli_args) -> Tuple[PreTrainedModel, PreTrainedTokenizer]:
             f"ChatML set. Adding default system message: {cfg.default_system_message}"
         )
         register_chatml_template(cfg.default_system_message)
         dataset_meta = load_rl_datasets(cfg=cfg, cli_args=cli_args)
     else:
         dataset_meta = load_datasets(cfg=cfg, cli_args=cli_args)

             f"ChatML set. Adding default system message: {cfg.default_system_message}"
         )
         register_chatml_template(cfg.default_system_message)
+    else:
+        register_chatml_template()
+    if cfg.rl:
         dataset_meta = load_rl_datasets(cfg=cfg, cli_args=cli_args)
     else:
         dataset_meta = load_datasets(cfg=cfg, cli_args=cli_args)

src/axolotl/utils/data.py CHANGED Viewed

@@ -16,6 +16,7 @@ from datasets import (
     load_from_disk,
 )
 from huggingface_hub import hf_hub_download
 from torch.utils.data import RandomSampler
 from transformers import PreTrainedTokenizerBase
@@ -213,7 +214,7 @@ def load_tokenized_prepared_datasets(
                     token=use_auth_token,
                 )
                 ds_from_hub = True
-            except (FileNotFoundError, ConnectionError):
                 pass
             ds_from_cloud = False

     load_from_disk,
 )
 from huggingface_hub import hf_hub_download
+from huggingface_hub.utils import HFValidationError
 from torch.utils.data import RandomSampler
 from transformers import PreTrainedTokenizerBase
                     token=use_auth_token,
                 )
                 ds_from_hub = True
+            except (FileNotFoundError, ConnectionError, HFValidationError):
                 pass
             ds_from_cloud = False