Spaces:

flax-community
/

dalle-mini

Running

boris commited on Jul 20, 2021

Commit

93c5ac8

•

1 Parent(s): bc78bfd

feat: remove hardcoded values

Former-commit-id: aa6ade578bf4f7e28f9e529eda4efc2a34b86c89

Files changed (1) hide show

dev/seq2seq/run_seq2seq_flax.py CHANGED Viewed

@@ -376,9 +376,6 @@ def main():
     else:
         model_args, data_args, training_args = parser.parse_args_into_dataclasses()
-    logger.warning(f"WARNING: eval_steps has been manually hardcoded")  # TODO: remove it later, convenient for now
-    training_args.eval_steps = 400
     if (
         os.path.exists(training_args.output_dir)
         and os.listdir(training_args.output_dir)
@@ -425,11 +422,10 @@ def main():
     # (the dataset will be downloaded automatically from the datasets Hub).
     #
     data_files = {}
-    logger.warning(f"WARNING: Datasets path have been manually hardcoded")  # TODO: remove it later, convenient for now
     if data_args.train_file is not None:
-        data_files["train"] = ["/data/CC3M/training-encoded.tsv", "/data/CC12M/encoded-train.tsv", "/data/YFCC/metadata_encoded.tsv"]
     if data_args.validation_file is not None:
-        data_files["validation"] = ["/data/CC3M/validation-encoded.tsv"]
     if data_args.test_file is not None:
         data_files["test"] = data_args.test_file
     dataset = load_dataset("csv", data_files=data_files, cache_dir=model_args.cache_dir, delimiter="\t")

     else:
         model_args, data_args, training_args = parser.parse_args_into_dataclasses()
     if (
         os.path.exists(training_args.output_dir)
         and os.listdir(training_args.output_dir)
     # (the dataset will be downloaded automatically from the datasets Hub).
     #
     data_files = {}
     if data_args.train_file is not None:
+        data_files["train"] = data_args.train_file
     if data_args.validation_file is not None:
+        data_files["validation"] = data_args.validation_file
     if data_args.test_file is not None:
         data_files["test"] = data_args.test_file
     dataset = load_dataset("csv", data_files=data_files, cache_dir=model_args.cache_dir, delimiter="\t")