Training in progress epoch 0

Browse files

Files changed (9) hide show

.gitattributes +1 -0
README.md +52 -0
config.json +27 -0
logs/train/events.out.tfevents.1652646155.a15ce21820bb.70.0.v2 +3 -0
logs/validation/events.out.tfevents.1652647171.a15ce21820bb.70.1.v2 +3 -0
special_tokens_map.json +1 -0
tf_model.h5 +3 -0
tokenizer.json +3 -0
tokenizer_config.json +1 -0

.gitattributes CHANGED Viewed

@@ -25,3 +25,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer.json filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,52 @@

+---
+tags:
+- generated_from_keras_callback
+model-index:
+- name: mateotyz/tf-xml-r-base-ape-swm
+  results: []
+---
+<!-- This model card has been generated automatically according to the information Keras had access to. You should
+probably proofread and complete it, then remove this comment. -->
+# mateotyz/tf-xml-r-base-ape-swm
+This model is a fine-tuned version of [jplu/tf-xlm-roberta-base](https://huggingface.co/jplu/tf-xlm-roberta-base) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Train Loss: 1.3563
+- Validation Loss: 1.0668
+- Epoch: 0
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- optimizer: {'name': 'AdamWeightDecay', 'learning_rate': {'class_name': 'WarmUp', 'config': {'initial_learning_rate': 2e-05, 'decay_schedule_fn': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 2e-05, 'decay_steps': -125, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}, '__passive_serialization__': True}, 'warmup_steps': 1000, 'power': 1.0, 'name': None}}, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False, 'weight_decay_rate': 0.01}
+- training_precision: float32
+### Training results
+| Train Loss | Validation Loss | Epoch |
+|:----------:|:---------------:|:-----:|
+| 1.3563     | 1.0668          | 0     |
+### Framework versions
+- Transformers 4.19.1
+- TensorFlow 2.8.0
+- Datasets 2.2.1
+- Tokenizers 0.12.1

config.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+  "_name_or_path": "jplu/tf-xlm-roberta-base",
+  "architectures": [
+    "XLMRobertaForMaskedLM"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "xlm-roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "output_past": true,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "transformers_version": "4.19.1",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 250002
+}

logs/train/events.out.tfevents.1652646155.a15ce21820bb.70.0.v2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:815bb1d9542c48866ceef7972bd8db05fdaebdc1ee1b9519791e84dbec0c33ab
+size 2894191

logs/validation/events.out.tfevents.1652647171.a15ce21820bb.70.1.v2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c0c9ffe3952fd6f4aa357779dbf31478c37496716d56a7b0258a50cabde9fa5
+size 194

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "<unk>", "sep_token": "</s>", "pad_token": "<pad>", "cls_token": "<s>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": false}}

tf_model.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5a7de0e8925bdbb47df5ecc81c16c4b52926d6b8b98d50e635ac40e752f0318
+size 1883070704

tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4c08c80d1df11b82ada2fd707562f86a9ebd5b7de04f51ebd2b49f2cd5906d00
+size 17082925

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"bos_token": "<s>", "eos_token": "</s>", "sep_token": "</s>", "cls_token": "<s>", "unk_token": "<unk>", "pad_token": "<pad>", "mask_token": {"content": "<mask>", "single_word": false, "lstrip": true, "rstrip": false, "normalized": true, "__type": "AddedToken"}, "model_max_length": 512, "special_tokens_map_file": null, "name_or_path": "xlm-roberta-base", "tokenizer_class": "XLMRobertaTokenizer"}