PuxAI commited on 2 days ago

Commit

03caa22

verified ·

1 Parent(s): 3f6ade4

Upload folder using huggingface_hub

Browse files

Files changed (32) hide show

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/config.json +120 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/model.safetensors +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/optimizer.pt +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/rng_state.pth +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/scheduler.pt +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/tokenizer.json +0 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/tokenizer_config.json +15 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/trainer_state.json +224 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/training_args.bin +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/config.json +120 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/model.safetensors +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/optimizer.pt +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/rng_state.pth +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/scheduler.pt +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/tokenizer.json +0 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/tokenizer_config.json +15 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/trainer_state.json +414 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/training_args.bin +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/config.json +120 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/model.safetensors +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/optimizer.pt +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/rng_state.pth +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/scheduler.pt +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/tokenizer.json +0 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/tokenizer_config.json +15 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/trainer_state.json +604 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/training_args.bin +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/config.json +120 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/model.safetensors +3 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/tokenizer.json +0 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/tokenizer_config.json +15 -0
open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/training_args.bin +3 -0

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/config.json ADDED Viewed

	@@ -0,0 +1,120 @@

+{
+  "add_cross_attention": false,
+  "architectures": [
+    "BertForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": null,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "dtype": "float32",
+  "eos_token_id": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-AGE",
+    "2": "I-AGE",
+    "3": "B-BUILDINGNUM",
+    "4": "I-BUILDINGNUM",
+    "5": "B-CITY",
+    "6": "I-CITY",
+    "7": "B-CREDITCARDNUMBER",
+    "8": "I-CREDITCARDNUMBER",
+    "9": "B-DATE",
+    "10": "I-DATE",
+    "11": "B-DRIVERLICENSENUM",
+    "12": "I-DRIVERLICENSENUM",
+    "13": "B-EMAIL",
+    "14": "I-EMAIL",
+    "15": "B-GENDER",
+    "16": "I-GENDER",
+    "17": "B-GIVENNAME",
+    "18": "I-GIVENNAME",
+    "19": "B-IDCARDNUM",
+    "20": "I-IDCARDNUM",
+    "21": "B-PASSPORTNUM",
+    "22": "I-PASSPORTNUM",
+    "23": "B-SEX",
+    "24": "I-SEX",
+    "25": "B-SOCIALNUM",
+    "26": "I-SOCIALNUM",
+    "27": "B-STREET",
+    "28": "I-STREET",
+    "29": "B-SURNAME",
+    "30": "I-SURNAME",
+    "31": "B-TAXNUM",
+    "32": "I-TAXNUM",
+    "33": "B-TELEPHONENUM",
+    "34": "I-TELEPHONENUM",
+    "35": "B-TIME",
+    "36": "I-TIME",
+    "37": "B-TITLE",
+    "38": "I-TITLE",
+    "39": "B-ZIPCODE",
+    "40": "I-ZIPCODE"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "is_decoder": false,
+  "label2id": {
+    "B-AGE": 1,
+    "B-BUILDINGNUM": 3,
+    "B-CITY": 5,
+    "B-CREDITCARDNUMBER": 7,
+    "B-DATE": 9,
+    "B-DRIVERLICENSENUM": 11,
+    "B-EMAIL": 13,
+    "B-GENDER": 15,
+    "B-GIVENNAME": 17,
+    "B-IDCARDNUM": 19,
+    "B-PASSPORTNUM": 21,
+    "B-SEX": 23,
+    "B-SOCIALNUM": 25,
+    "B-STREET": 27,
+    "B-SURNAME": 29,
+    "B-TAXNUM": 31,
+    "B-TELEPHONENUM": 33,
+    "B-TIME": 35,
+    "B-TITLE": 37,
+    "B-ZIPCODE": 39,
+    "I-AGE": 2,
+    "I-BUILDINGNUM": 4,
+    "I-CITY": 6,
+    "I-CREDITCARDNUMBER": 8,
+    "I-DATE": 10,
+    "I-DRIVERLICENSENUM": 12,
+    "I-EMAIL": 14,
+    "I-GENDER": 16,
+    "I-GIVENNAME": 18,
+    "I-IDCARDNUM": 20,
+    "I-PASSPORTNUM": 22,
+    "I-SEX": 24,
+    "I-SOCIALNUM": 26,
+    "I-STREET": 28,
+    "I-SURNAME": 30,
+    "I-TAXNUM": 32,
+    "I-TELEPHONENUM": 34,
+    "I-TIME": 36,
+    "I-TITLE": 38,
+    "I-ZIPCODE": 40,
+    "O": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "tie_word_embeddings": true,
+  "transformers_version": "5.3.0",
+  "type_vocab_size": 2,
+  "use_cache": false,
+  "vocab_size": 119547
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:070dc7f8f87faf4afed4d08ee1dac60e632dcb3831fecffc5d389ebcead5823f
+size 709200844

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:26a6efc48892807b3b834c0d567d41a90a4be6768e2d200ab1e3422ae12b5b98
+size 1418524683

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5aed068987c0c8fe848117e0c4142a1966dd60e23bc706308e1223c1ca4530dd
+size 14645

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1ef1d1b63c0b9a5ac0f9595b04fad948d0f08c7084fd61fbaa7bac526f8c0e8e
+size 1465

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": true,
+  "backend": "tokenizers",
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "is_local": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/trainer_state.json ADDED Viewed

	@@ -0,0 +1,224 @@

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 13055,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.038299502106472615,
+      "grad_norm": 0.8714600801467896,
+      "learning_rate": 1.9745180645984938e-05,
+      "loss": 0.1691785430908203,
+      "step": 500
+    },
+    {
+      "epoch": 0.07659900421294523,
+      "grad_norm": 0.588369607925415,
+      "learning_rate": 1.9489850631941786e-05,
+      "loss": 0.04638611221313477,
+      "step": 1000
+    },
+    {
+      "epoch": 0.11489850631941785,
+      "grad_norm": 1.5041358470916748,
+      "learning_rate": 1.9234520617898634e-05,
+      "loss": 0.03861086273193359,
+      "step": 1500
+    },
+    {
+      "epoch": 0.15319800842589046,
+      "grad_norm": 0.4620295763015747,
+      "learning_rate": 1.8979190603855486e-05,
+      "loss": 0.03408417129516601,
+      "step": 2000
+    },
+    {
+      "epoch": 0.19149751053236308,
+      "grad_norm": 1.0186210870742798,
+      "learning_rate": 1.8723860589812334e-05,
+      "loss": 0.030472009658813477,
+      "step": 2500
+    },
+    {
+      "epoch": 0.2297970126388357,
+      "grad_norm": 0.19274073839187622,
+      "learning_rate": 1.8468530575769182e-05,
+      "loss": 0.02794113540649414,
+      "step": 3000
+    },
+    {
+      "epoch": 0.2680965147453083,
+      "grad_norm": 0.3304294943809509,
+      "learning_rate": 1.8213200561726034e-05,
+      "loss": 0.026913631439208986,
+      "step": 3500
+    },
+    {
+      "epoch": 0.3063960168517809,
+      "grad_norm": 0.32137593626976013,
+      "learning_rate": 1.7957870547682882e-05,
+      "loss": 0.025851396560668944,
+      "step": 4000
+    },
+    {
+      "epoch": 0.34469551895825357,
+      "grad_norm": 0.5200027823448181,
+      "learning_rate": 1.770254053363973e-05,
+      "loss": 0.02558848571777344,
+      "step": 4500
+    },
+    {
+      "epoch": 0.38299502106472616,
+      "grad_norm": 0.6408317685127258,
+      "learning_rate": 1.744721051959658e-05,
+      "loss": 0.023505245208740234,
+      "step": 5000
+    },
+    {
+      "epoch": 0.42129452317119875,
+      "grad_norm": 0.46780553460121155,
+      "learning_rate": 1.719188050555343e-05,
+      "loss": 0.023054824829101563,
+      "step": 5500
+    },
+    {
+      "epoch": 0.4595940252776714,
+      "grad_norm": 0.6626068353652954,
+      "learning_rate": 1.6936550491510278e-05,
+      "loss": 0.02208795166015625,
+      "step": 6000
+    },
+    {
+      "epoch": 0.497893527384144,
+      "grad_norm": 0.25836509466171265,
+      "learning_rate": 1.668122047746713e-05,
+      "loss": 0.022046304702758788,
+      "step": 6500
+    },
+    {
+      "epoch": 0.5361930294906166,
+      "grad_norm": 0.8243473172187805,
+      "learning_rate": 1.6425890463423978e-05,
+      "loss": 0.021231672286987305,
+      "step": 7000
+    },
+    {
+      "epoch": 0.5744925315970892,
+      "grad_norm": 0.26098620891571045,
+      "learning_rate": 1.6170560449380826e-05,
+      "loss": 0.020609188079833984,
+      "step": 7500
+    },
+    {
+      "epoch": 0.6127920337035618,
+      "grad_norm": 0.1398458480834961,
+      "learning_rate": 1.5915230435337677e-05,
+      "loss": 0.020333499908447267,
+      "step": 8000
+    },
+    {
+      "epoch": 0.6510915358100344,
+      "grad_norm": 0.44954946637153625,
+      "learning_rate": 1.5659900421294526e-05,
+      "loss": 0.01971204948425293,
+      "step": 8500
+    },
+    {
+      "epoch": 0.6893910379165071,
+      "grad_norm": 0.2548958957195282,
+      "learning_rate": 1.5404570407251374e-05,
+      "loss": 0.01934459114074707,
+      "step": 9000
+    },
+    {
+      "epoch": 0.7276905400229797,
+      "grad_norm": 0.31454744935035706,
+      "learning_rate": 1.5149240393208222e-05,
+      "loss": 0.018815528869628905,
+      "step": 9500
+    },
+    {
+      "epoch": 0.7659900421294523,
+      "grad_norm": 0.15480241179466248,
+      "learning_rate": 1.4893910379165073e-05,
+      "loss": 0.018857412338256836,
+      "step": 10000
+    },
+    {
+      "epoch": 0.8042895442359249,
+      "grad_norm": 0.23583486676216125,
+      "learning_rate": 1.4638580365121922e-05,
+      "loss": 0.018428108215332032,
+      "step": 10500
+    },
+    {
+      "epoch": 0.8425890463423975,
+      "grad_norm": 0.289045125246048,
+      "learning_rate": 1.438325035107877e-05,
+      "loss": 0.01816094207763672,
+      "step": 11000
+    },
+    {
+      "epoch": 0.8808885484488702,
+      "grad_norm": 0.13967347145080566,
+      "learning_rate": 1.4127920337035618e-05,
+      "loss": 0.01740534973144531,
+      "step": 11500
+    },
+    {
+      "epoch": 0.9191880505553428,
+      "grad_norm": 0.39465662837028503,
+      "learning_rate": 1.387259032299247e-05,
+      "loss": 0.017327314376831056,
+      "step": 12000
+    },
+    {
+      "epoch": 0.9574875526618154,
+      "grad_norm": 0.5613229274749756,
+      "learning_rate": 1.3617260308949318e-05,
+      "loss": 0.01724307060241699,
+      "step": 12500
+    },
+    {
+      "epoch": 0.995787054768288,
+      "grad_norm": 0.550220787525177,
+      "learning_rate": 1.3361930294906168e-05,
+      "loss": 0.017301082611083984,
+      "step": 13000
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.019178859889507294,
+      "eval_runtime": 195.4351,
+      "eval_samples_per_second": 474.991,
+      "eval_steps_per_second": 59.375,
+      "step": 13055
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 39165,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 2.1838257516635136e+17,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": null
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-13055/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb80cf54f2fe927cc63c861aa4b3e87525629b3d1868eeda1dedae9009697f1c
+size 5265

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/config.json ADDED Viewed

	@@ -0,0 +1,120 @@

+{
+  "add_cross_attention": false,
+  "architectures": [
+    "BertForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": null,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "dtype": "float32",
+  "eos_token_id": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-AGE",
+    "2": "I-AGE",
+    "3": "B-BUILDINGNUM",
+    "4": "I-BUILDINGNUM",
+    "5": "B-CITY",
+    "6": "I-CITY",
+    "7": "B-CREDITCARDNUMBER",
+    "8": "I-CREDITCARDNUMBER",
+    "9": "B-DATE",
+    "10": "I-DATE",
+    "11": "B-DRIVERLICENSENUM",
+    "12": "I-DRIVERLICENSENUM",
+    "13": "B-EMAIL",
+    "14": "I-EMAIL",
+    "15": "B-GENDER",
+    "16": "I-GENDER",
+    "17": "B-GIVENNAME",
+    "18": "I-GIVENNAME",
+    "19": "B-IDCARDNUM",
+    "20": "I-IDCARDNUM",
+    "21": "B-PASSPORTNUM",
+    "22": "I-PASSPORTNUM",
+    "23": "B-SEX",
+    "24": "I-SEX",
+    "25": "B-SOCIALNUM",
+    "26": "I-SOCIALNUM",
+    "27": "B-STREET",
+    "28": "I-STREET",
+    "29": "B-SURNAME",
+    "30": "I-SURNAME",
+    "31": "B-TAXNUM",
+    "32": "I-TAXNUM",
+    "33": "B-TELEPHONENUM",
+    "34": "I-TELEPHONENUM",
+    "35": "B-TIME",
+    "36": "I-TIME",
+    "37": "B-TITLE",
+    "38": "I-TITLE",
+    "39": "B-ZIPCODE",
+    "40": "I-ZIPCODE"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "is_decoder": false,
+  "label2id": {
+    "B-AGE": 1,
+    "B-BUILDINGNUM": 3,
+    "B-CITY": 5,
+    "B-CREDITCARDNUMBER": 7,
+    "B-DATE": 9,
+    "B-DRIVERLICENSENUM": 11,
+    "B-EMAIL": 13,
+    "B-GENDER": 15,
+    "B-GIVENNAME": 17,
+    "B-IDCARDNUM": 19,
+    "B-PASSPORTNUM": 21,
+    "B-SEX": 23,
+    "B-SOCIALNUM": 25,
+    "B-STREET": 27,
+    "B-SURNAME": 29,
+    "B-TAXNUM": 31,
+    "B-TELEPHONENUM": 33,
+    "B-TIME": 35,
+    "B-TITLE": 37,
+    "B-ZIPCODE": 39,
+    "I-AGE": 2,
+    "I-BUILDINGNUM": 4,
+    "I-CITY": 6,
+    "I-CREDITCARDNUMBER": 8,
+    "I-DATE": 10,
+    "I-DRIVERLICENSENUM": 12,
+    "I-EMAIL": 14,
+    "I-GENDER": 16,
+    "I-GIVENNAME": 18,
+    "I-IDCARDNUM": 20,
+    "I-PASSPORTNUM": 22,
+    "I-SEX": 24,
+    "I-SOCIALNUM": 26,
+    "I-STREET": 28,
+    "I-SURNAME": 30,
+    "I-TAXNUM": 32,
+    "I-TELEPHONENUM": 34,
+    "I-TIME": 36,
+    "I-TITLE": 38,
+    "I-ZIPCODE": 40,
+    "O": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "tie_word_embeddings": true,
+  "transformers_version": "5.3.0",
+  "type_vocab_size": 2,
+  "use_cache": false,
+  "vocab_size": 119547
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f75a17ac18d5f79d4c2334d5e003a3751d9b5f1b608b582e8838d82f8d0e229e
+size 709200844

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:df52a7c057cfeb6c895c1655f300eaeac2acae331d517677c613a4c69c783bc0
+size 1418524683

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3a277e53c55289ada91f19b5b0a978dd0e165d40f7ab8277912ecae9f7c5c15b
+size 14645

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:306e1c91f4c04a1a930e746d49bfde9e05f196c12b1678870acc754dc4220834
+size 1465

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": true,
+  "backend": "tokenizers",
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "is_local": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/trainer_state.json ADDED Viewed

	@@ -0,0 +1,414 @@

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 2.0,
+  "eval_steps": 500,
+  "global_step": 26110,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.038299502106472615,
+      "grad_norm": 0.8714600801467896,
+      "learning_rate": 1.9745180645984938e-05,
+      "loss": 0.1691785430908203,
+      "step": 500
+    },
+    {
+      "epoch": 0.07659900421294523,
+      "grad_norm": 0.588369607925415,
+      "learning_rate": 1.9489850631941786e-05,
+      "loss": 0.04638611221313477,
+      "step": 1000
+    },
+    {
+      "epoch": 0.11489850631941785,
+      "grad_norm": 1.5041358470916748,
+      "learning_rate": 1.9234520617898634e-05,
+      "loss": 0.03861086273193359,
+      "step": 1500
+    },
+    {
+      "epoch": 0.15319800842589046,
+      "grad_norm": 0.4620295763015747,
+      "learning_rate": 1.8979190603855486e-05,
+      "loss": 0.03408417129516601,
+      "step": 2000
+    },
+    {
+      "epoch": 0.19149751053236308,
+      "grad_norm": 1.0186210870742798,
+      "learning_rate": 1.8723860589812334e-05,
+      "loss": 0.030472009658813477,
+      "step": 2500
+    },
+    {
+      "epoch": 0.2297970126388357,
+      "grad_norm": 0.19274073839187622,
+      "learning_rate": 1.8468530575769182e-05,
+      "loss": 0.02794113540649414,
+      "step": 3000
+    },
+    {
+      "epoch": 0.2680965147453083,
+      "grad_norm": 0.3304294943809509,
+      "learning_rate": 1.8213200561726034e-05,
+      "loss": 0.026913631439208986,
+      "step": 3500
+    },
+    {
+      "epoch": 0.3063960168517809,
+      "grad_norm": 0.32137593626976013,
+      "learning_rate": 1.7957870547682882e-05,
+      "loss": 0.025851396560668944,
+      "step": 4000
+    },
+    {
+      "epoch": 0.34469551895825357,
+      "grad_norm": 0.5200027823448181,
+      "learning_rate": 1.770254053363973e-05,
+      "loss": 0.02558848571777344,
+      "step": 4500
+    },
+    {
+      "epoch": 0.38299502106472616,
+      "grad_norm": 0.6408317685127258,
+      "learning_rate": 1.744721051959658e-05,
+      "loss": 0.023505245208740234,
+      "step": 5000
+    },
+    {
+      "epoch": 0.42129452317119875,
+      "grad_norm": 0.46780553460121155,
+      "learning_rate": 1.719188050555343e-05,
+      "loss": 0.023054824829101563,
+      "step": 5500
+    },
+    {
+      "epoch": 0.4595940252776714,
+      "grad_norm": 0.6626068353652954,
+      "learning_rate": 1.6936550491510278e-05,
+      "loss": 0.02208795166015625,
+      "step": 6000
+    },
+    {
+      "epoch": 0.497893527384144,
+      "grad_norm": 0.25836509466171265,
+      "learning_rate": 1.668122047746713e-05,
+      "loss": 0.022046304702758788,
+      "step": 6500
+    },
+    {
+      "epoch": 0.5361930294906166,
+      "grad_norm": 0.8243473172187805,
+      "learning_rate": 1.6425890463423978e-05,
+      "loss": 0.021231672286987305,
+      "step": 7000
+    },
+    {
+      "epoch": 0.5744925315970892,
+      "grad_norm": 0.26098620891571045,
+      "learning_rate": 1.6170560449380826e-05,
+      "loss": 0.020609188079833984,
+      "step": 7500
+    },
+    {
+      "epoch": 0.6127920337035618,
+      "grad_norm": 0.1398458480834961,
+      "learning_rate": 1.5915230435337677e-05,
+      "loss": 0.020333499908447267,
+      "step": 8000
+    },
+    {
+      "epoch": 0.6510915358100344,
+      "grad_norm": 0.44954946637153625,
+      "learning_rate": 1.5659900421294526e-05,
+      "loss": 0.01971204948425293,
+      "step": 8500
+    },
+    {
+      "epoch": 0.6893910379165071,
+      "grad_norm": 0.2548958957195282,
+      "learning_rate": 1.5404570407251374e-05,
+      "loss": 0.01934459114074707,
+      "step": 9000
+    },
+    {
+      "epoch": 0.7276905400229797,
+      "grad_norm": 0.31454744935035706,
+      "learning_rate": 1.5149240393208222e-05,
+      "loss": 0.018815528869628905,
+      "step": 9500
+    },
+    {
+      "epoch": 0.7659900421294523,
+      "grad_norm": 0.15480241179466248,
+      "learning_rate": 1.4893910379165073e-05,
+      "loss": 0.018857412338256836,
+      "step": 10000
+    },
+    {
+      "epoch": 0.8042895442359249,
+      "grad_norm": 0.23583486676216125,
+      "learning_rate": 1.4638580365121922e-05,
+      "loss": 0.018428108215332032,
+      "step": 10500
+    },
+    {
+      "epoch": 0.8425890463423975,
+      "grad_norm": 0.289045125246048,
+      "learning_rate": 1.438325035107877e-05,
+      "loss": 0.01816094207763672,
+      "step": 11000
+    },
+    {
+      "epoch": 0.8808885484488702,
+      "grad_norm": 0.13967347145080566,
+      "learning_rate": 1.4127920337035618e-05,
+      "loss": 0.01740534973144531,
+      "step": 11500
+    },
+    {
+      "epoch": 0.9191880505553428,
+      "grad_norm": 0.39465662837028503,
+      "learning_rate": 1.387259032299247e-05,
+      "loss": 0.017327314376831056,
+      "step": 12000
+    },
+    {
+      "epoch": 0.9574875526618154,
+      "grad_norm": 0.5613229274749756,
+      "learning_rate": 1.3617260308949318e-05,
+      "loss": 0.01724307060241699,
+      "step": 12500
+    },
+    {
+      "epoch": 0.995787054768288,
+      "grad_norm": 0.550220787525177,
+      "learning_rate": 1.3361930294906168e-05,
+      "loss": 0.017301082611083984,
+      "step": 13000
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.019178859889507294,
+      "eval_runtime": 195.4351,
+      "eval_samples_per_second": 474.991,
+      "eval_steps_per_second": 59.375,
+      "step": 13055
+    },
+    {
+      "epoch": 1.0340865568747606,
+      "grad_norm": 0.5676391124725342,
+      "learning_rate": 1.3106600280863016e-05,
+      "loss": 0.014577848434448242,
+      "step": 13500
+    },
+    {
+      "epoch": 1.0723860589812333,
+      "grad_norm": 0.2776853144168854,
+      "learning_rate": 1.2851270266819866e-05,
+      "loss": 0.014119720458984375,
+      "step": 14000
+    },
+    {
+      "epoch": 1.1106855610877058,
+      "grad_norm": 0.38407689332962036,
+      "learning_rate": 1.2595940252776716e-05,
+      "loss": 0.014150198936462402,
+      "step": 14500
+    },
+    {
+      "epoch": 1.1489850631941785,
+      "grad_norm": 0.24024367332458496,
+      "learning_rate": 1.2340610238733564e-05,
+      "loss": 0.014232131958007812,
+      "step": 15000
+    },
+    {
+      "epoch": 1.1872845653006512,
+      "grad_norm": 0.2031095325946808,
+      "learning_rate": 1.2085280224690414e-05,
+      "loss": 0.013924983024597168,
+      "step": 15500
+    },
+    {
+      "epoch": 1.2255840674071237,
+      "grad_norm": 0.4606612026691437,
+      "learning_rate": 1.1829950210647263e-05,
+      "loss": 0.013915029525756836,
+      "step": 16000
+    },
+    {
+      "epoch": 1.2638835695135964,
+      "grad_norm": 0.3309486508369446,
+      "learning_rate": 1.1574620196604112e-05,
+      "loss": 0.01338797664642334,
+      "step": 16500
+    },
+    {
+      "epoch": 1.3021830716200689,
+      "grad_norm": 0.34972071647644043,
+      "learning_rate": 1.131929018256096e-05,
+      "loss": 0.013172533988952637,
+      "step": 17000
+    },
+    {
+      "epoch": 1.3404825737265416,
+      "grad_norm": 0.40405741333961487,
+      "learning_rate": 1.1063960168517811e-05,
+      "loss": 0.013684582710266114,
+      "step": 17500
+    },
+    {
+      "epoch": 1.3787820758330143,
+      "grad_norm": 0.4469183385372162,
+      "learning_rate": 1.080863015447466e-05,
+      "loss": 0.013521049499511719,
+      "step": 18000
+    },
+    {
+      "epoch": 1.4170815779394867,
+      "grad_norm": 0.44263386726379395,
+      "learning_rate": 1.0553300140431508e-05,
+      "loss": 0.013442005157470703,
+      "step": 18500
+    },
+    {
+      "epoch": 1.4553810800459595,
+      "grad_norm": 0.39971089363098145,
+      "learning_rate": 1.0297970126388358e-05,
+      "loss": 0.013027252197265625,
+      "step": 19000
+    },
+    {
+      "epoch": 1.493680582152432,
+      "grad_norm": 0.4588576555252075,
+      "learning_rate": 1.0042640112345207e-05,
+      "loss": 0.012910510063171387,
+      "step": 19500
+    },
+    {
+      "epoch": 1.5319800842589046,
+      "grad_norm": 0.24441905319690704,
+      "learning_rate": 9.787310098302056e-06,
+      "loss": 0.012541162490844726,
+      "step": 20000
+    },
+    {
+      "epoch": 1.5702795863653773,
+      "grad_norm": 0.12215672433376312,
+      "learning_rate": 9.531980084258905e-06,
+      "loss": 0.012792759895324708,
+      "step": 20500
+    },
+    {
+      "epoch": 1.6085790884718498,
+      "grad_norm": 0.3312968909740448,
+      "learning_rate": 9.276650070215755e-06,
+      "loss": 0.012631108283996582,
+      "step": 21000
+    },
+    {
+      "epoch": 1.6468785905783225,
+      "grad_norm": 0.3255740702152252,
+      "learning_rate": 9.021320056172604e-06,
+      "loss": 0.01261143684387207,
+      "step": 21500
+    },
+    {
+      "epoch": 1.685178092684795,
+      "grad_norm": 0.2416062355041504,
+      "learning_rate": 8.765990042129453e-06,
+      "loss": 0.012039584159851074,
+      "step": 22000
+    },
+    {
+      "epoch": 1.7234775947912677,
+      "grad_norm": 0.34590524435043335,
+      "learning_rate": 8.510660028086303e-06,
+      "loss": 0.01236446189880371,
+      "step": 22500
+    },
+    {
+      "epoch": 1.7617770968977404,
+      "grad_norm": 0.5301225185394287,
+      "learning_rate": 8.255330014043151e-06,
+      "loss": 0.012290955543518067,
+      "step": 23000
+    },
+    {
+      "epoch": 1.800076599004213,
+      "grad_norm": 0.23181863129138947,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 0.012518532752990722,
+      "step": 23500
+    },
+    {
+      "epoch": 1.8383761011106856,
+      "grad_norm": 0.4152184724807739,
+      "learning_rate": 7.74466998595685e-06,
+      "loss": 0.01161912727355957,
+      "step": 24000
+    },
+    {
+      "epoch": 1.876675603217158,
+      "grad_norm": 0.12319803982973099,
+      "learning_rate": 7.489339971913699e-06,
+      "loss": 0.011899042129516601,
+      "step": 24500
+    },
+    {
+      "epoch": 1.9149751053236308,
+      "grad_norm": 0.6045161485671997,
+      "learning_rate": 7.234009957870548e-06,
+      "loss": 0.012299044609069824,
+      "step": 25000
+    },
+    {
+      "epoch": 1.9532746074301035,
+      "grad_norm": 0.1614077091217041,
+      "learning_rate": 6.9786799438273974e-06,
+      "loss": 0.011898996353149414,
+      "step": 25500
+    },
+    {
+      "epoch": 1.991574109536576,
+      "grad_norm": 0.48715102672576904,
+      "learning_rate": 6.7233499297842464e-06,
+      "loss": 0.01182526969909668,
+      "step": 26000
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.015901656821370125,
+      "eval_runtime": 195.5296,
+      "eval_samples_per_second": 474.762,
+      "eval_steps_per_second": 59.347,
+      "step": 26110
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 39165,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 4.367651503327027e+17,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": null
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-26110/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb80cf54f2fe927cc63c861aa4b3e87525629b3d1868eeda1dedae9009697f1c
+size 5265

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/config.json ADDED Viewed

	@@ -0,0 +1,120 @@

+{
+  "add_cross_attention": false,
+  "architectures": [
+    "BertForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": null,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "dtype": "float32",
+  "eos_token_id": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-AGE",
+    "2": "I-AGE",
+    "3": "B-BUILDINGNUM",
+    "4": "I-BUILDINGNUM",
+    "5": "B-CITY",
+    "6": "I-CITY",
+    "7": "B-CREDITCARDNUMBER",
+    "8": "I-CREDITCARDNUMBER",
+    "9": "B-DATE",
+    "10": "I-DATE",
+    "11": "B-DRIVERLICENSENUM",
+    "12": "I-DRIVERLICENSENUM",
+    "13": "B-EMAIL",
+    "14": "I-EMAIL",
+    "15": "B-GENDER",
+    "16": "I-GENDER",
+    "17": "B-GIVENNAME",
+    "18": "I-GIVENNAME",
+    "19": "B-IDCARDNUM",
+    "20": "I-IDCARDNUM",
+    "21": "B-PASSPORTNUM",
+    "22": "I-PASSPORTNUM",
+    "23": "B-SEX",
+    "24": "I-SEX",
+    "25": "B-SOCIALNUM",
+    "26": "I-SOCIALNUM",
+    "27": "B-STREET",
+    "28": "I-STREET",
+    "29": "B-SURNAME",
+    "30": "I-SURNAME",
+    "31": "B-TAXNUM",
+    "32": "I-TAXNUM",
+    "33": "B-TELEPHONENUM",
+    "34": "I-TELEPHONENUM",
+    "35": "B-TIME",
+    "36": "I-TIME",
+    "37": "B-TITLE",
+    "38": "I-TITLE",
+    "39": "B-ZIPCODE",
+    "40": "I-ZIPCODE"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "is_decoder": false,
+  "label2id": {
+    "B-AGE": 1,
+    "B-BUILDINGNUM": 3,
+    "B-CITY": 5,
+    "B-CREDITCARDNUMBER": 7,
+    "B-DATE": 9,
+    "B-DRIVERLICENSENUM": 11,
+    "B-EMAIL": 13,
+    "B-GENDER": 15,
+    "B-GIVENNAME": 17,
+    "B-IDCARDNUM": 19,
+    "B-PASSPORTNUM": 21,
+    "B-SEX": 23,
+    "B-SOCIALNUM": 25,
+    "B-STREET": 27,
+    "B-SURNAME": 29,
+    "B-TAXNUM": 31,
+    "B-TELEPHONENUM": 33,
+    "B-TIME": 35,
+    "B-TITLE": 37,
+    "B-ZIPCODE": 39,
+    "I-AGE": 2,
+    "I-BUILDINGNUM": 4,
+    "I-CITY": 6,
+    "I-CREDITCARDNUMBER": 8,
+    "I-DATE": 10,
+    "I-DRIVERLICENSENUM": 12,
+    "I-EMAIL": 14,
+    "I-GENDER": 16,
+    "I-GIVENNAME": 18,
+    "I-IDCARDNUM": 20,
+    "I-PASSPORTNUM": 22,
+    "I-SEX": 24,
+    "I-SOCIALNUM": 26,
+    "I-STREET": 28,
+    "I-SURNAME": 30,
+    "I-TAXNUM": 32,
+    "I-TELEPHONENUM": 34,
+    "I-TIME": 36,
+    "I-TITLE": 38,
+    "I-ZIPCODE": 40,
+    "O": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "tie_word_embeddings": true,
+  "transformers_version": "5.3.0",
+  "type_vocab_size": 2,
+  "use_cache": false,
+  "vocab_size": 119547
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bcb1bc9434fc8bb90f1ee23d6681062fc6e79f5084569691a6c27b06e052485f
+size 709200844

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d826db9b613c1a06721bd27a59a79e572a97efd2428065e606b69a891c995b75
+size 1418524683

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eaadb28835e3c6aa08bb70cd5e8cbcafc183c39195d5e8e45c7751f80b6361fe
+size 14645

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a72ccd1a7d41794f33f843073beb481aebe99715fe6df649ba67dd547b0b1ad1
+size 1465

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": true,
+  "backend": "tokenizers",
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "is_local": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/trainer_state.json ADDED Viewed

	@@ -0,0 +1,604 @@

+{
+  "best_global_step": null,
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 39165,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.038299502106472615,
+      "grad_norm": 0.8714600801467896,
+      "learning_rate": 1.9745180645984938e-05,
+      "loss": 0.1691785430908203,
+      "step": 500
+    },
+    {
+      "epoch": 0.07659900421294523,
+      "grad_norm": 0.588369607925415,
+      "learning_rate": 1.9489850631941786e-05,
+      "loss": 0.04638611221313477,
+      "step": 1000
+    },
+    {
+      "epoch": 0.11489850631941785,
+      "grad_norm": 1.5041358470916748,
+      "learning_rate": 1.9234520617898634e-05,
+      "loss": 0.03861086273193359,
+      "step": 1500
+    },
+    {
+      "epoch": 0.15319800842589046,
+      "grad_norm": 0.4620295763015747,
+      "learning_rate": 1.8979190603855486e-05,
+      "loss": 0.03408417129516601,
+      "step": 2000
+    },
+    {
+      "epoch": 0.19149751053236308,
+      "grad_norm": 1.0186210870742798,
+      "learning_rate": 1.8723860589812334e-05,
+      "loss": 0.030472009658813477,
+      "step": 2500
+    },
+    {
+      "epoch": 0.2297970126388357,
+      "grad_norm": 0.19274073839187622,
+      "learning_rate": 1.8468530575769182e-05,
+      "loss": 0.02794113540649414,
+      "step": 3000
+    },
+    {
+      "epoch": 0.2680965147453083,
+      "grad_norm": 0.3304294943809509,
+      "learning_rate": 1.8213200561726034e-05,
+      "loss": 0.026913631439208986,
+      "step": 3500
+    },
+    {
+      "epoch": 0.3063960168517809,
+      "grad_norm": 0.32137593626976013,
+      "learning_rate": 1.7957870547682882e-05,
+      "loss": 0.025851396560668944,
+      "step": 4000
+    },
+    {
+      "epoch": 0.34469551895825357,
+      "grad_norm": 0.5200027823448181,
+      "learning_rate": 1.770254053363973e-05,
+      "loss": 0.02558848571777344,
+      "step": 4500
+    },
+    {
+      "epoch": 0.38299502106472616,
+      "grad_norm": 0.6408317685127258,
+      "learning_rate": 1.744721051959658e-05,
+      "loss": 0.023505245208740234,
+      "step": 5000
+    },
+    {
+      "epoch": 0.42129452317119875,
+      "grad_norm": 0.46780553460121155,
+      "learning_rate": 1.719188050555343e-05,
+      "loss": 0.023054824829101563,
+      "step": 5500
+    },
+    {
+      "epoch": 0.4595940252776714,
+      "grad_norm": 0.6626068353652954,
+      "learning_rate": 1.6936550491510278e-05,
+      "loss": 0.02208795166015625,
+      "step": 6000
+    },
+    {
+      "epoch": 0.497893527384144,
+      "grad_norm": 0.25836509466171265,
+      "learning_rate": 1.668122047746713e-05,
+      "loss": 0.022046304702758788,
+      "step": 6500
+    },
+    {
+      "epoch": 0.5361930294906166,
+      "grad_norm": 0.8243473172187805,
+      "learning_rate": 1.6425890463423978e-05,
+      "loss": 0.021231672286987305,
+      "step": 7000
+    },
+    {
+      "epoch": 0.5744925315970892,
+      "grad_norm": 0.26098620891571045,
+      "learning_rate": 1.6170560449380826e-05,
+      "loss": 0.020609188079833984,
+      "step": 7500
+    },
+    {
+      "epoch": 0.6127920337035618,
+      "grad_norm": 0.1398458480834961,
+      "learning_rate": 1.5915230435337677e-05,
+      "loss": 0.020333499908447267,
+      "step": 8000
+    },
+    {
+      "epoch": 0.6510915358100344,
+      "grad_norm": 0.44954946637153625,
+      "learning_rate": 1.5659900421294526e-05,
+      "loss": 0.01971204948425293,
+      "step": 8500
+    },
+    {
+      "epoch": 0.6893910379165071,
+      "grad_norm": 0.2548958957195282,
+      "learning_rate": 1.5404570407251374e-05,
+      "loss": 0.01934459114074707,
+      "step": 9000
+    },
+    {
+      "epoch": 0.7276905400229797,
+      "grad_norm": 0.31454744935035706,
+      "learning_rate": 1.5149240393208222e-05,
+      "loss": 0.018815528869628905,
+      "step": 9500
+    },
+    {
+      "epoch": 0.7659900421294523,
+      "grad_norm": 0.15480241179466248,
+      "learning_rate": 1.4893910379165073e-05,
+      "loss": 0.018857412338256836,
+      "step": 10000
+    },
+    {
+      "epoch": 0.8042895442359249,
+      "grad_norm": 0.23583486676216125,
+      "learning_rate": 1.4638580365121922e-05,
+      "loss": 0.018428108215332032,
+      "step": 10500
+    },
+    {
+      "epoch": 0.8425890463423975,
+      "grad_norm": 0.289045125246048,
+      "learning_rate": 1.438325035107877e-05,
+      "loss": 0.01816094207763672,
+      "step": 11000
+    },
+    {
+      "epoch": 0.8808885484488702,
+      "grad_norm": 0.13967347145080566,
+      "learning_rate": 1.4127920337035618e-05,
+      "loss": 0.01740534973144531,
+      "step": 11500
+    },
+    {
+      "epoch": 0.9191880505553428,
+      "grad_norm": 0.39465662837028503,
+      "learning_rate": 1.387259032299247e-05,
+      "loss": 0.017327314376831056,
+      "step": 12000
+    },
+    {
+      "epoch": 0.9574875526618154,
+      "grad_norm": 0.5613229274749756,
+      "learning_rate": 1.3617260308949318e-05,
+      "loss": 0.01724307060241699,
+      "step": 12500
+    },
+    {
+      "epoch": 0.995787054768288,
+      "grad_norm": 0.550220787525177,
+      "learning_rate": 1.3361930294906168e-05,
+      "loss": 0.017301082611083984,
+      "step": 13000
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 0.019178859889507294,
+      "eval_runtime": 195.4351,
+      "eval_samples_per_second": 474.991,
+      "eval_steps_per_second": 59.375,
+      "step": 13055
+    },
+    {
+      "epoch": 1.0340865568747606,
+      "grad_norm": 0.5676391124725342,
+      "learning_rate": 1.3106600280863016e-05,
+      "loss": 0.014577848434448242,
+      "step": 13500
+    },
+    {
+      "epoch": 1.0723860589812333,
+      "grad_norm": 0.2776853144168854,
+      "learning_rate": 1.2851270266819866e-05,
+      "loss": 0.014119720458984375,
+      "step": 14000
+    },
+    {
+      "epoch": 1.1106855610877058,
+      "grad_norm": 0.38407689332962036,
+      "learning_rate": 1.2595940252776716e-05,
+      "loss": 0.014150198936462402,
+      "step": 14500
+    },
+    {
+      "epoch": 1.1489850631941785,
+      "grad_norm": 0.24024367332458496,
+      "learning_rate": 1.2340610238733564e-05,
+      "loss": 0.014232131958007812,
+      "step": 15000
+    },
+    {
+      "epoch": 1.1872845653006512,
+      "grad_norm": 0.2031095325946808,
+      "learning_rate": 1.2085280224690414e-05,
+      "loss": 0.013924983024597168,
+      "step": 15500
+    },
+    {
+      "epoch": 1.2255840674071237,
+      "grad_norm": 0.4606612026691437,
+      "learning_rate": 1.1829950210647263e-05,
+      "loss": 0.013915029525756836,
+      "step": 16000
+    },
+    {
+      "epoch": 1.2638835695135964,
+      "grad_norm": 0.3309486508369446,
+      "learning_rate": 1.1574620196604112e-05,
+      "loss": 0.01338797664642334,
+      "step": 16500
+    },
+    {
+      "epoch": 1.3021830716200689,
+      "grad_norm": 0.34972071647644043,
+      "learning_rate": 1.131929018256096e-05,
+      "loss": 0.013172533988952637,
+      "step": 17000
+    },
+    {
+      "epoch": 1.3404825737265416,
+      "grad_norm": 0.40405741333961487,
+      "learning_rate": 1.1063960168517811e-05,
+      "loss": 0.013684582710266114,
+      "step": 17500
+    },
+    {
+      "epoch": 1.3787820758330143,
+      "grad_norm": 0.4469183385372162,
+      "learning_rate": 1.080863015447466e-05,
+      "loss": 0.013521049499511719,
+      "step": 18000
+    },
+    {
+      "epoch": 1.4170815779394867,
+      "grad_norm": 0.44263386726379395,
+      "learning_rate": 1.0553300140431508e-05,
+      "loss": 0.013442005157470703,
+      "step": 18500
+    },
+    {
+      "epoch": 1.4553810800459595,
+      "grad_norm": 0.39971089363098145,
+      "learning_rate": 1.0297970126388358e-05,
+      "loss": 0.013027252197265625,
+      "step": 19000
+    },
+    {
+      "epoch": 1.493680582152432,
+      "grad_norm": 0.4588576555252075,
+      "learning_rate": 1.0042640112345207e-05,
+      "loss": 0.012910510063171387,
+      "step": 19500
+    },
+    {
+      "epoch": 1.5319800842589046,
+      "grad_norm": 0.24441905319690704,
+      "learning_rate": 9.787310098302056e-06,
+      "loss": 0.012541162490844726,
+      "step": 20000
+    },
+    {
+      "epoch": 1.5702795863653773,
+      "grad_norm": 0.12215672433376312,
+      "learning_rate": 9.531980084258905e-06,
+      "loss": 0.012792759895324708,
+      "step": 20500
+    },
+    {
+      "epoch": 1.6085790884718498,
+      "grad_norm": 0.3312968909740448,
+      "learning_rate": 9.276650070215755e-06,
+      "loss": 0.012631108283996582,
+      "step": 21000
+    },
+    {
+      "epoch": 1.6468785905783225,
+      "grad_norm": 0.3255740702152252,
+      "learning_rate": 9.021320056172604e-06,
+      "loss": 0.01261143684387207,
+      "step": 21500
+    },
+    {
+      "epoch": 1.685178092684795,
+      "grad_norm": 0.2416062355041504,
+      "learning_rate": 8.765990042129453e-06,
+      "loss": 0.012039584159851074,
+      "step": 22000
+    },
+    {
+      "epoch": 1.7234775947912677,
+      "grad_norm": 0.34590524435043335,
+      "learning_rate": 8.510660028086303e-06,
+      "loss": 0.01236446189880371,
+      "step": 22500
+    },
+    {
+      "epoch": 1.7617770968977404,
+      "grad_norm": 0.5301225185394287,
+      "learning_rate": 8.255330014043151e-06,
+      "loss": 0.012290955543518067,
+      "step": 23000
+    },
+    {
+      "epoch": 1.800076599004213,
+      "grad_norm": 0.23181863129138947,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 0.012518532752990722,
+      "step": 23500
+    },
+    {
+      "epoch": 1.8383761011106856,
+      "grad_norm": 0.4152184724807739,
+      "learning_rate": 7.74466998595685e-06,
+      "loss": 0.01161912727355957,
+      "step": 24000
+    },
+    {
+      "epoch": 1.876675603217158,
+      "grad_norm": 0.12319803982973099,
+      "learning_rate": 7.489339971913699e-06,
+      "loss": 0.011899042129516601,
+      "step": 24500
+    },
+    {
+      "epoch": 1.9149751053236308,
+      "grad_norm": 0.6045161485671997,
+      "learning_rate": 7.234009957870548e-06,
+      "loss": 0.012299044609069824,
+      "step": 25000
+    },
+    {
+      "epoch": 1.9532746074301035,
+      "grad_norm": 0.1614077091217041,
+      "learning_rate": 6.9786799438273974e-06,
+      "loss": 0.011898996353149414,
+      "step": 25500
+    },
+    {
+      "epoch": 1.991574109536576,
+      "grad_norm": 0.48715102672576904,
+      "learning_rate": 6.7233499297842464e-06,
+      "loss": 0.01182526969909668,
+      "step": 26000
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 0.015901656821370125,
+      "eval_runtime": 195.5296,
+      "eval_samples_per_second": 474.762,
+      "eval_steps_per_second": 59.347,
+      "step": 26110
+    },
+    {
+      "epoch": 2.0298736116430485,
+      "grad_norm": 0.21605870127677917,
+      "learning_rate": 6.468019915741096e-06,
+      "loss": 0.009737834930419922,
+      "step": 26500
+    },
+    {
+      "epoch": 2.068173113749521,
+      "grad_norm": 0.13223645091056824,
+      "learning_rate": 6.2126899016979445e-06,
+      "loss": 0.0094491548538208,
+      "step": 27000
+    },
+    {
+      "epoch": 2.106472615855994,
+      "grad_norm": 0.2158566415309906,
+      "learning_rate": 5.957359887654794e-06,
+      "loss": 0.009373339653015136,
+      "step": 27500
+    },
+    {
+      "epoch": 2.1447721179624666,
+      "grad_norm": 0.2324061244726181,
+      "learning_rate": 5.702029873611643e-06,
+      "loss": 0.00945040225982666,
+      "step": 28000
+    },
+    {
+      "epoch": 2.1830716200689393,
+      "grad_norm": 0.14569459855556488,
+      "learning_rate": 5.446699859568492e-06,
+      "loss": 0.009708081245422363,
+      "step": 28500
+    },
+    {
+      "epoch": 2.2213711221754115,
+      "grad_norm": 0.3522016406059265,
+      "learning_rate": 5.1913698455253414e-06,
+      "loss": 0.009668509483337402,
+      "step": 29000
+    },
+    {
+      "epoch": 2.2596706242818843,
+      "grad_norm": 0.39561134576797485,
+      "learning_rate": 4.936039831482191e-06,
+      "loss": 0.009597929000854492,
+      "step": 29500
+    },
+    {
+      "epoch": 2.297970126388357,
+      "grad_norm": 0.12239322811365128,
+      "learning_rate": 4.68070981743904e-06,
+      "loss": 0.009111111640930175,
+      "step": 30000
+    },
+    {
+      "epoch": 2.3362696284948297,
+      "grad_norm": 0.25219589471817017,
+      "learning_rate": 4.425379803395889e-06,
+      "loss": 0.009667729377746582,
+      "step": 30500
+    },
+    {
+      "epoch": 2.3745691306013024,
+      "grad_norm": 0.22091256082057953,
+      "learning_rate": 4.170049789352738e-06,
+      "loss": 0.009386078834533691,
+      "step": 31000
+    },
+    {
+      "epoch": 2.4128686327077746,
+      "grad_norm": 0.2760886549949646,
+      "learning_rate": 3.914719775309587e-06,
+      "loss": 0.009332194328308105,
+      "step": 31500
+    },
+    {
+      "epoch": 2.4511681348142473,
+      "grad_norm": 0.27975377440452576,
+      "learning_rate": 3.659389761266437e-06,
+      "loss": 0.008895779609680176,
+      "step": 32000
+    },
+    {
+      "epoch": 2.48946763692072,
+      "grad_norm": 0.1745811402797699,
+      "learning_rate": 3.4040597472232863e-06,
+      "loss": 0.00910122299194336,
+      "step": 32500
+    },
+    {
+      "epoch": 2.5277671390271927,
+      "grad_norm": 0.09813889116048813,
+      "learning_rate": 3.1487297331801353e-06,
+      "loss": 0.009047582626342773,
+      "step": 33000
+    },
+    {
+      "epoch": 2.5660666411336654,
+      "grad_norm": 0.37277743220329285,
+      "learning_rate": 2.893399719136985e-06,
+      "loss": 0.008934443473815917,
+      "step": 33500
+    },
+    {
+      "epoch": 2.6043661432401377,
+      "grad_norm": 0.43550804257392883,
+      "learning_rate": 2.638069705093834e-06,
+      "loss": 0.009341882705688477,
+      "step": 34000
+    },
+    {
+      "epoch": 2.6426656453466104,
+      "grad_norm": 0.24221749603748322,
+      "learning_rate": 2.3827396910506832e-06,
+      "loss": 0.008809703826904297,
+      "step": 34500
+    },
+    {
+      "epoch": 2.680965147453083,
+      "grad_norm": 0.15879695117473602,
+      "learning_rate": 2.1274096770075327e-06,
+      "loss": 0.009361488342285156,
+      "step": 35000
+    },
+    {
+      "epoch": 2.719264649559556,
+      "grad_norm": 0.16028359532356262,
+      "learning_rate": 1.8720796629643817e-06,
+      "loss": 0.008846318244934082,
+      "step": 35500
+    },
+    {
+      "epoch": 2.7575641516660285,
+      "grad_norm": 0.25445544719696045,
+      "learning_rate": 1.616749648921231e-06,
+      "loss": 0.008740591049194337,
+      "step": 36000
+    },
+    {
+      "epoch": 2.795863653772501,
+      "grad_norm": 0.2028861790895462,
+      "learning_rate": 1.36141963487808e-06,
+      "loss": 0.00920598030090332,
+      "step": 36500
+    },
+    {
+      "epoch": 2.8341631558789735,
+      "grad_norm": 0.27509695291519165,
+      "learning_rate": 1.1060896208349292e-06,
+      "loss": 0.008649415016174316,
+      "step": 37000
+    },
+    {
+      "epoch": 2.872462657985446,
+      "grad_norm": 0.2710762023925781,
+      "learning_rate": 8.507596067917784e-07,
+      "loss": 0.008570868492126465,
+      "step": 37500
+    },
+    {
+      "epoch": 2.910762160091919,
+      "grad_norm": 0.6078771352767944,
+      "learning_rate": 5.954295927486277e-07,
+      "loss": 0.008855979919433593,
+      "step": 38000
+    },
+    {
+      "epoch": 2.9490616621983916,
+      "grad_norm": 0.28367650508880615,
+      "learning_rate": 3.4009957870547684e-07,
+      "loss": 0.008818706512451173,
+      "step": 38500
+    },
+    {
+      "epoch": 2.987361164304864,
+      "grad_norm": 0.11465097963809967,
+      "learning_rate": 8.476956466232606e-08,
+      "loss": 0.00848841953277588,
+      "step": 39000
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 0.014914697967469692,
+      "eval_runtime": 177.3666,
+      "eval_samples_per_second": 523.379,
+      "eval_steps_per_second": 65.424,
+      "step": 39165
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 39165,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 6.551477254990541e+17,
+  "train_batch_size": 64,
+  "trial_name": null,
+  "trial_params": null
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/checkpoint-39165/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb80cf54f2fe927cc63c861aa4b3e87525629b3d1868eeda1dedae9009697f1c
+size 5265

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/config.json ADDED Viewed

	@@ -0,0 +1,120 @@

+{
+  "add_cross_attention": false,
+  "architectures": [
+    "BertForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": null,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "dtype": "float32",
+  "eos_token_id": null,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-AGE",
+    "2": "I-AGE",
+    "3": "B-BUILDINGNUM",
+    "4": "I-BUILDINGNUM",
+    "5": "B-CITY",
+    "6": "I-CITY",
+    "7": "B-CREDITCARDNUMBER",
+    "8": "I-CREDITCARDNUMBER",
+    "9": "B-DATE",
+    "10": "I-DATE",
+    "11": "B-DRIVERLICENSENUM",
+    "12": "I-DRIVERLICENSENUM",
+    "13": "B-EMAIL",
+    "14": "I-EMAIL",
+    "15": "B-GENDER",
+    "16": "I-GENDER",
+    "17": "B-GIVENNAME",
+    "18": "I-GIVENNAME",
+    "19": "B-IDCARDNUM",
+    "20": "I-IDCARDNUM",
+    "21": "B-PASSPORTNUM",
+    "22": "I-PASSPORTNUM",
+    "23": "B-SEX",
+    "24": "I-SEX",
+    "25": "B-SOCIALNUM",
+    "26": "I-SOCIALNUM",
+    "27": "B-STREET",
+    "28": "I-STREET",
+    "29": "B-SURNAME",
+    "30": "I-SURNAME",
+    "31": "B-TAXNUM",
+    "32": "I-TAXNUM",
+    "33": "B-TELEPHONENUM",
+    "34": "I-TELEPHONENUM",
+    "35": "B-TIME",
+    "36": "I-TIME",
+    "37": "B-TITLE",
+    "38": "I-TITLE",
+    "39": "B-ZIPCODE",
+    "40": "I-ZIPCODE"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "is_decoder": false,
+  "label2id": {
+    "B-AGE": 1,
+    "B-BUILDINGNUM": 3,
+    "B-CITY": 5,
+    "B-CREDITCARDNUMBER": 7,
+    "B-DATE": 9,
+    "B-DRIVERLICENSENUM": 11,
+    "B-EMAIL": 13,
+    "B-GENDER": 15,
+    "B-GIVENNAME": 17,
+    "B-IDCARDNUM": 19,
+    "B-PASSPORTNUM": 21,
+    "B-SEX": 23,
+    "B-SOCIALNUM": 25,
+    "B-STREET": 27,
+    "B-SURNAME": 29,
+    "B-TAXNUM": 31,
+    "B-TELEPHONENUM": 33,
+    "B-TIME": 35,
+    "B-TITLE": 37,
+    "B-ZIPCODE": 39,
+    "I-AGE": 2,
+    "I-BUILDINGNUM": 4,
+    "I-CITY": 6,
+    "I-CREDITCARDNUMBER": 8,
+    "I-DATE": 10,
+    "I-DRIVERLICENSENUM": 12,
+    "I-EMAIL": 14,
+    "I-GENDER": 16,
+    "I-GIVENNAME": 18,
+    "I-IDCARDNUM": 20,
+    "I-PASSPORTNUM": 22,
+    "I-SEX": 24,
+    "I-SOCIALNUM": 26,
+    "I-STREET": 28,
+    "I-SURNAME": 30,
+    "I-TAXNUM": 32,
+    "I-TELEPHONENUM": 34,
+    "I-TIME": 36,
+    "I-TITLE": 38,
+    "I-ZIPCODE": 40,
+    "O": 0
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "tie_word_embeddings": true,
+  "transformers_version": "5.3.0",
+  "type_vocab_size": 2,
+  "use_cache": false,
+  "vocab_size": 119547
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bcb1bc9434fc8bb90f1ee23d6681062fc6e79f5084569691a6c27b06e052485f
+size 709200844

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": true,
+  "backend": "tokenizers",
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "is_local": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

open-pii-masking-500k-ai4privacy-augmented/TokenBased-BERT/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb80cf54f2fe927cc63c861aa4b3e87525629b3d1868eeda1dedae9009697f1c
+size 5265