Add verifyToken field to verify evaluation results are produced by Hugging Face's automatic model evaluator

Beep boop, I am a bot from Hugging Face's automatic model evaluator 👋! We've added a new `verifyToken` field to your evaluation results to verify that they are produced by the model evaluator. Accept this PR to ensure that your results remain listed as **verified** on the [Hub leaderboard](https://huggingface.co/spaces/autoevaluate/leaderboards).

Files changed (1) hide show

README.md +15 -11

README.md CHANGED Viewed

@@ -1,12 +1,12 @@
 ---
-datasets:
-- squad_v2
 language: en
 license: mit
-pipeline_tag: question-answering
 tags:
 - deberta
 - deberta-v3
 model-index:
 - name: navteca/deberta-v3-base-squad2
   results:
@@ -19,14 +19,16 @@ model-index:
       config: squad_v2
       split: validation
     metrics:
-    - name: Exact Match
-      type: exact_match
       value: 88.0876
       verified: true
-    - name: F1
-      type: f1
       value: 91.1623
       verified: true
   - task:
       type: question-answering
       name: Question Answering
@@ -36,14 +38,16 @@ model-index:
       config: plain_text
       split: validation
     metrics:
-    - name: Exact Match
-      type: exact_match
       value: 89.2366
       verified: true
-    - name: F1
-      type: f1
       value: 95.0569
       verified: true
 ---
 # Deberta v3 large model for QA (SQuAD 2.0)

 ---
 language: en
 license: mit
 tags:
 - deberta
 - deberta-v3
+datasets:
+- squad_v2
+pipeline_tag: question-answering
 model-index:
 - name: navteca/deberta-v3-base-squad2
   results:
       config: squad_v2
       split: validation
     metrics:
+    - type: exact_match
       value: 88.0876
+      name: Exact Match
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiZWRmMDg2ZjQ4ZjhhOWIzZjRhNTU2ZGFjZGM3NGY5MzBkYzk2MWU2Y2M1ODcxYjcxMTBkOTM0MGYwNzVlMmEwOCIsInZlcnNpb24iOjF9.bQdENVyV5sMVHiBQZX5yp0dSUWnd23-oLG1qdAdoMzGHxP3cq_RBcmhQ7Qpe6MC-UfcAuLedhs7ERAGX1OaaBw
+    - type: f1
       value: 91.1623
+      name: F1
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiZmEyY2RhYzAzNzYwM2ZhNjUyOWZjNzYzZDk0YmU4ZGQwZWZkYTNlYzBkZDdiZGY4YTI3MTI5MGMyZjgzYmI5YyIsInZlcnNpb24iOjF9.T9wVVp4RW76X5tdm0l3WzqtHX6bWuRc-OtIKTtHVPoauzNR4Tt3Q0LeR-_tOsOiTVCEV6A-3np43BQ2Zobk6Cg
   - task:
       type: question-answering
       name: Question Answering
       config: plain_text
       split: validation
     metrics:
+    - type: exact_match
       value: 89.2366
+      name: Exact Match
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiNjRmNGE5MzQzOGFmMjhmMTc4NDMxYjVmMjRmZTRjYjQyMTNiOTgzNWQ2YTQ5NjFhNjk2ZjdlNDMxNDljM2QwZiIsInZlcnNpb24iOjF9.5_WAX03-LTeIrmMkQQgNZc5Iqo-VH3WJYmK0ydNfa3O7JJymc0aQncbG3AHDT85K5HY5tygS4DKmwQ0U2vajAA
+    - type: f1
       value: 95.0569
+      name: F1
       verified: true
+      verifyToken: eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiMTExMGY3YzcyYjRmZWU0YjU2ZjIzMTViMzk4YzRmNmY1NWMxZGU3MGVlNWE1NmJiZmVjZjRmYjBlZWU4Mjg5MCIsInZlcnNpb24iOjF9.m5PEInPwVxTusAzfl3AUbDFAbeu9Oywb8gVHsOtc5paKe5ePN3VhXeu7YPGufYbLETqiaueRS5t4fulPH2CFAA
 ---
 # Deberta v3 large model for QA (SQuAD 2.0)