Spaces:

CONDA-Workshop
/

Data-Contamination-Database

Sleeping

App Files Files Community

Data-Contamination-Database / contamination_report.csv

Commit History

Update contamination_report.csv

502b10a
verified

suryanshs16103 commited on May 17

Add Reports Based on "Llemma: An Open Language Model For Mathematics" (#23)

9fba4d8
verified

wlchen commited on May 13

add flores contamination in xP3 (#20)

100cb5e
verified

davidstap commited on May 7

Add Aquila model series which have gsm8k test set contamination (#21)

8f6a7cc
verified

bpHigh commited on May 6

GPT-3.5 Spider contamination based on https://arxiv.org/pdf/2402.08100 (#18)

dc4c3f8
verified

bpHigh commited on May 6

Updates

d4d0c64

OSainz commited on Apr 29

Add changes

23add19

OSainz commited on Apr 29

Superglue/RealNews Contamination based on "Noise-Robust De-Duplication at Scale" (#15)

888fb82
verified

emilys commited on Apr 29

Mistral 7B Arc Easy Contamination based on "Proving Test Set Contamination in Black Box Language Models" (#14)

4f71313
verified

AmeyaPrabhu commited on Apr 29

Added Contamination Evidence from GPT4 Tech Report using String matching on GPT-4 (#11)

f82db5d
verified

AmeyaPrabhu commited on Apr 29

GPT-3.5Turbo HumanEval Contamination based on "Generalization or Memorization: Data Contamination and Trustworthy Evaluation for Large Language Models" (#16)

6b722ae
verified

jupyter31 commited on Apr 29

Added Contamination Evidence on MMLU of ChatGPT/GPT4 from "Investigating data contamination in modern benchmarks for large language models" (#10)

f5daf9b
verified

AmeyaPrabhu commited on Apr 29

Added Contamination Info on Old Models: GPT3, FLAN, GLaM, PaLM, PaLM 2 (#13)

c4acbf6
verified

AmeyaPrabhu commited on Apr 25

Contamination results based on "Data Contamination Quiz" (#9)

36aaa79
verified

shahriargolchin commited on Apr 25

Fix arxiv links

7127ae8

OSainz commited on Apr 25

Code contamination in HumanEval and MBPP (#12)

ffb0d75
verified

AmeyaPrabhu commited on Apr 25

Add model-based results for MedNLI, RadNLI for GPT-3.5 and GPT-4 (#8)

d57b460
verified

j-chim commited on Apr 23

Add data from "An Open-Source Data Contamination Report for Large Language Models" (#5)

619ed3b
verified

vishaal27 commited on Apr 23

Import data from LM Contamination Index (#7)

e1c863c
verified

OSainz commited on Apr 19

Fix format issues

9b28f49

OSainz commited on Apr 18

Add data from "Documenting Large Webtext Corpora: A Case Study on the Colossal Clean Crawled Corpus" (#6)

935e79b
verified

vishaal27 commited on Apr 18

Add reports from Time Travel In LLMs paper (#3)

5a41656
verified

OSainz commited on Mar 25

Fix super_glue replace

ab79de8

OSainz commited on Mar 25

Add PR links to previous commits

f35c65c

OSainz commited on Mar 25

Add data from WIMBD paper (#2)

eadd64a
verified

OSainz commited on Mar 24

Small changes

fd6f269

OSainz commited on Mar 22

Initital commit

eba8a37

Iker commited on Mar 12