Pietro Lesci

pietrolesci

https://pietrolesci.github.io/

AI & ML interests

I like developing and applying causal methods to study the effect of training choices on models’ behaviour, including memorisation, shortcut learning, and tokenisation.

Recent Activity

updated a dataset about 17 hours ago

pietrolesci/pile-deduped-pythia-preshuffled

updated a dataset about 18 hours ago

pietrolesci/pile-deduped-pythia-preshuffled

updated a dataset about 19 hours ago

pietrolesci/pile-deduped-pythia-preshuffled

View all activity

Organizations

Collections 7

models 19

pietrolesci/smol_llama-370M-tied_bpe32000minipile

Updated 9 days ago • 56

pietrolesci/smol_llama-1B_bpe32000minipile

Updated 9 days ago • 54

pietrolesci/smol_llama-81M-tied_bpe2wp32000minipile

Updated 15 days ago

pietrolesci/smol_llama-81M-tied_bpe128000minipile

Updated 15 days ago

pietrolesci/smol_llama-81M-tied_bpe8064minipile

Updated 15 days ago

pietrolesci/smol_llama-81M-tied_wordpiece32000minipile

Updated 15 days ago

pietrolesci/smol_llama-81M-tied_bpe32000minipile

Updated 15 days ago

pietrolesci/tokenisers

Updated 15 days ago

pietrolesci/bert-civilcomments-gradtracking

Updated Jul 1, 2024

pietrolesci/roberta-base_mnli_b9799b8f9b

Updated May 6, 2024

datasets 52

pietrolesci/pile-deduped-pythia-preshuffled

Preview • Updated about 17 hours ago • 58

pietrolesci/smol_llama-minipile-evals

Viewer • Updated 9 days ago • 1.82M • 312

pietrolesci/minipile

Viewer • Updated 15 days ago • 6.06M • 558

pietrolesci/opus-5langs-1M

Viewer • Updated Dec 10, 2024 • 5M • 143

pietrolesci/opus-raw

Viewer • Updated Nov 27, 2024 • 4.06B • 2.86k

pietrolesci/pythia-pile-stats

Viewer • Updated Sep 23, 2024 • 113M • 176

pietrolesci/slim-pajama-eval

Viewer • Updated Sep 16, 2024 • 1.84M • 91 • 1

pietrolesci/pile-subset

Updated Sep 13, 2024 • 50

pietrolesci/cmnist

Viewer • Updated Jul 29, 2024 • 308k • 88

pietrolesci/pythia-deduped-stats

Viewer • Updated Jul 15, 2024 • 16.3M • 279

Pietro Lesci

AI & ML interests

Recent Activity

Organizations

Collections 7

pietrolesci/opus-raw

pietrolesci/opus-5langs-1M

pietrolesci/amazoncat-13k

pietrolesci/civilcomments-wilds

pietrolesci/dbpedia_14_indexed

pietrolesci/DBPedia_Classes_indexed

Papers 5

spaces 1

Wordify

models 19

pietrolesci/smol_llama-370M-tied_bpe32000minipile

pietrolesci/smol_llama-1B_bpe32000minipile

pietrolesci/smol_llama-81M-tied_bpe2wp32000minipile

pietrolesci/smol_llama-81M-tied_bpe128000minipile

pietrolesci/smol_llama-81M-tied_bpe8064minipile

pietrolesci/smol_llama-81M-tied_wordpiece32000minipile

pietrolesci/smol_llama-81M-tied_bpe32000minipile

pietrolesci/tokenisers

pietrolesci/bert-civilcomments-gradtracking

pietrolesci/roberta-base_mnli_b9799b8f9b

datasets 52

pietrolesci/pile-deduped-pythia-preshuffled

pietrolesci/smol_llama-minipile-evals

pietrolesci/minipile

pietrolesci/opus-5langs-1M

pietrolesci/opus-raw

pietrolesci/pythia-pile-stats

pietrolesci/slim-pajama-eval

pietrolesci/pile-subset

pietrolesci/cmnist

pietrolesci/pythia-deduped-stats

Pietro Lesci

AI & ML interests

Recent Activity

Organizations

Collections 7

Papers 5

spaces 1

Wordify

models 19 Sort: Recently updated

datasets 52 Sort: Recently updated

models 19

datasets 52