Gabriele Sarti's picture

Gabriele Sarti

gsarti

·

https://gsarti.com

AI & ML interests

Interpretability for generative language models

Recent Activity

liked a dataset 5 days ago

Realmbird/nla-thought-anchors-answer-rollouts

updated a collection 11 days ago

🔍 Interpretability & Analysis of LMs

upvoted a paper 11 days ago

Faithfulness Metrics Don't Measure Faithfulness: A Meta-Evaluation with Ground Truth

View all activity

Organizations

gsarti 's papers 18

arxiv:2602.20021

arxiv:2602.08964

arxiv:2505.23183

arxiv:2505.16612

arxiv:2503.03044

arxiv:2408.00584

arxiv:2406.17563

arxiv:2406.13663

arxiv:2405.00208

arxiv:2310.03686

arxiv:2310.01188

arxiv:2305.17131

arxiv:2302.14220

arxiv:2302.13942

arxiv:2205.12215

arxiv:2203.03759

arxiv:2108.08688

arxiv:2008.10875