Joshua Vendrow's picture

1 1 5

Joshua Vendrow

jvendrow

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 20 hours ago

Do Large Language Model Benchmarks Test Reliability?

liked a dataset 7 days ago

madrylab/gsm8k-platinum

new activity 9 days ago

madrylab/platinum-bench:Grammatical error in squad task 5ad2b72fd7d075001a42a022

View all activity

Organizations

jvendrow's activity

upvoted a paper about 20 hours ago

Do Large Language Model Benchmarks Test Reliability?

Paper • 2502.03461 • Published Feb 5 • 3