zhongyuan peng's picture

2 5 3

zhongyuan peng

happzy2633

·

Happzy-WHU

AI & ML interests

None yet

Recent Activity

liked a dataset about 1 month ago

m-a-p/SuperGPQA

authored a paper about 1 month ago

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

upvoted a paper about 2 months ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

View all activity

Organizations

happzy2633's activity

upvoted a paper about 2 months ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published Feb 20 • 100

upvoted a paper 5 months ago

Chinese SimpleQA: A Chinese Factuality Evaluation for Large Language Models

Paper • 2411.07140 • Published Nov 11, 2024 • 34

upvoted 2 papers 6 months ago

A Comparative Study on Reasoning Patterns of OpenAI's o1 Model

Paper • 2410.13639 • Published Oct 17, 2024 • 17

MTU-Bench: A Multi-granularity Tool-Use Benchmark for Large Language Models

Paper • 2410.11710 • Published Oct 15, 2024 • 20

upvoted a paper 7 months ago

FuzzCoder: Byte-level Fuzzing Test via Large Language Model

Paper • 2409.01944 • Published Sep 3, 2024 • 45