63 71 61

Ge Zhang

zhangysk

AI & ML interests

None yet

Recent Activity

upvoted a paper about 7 hours ago

Efficient Pretraining Length Scaling

commented on a paper about 7 hours ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

upvoted a paper about 7 hours ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

View all activity

Organizations

zhangysk's activity

upvoted a paper about 7 hours ago

Efficient Pretraining Length Scaling

Paper • 2504.14992 • Published 2 days ago • 12

commented a paper about 7 hours ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

Paper • 2504.15415 • Published 1 day ago • 15 •

upvoted a paper about 7 hours ago

IV-Bench: A Benchmark for Image-Grounded Video Perception and Reasoning in Multimodal LLMs

Paper • 2504.15415 • Published 1 day ago • 15

authored a paper 6 days ago

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

Paper • 2504.11536 • Published 8 days ago • 56

upvoted a paper 6 days ago

ReTool: Reinforcement Learning for Strategic Tool Use in LLMs

Paper • 2504.11536 • Published 8 days ago • 56

upvoted 3 papers 9 days ago

upvoted a paper 10 days ago

COIG-P: A High-Quality and Large-Scale Chinese Preference Dataset for Alignment with Human Values

Paper • 2504.05535 • Published 15 days ago • 44

authored a paper 14 days ago

COIG-P: A High-Quality and Large-Scale Chinese Preference Dataset for Alignment with Human Values

Paper • 2504.05535 • Published 15 days ago • 44

liked a dataset 14 days ago

m-a-p/COIG-P

Viewer • Updated 8 days ago • 1.01M • 634 • 16

upvoted 2 papers 22 days ago

MoCha: Towards Movie-Grade Talking Character Synthesis

Paper • 2503.23307 • Published 24 days ago • 128

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published 26 days ago • 43

liked a dataset 26 days ago

m-a-p/PIN-100M

Viewer • Updated about 5 hours ago • 68.1k • 66.8k • 10

upvoted a paper 26 days ago

Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models

Paper • 2503.21380 • Published 27 days ago • 37

liked a dataset 26 days ago

RUC-AIBOX/OlymMATH

Viewer • Updated 26 days ago • 400 • 2.7k • 7

authored a paper 29 days ago

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

Paper • 2503.18923 • Published 30 days ago • 12

upvoted a paper 29 days ago

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

Paper • 2503.18923 • Published 30 days ago • 12

commented a paper 29 days ago

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

Paper • 2503.18923 • Published 30 days ago • 12 •

liked a model 29 days ago

deepseek-ai/DeepSeek-V3-0324

Text Generation • Updated 27 days ago • 249k • • 2.72k