4 11 2

xxzcc

AI & ML interests

None yet

Recent Activity

updated a dataset 10 days ago

m-a-p/CodeCriticBench

upvoted a paper 12 days ago

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

upvoted a paper 12 days ago

A Comprehensive Survey on Long Context Language Modeling

View all activity

Organizations

xxzcc's activity

updated a dataset 10 days ago

m-a-p/CodeCriticBench

Preview • Updated 10 days ago • 158 • 3

upvoted 2 papers 12 days ago

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

Paper • 2503.18923 • Published 12 days ago • 12

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published 16 days ago • 48

liked a dataset about 1 month ago

waleko/SWE-bench-traceback

Viewer • Updated Apr 8, 2024 • 1.85k • 61 • 1

upvoted a paper about 1 month ago

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

Paper • 2502.16614 • Published Feb 23 • 26

published a dataset about 1 month ago

m-a-p/CodeCriticBench

Preview • Updated 10 days ago • 158 • 3

New activity in Qwen/Qwen2.5-Coder-32B-Instruct 3 months ago

请问你们qwq的prompt是什么？推理有什么特殊设置吗？我这边复现live-codebench只有35～38分。（live-code-bench-0801-1101）

#33 opened 3 months ago by

xxzcc

New activity in Qwen/QwQ-32B-Preview 3 months ago

请问你们qwq的prompt是什么？推理有什么特殊设置吗？我这边复现live-codebench只有35～38分。（live-code-bench-0801-1101）

#53 opened 3 months ago by

xxzcc

upvoted 3 papers 5 months ago

OmniEdit: Building Image Editing Generalist Models Through Specialist Supervision

Paper • 2411.07199 • Published Nov 11, 2024 • 49

Chinese SimpleQA: A Chinese Factuality Evaluation for Large Language Models

Paper • 2411.07140 • Published Nov 11, 2024 • 34

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published Nov 7, 2024 • 123

liked a Space 5 months ago

200

Hunyuan Large

💬

Hunyuan-Large模型体验

authored a paper 5 months ago

Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent

Paper • 2411.02265 • Published Nov 4, 2024 • 24

upvoted a paper 5 months ago

Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent

Paper • 2411.02265 • Published Nov 4, 2024 • 24

commented a paper 5 months ago

Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent

Paper • 2411.02265 • Published Nov 4, 2024 • 24 •

upvoted a paper 6 months ago

MTU-Bench: A Multi-granularity Tool-Use Benchmark for Large Language Models

Paper • 2410.11710 • Published Oct 15, 2024 • 20

upvoted a paper 9 months ago

DDK: Distilling Domain Knowledge for Efficient Large Language Models

Paper • 2407.16154 • Published Jul 23, 2024 • 22

commented a paper 9 months ago

DDK: Distilling Domain Knowledge for Efficient Large Language Models

Paper • 2407.16154 • Published Jul 23, 2024 • 22 •

upvoted a paper 9 months ago

LongIns: A Challenging Long-context Instruction-based Exam for LLMs

Paper • 2406.17588 • Published Jun 25, 2024 • 23

authored a paper 10 months ago

E^2-LLM: Efficient and Extreme Length Extension of Large Language Models

Paper • 2401.06951 • Published Jan 13, 2024 • 26

xxzcc

AI & ML interests

Recent Activity

Organizations

xxzcc's activity

请问你们qwq的prompt是什么？ 推理有什么特殊设置吗？我这边复现live-codebench只有35～38分。（live-code-bench-0801-1101）

请问你们qwq的prompt是什么？ 推理有什么特殊设置吗？我这边复现live-codebench只有35～38分。（live-code-bench-0801-1101）

Hunyuan Large

请问你们qwq的prompt是什么？推理有什么特殊设置吗？我这边复现live-codebench只有35～38分。（live-code-bench-0801-1101）

请问你们qwq的prompt是什么？推理有什么特殊设置吗？我这边复现live-codebench只有35～38分。（live-code-bench-0801-1101）