le.zhang's picture

4 3 5

le.zhang

le723z

·

Magiccircuit

AI & ML interests

None yet

Recent Activity

updated a dataset 1 day ago

le723z/Vision-Reasoning-QA

published a dataset 1 day ago

le723z/Vision-Reasoning-QA

liked a dataset 2 days ago

di-zhang-fdu/R1-Vision-Reasoning-Instructions

View all activity

Organizations

None yet

le723z's activity

upvoted an article 8 months ago

Article

LAVE: Zero-shot VQA Evaluation on Docmatix with LLMs - Do We Still Need Fine-Tuning?

Jul 25, 2024

• 17

upvoted a paper 12 months ago

Improving Text-to-Image Consistency via Automatic Prompt Optimization

Paper • 2403.17804 • Published Mar 26, 2024 • 18

upvoted a paper over 1 year ago

Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding

Paper • 2306.02858 • Published Jun 5, 2023 • 19