Ojasvi Singh Yadav

ojasvisingh786

AI & ML interests

Artificial Intelligence

Recent Activity

liked a model about 6 hours ago

stepfun-ai/Step-Audio-Chat

liked a Space about 8 hours ago

PeiqingYang/MatAnyone

liked a model about 13 hours ago

stepfun-ai/stepvideo-t2v-turbo

View all activity

Organizations

ojasvisingh786's activity

liked a model about 6 hours ago

stepfun-ai/Step-Audio-Chat

Audio-Text-to-Text • Updated about 7 hours ago • 2 • 121

liked a Space about 8 hours ago

MatAnyone

🤡

Gradio demo for MatAnyone

liked a model about 13 hours ago

stepfun-ai/stepvideo-t2v-turbo

Updated about 20 hours ago • 34

liked a model about 17 hours ago

stepfun-ai/stepvideo-t2v

Updated about 20 hours ago • 54 • 114

upvoted a paper about 17 hours ago

Step-Video-T2V Technical Report: The Practice, Challenges, and Future of Video Foundation Model

Paper • 2502.10248 • Published 3 days ago • 34

liked 2 Spaces about 18 hours ago

Audiobox Aesthetics

📚

Demo for audiobox-aesthetics

OmniParser V2

🏢

OmniParser, turn your LLM into GUI agent

upvoted an article 3 days ago

Article

Open-source DeepResearch – Freeing our search agents

14 days ago

• 1.01k

liked a Space 3 days ago

smolagents and tools gallery

🎨

liked a model 3 days ago

microsoft/OmniParser-v2.0

Image-Text-to-Text • Updated 4 days ago • 890 • 420

liked a Space 5 days ago

148

Agent Leaderboard

💬

Ranking of LLMs for agentic tasks

liked a Space 6 days ago

Mixture Of Diffusers SDXL Tiling

🚀

Mixture of Diffusers implementation for XL Stable Diffusion

liked a Space 7 days ago

Lumina Image 2.0

🖼

Generate images from text prompts

liked a dataset 8 days ago

saiyan-world/Goku-MovieGenBench

Viewer • Updated 7 days ago • 1k • 19k • 165

liked 3 Spaces 10 days ago

Prithvi 100M Multi Temporal Crop Classification Demo

📚

Upload images to classify crop types

VideoLLaMA3

💬

Frontier Foundation Models for Video Understanding

VideoLLaMA3-Image

💬

Frontier Foundation Models for Video Understanding

upvoted a paper 13 days ago

VideoJAM: Joint Appearance-Motion Representations for Enhanced Motion Generation in Video Models

Paper • 2502.02492 • Published 13 days ago • 55

liked a Space 19 days ago

526

Qwen2.5 Max Demo

🐢

Send messages for chatbot responses

liked a Space 21 days ago

1.77k

Chat With Janus-Pro-7B

🌍

A unified multimodal understanding and generation model.