1 20 56

gerald hewes

gerald29

AI & ML interests

None yet

Recent Activity

liked a Space 14 days ago

TencentARC/NVComposer

upvoted a paper 14 days ago

PaliGemma 2: A Family of Versatile VLMs for Transfer

upvoted a collection 14 days ago

PaliGemma 2 Release

View all activity

Organizations

None yet

gerald29's activity

upvoted a paper 14 days ago

PaliGemma 2: A Family of Versatile VLMs for Transfer

Paper • 2412.03555 • Published 15 days ago • 117

upvoted a collection 14 days ago

PaliGemma 2 Release

Collection

Vision-Language Models available in multiple 3B, 10B and 28B variants. • 23 items • Updated 6 days ago • 117

upvoted a paper 14 days ago

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

Paper • 2412.04424 • Published 14 days ago • 54

upvoted a collection 15 days ago

🤖 Agents

Collection

21 items • Updated 9 days ago • 57

upvoted a paper 21 days ago

CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models

Paper • 2411.18613 • Published 22 days ago • 50

upvoted 2 papers about 1 month ago

A Case Study of Web App Coding with OpenAI Reasoning Models

Paper • 2409.13773 • Published Sep 19 • 5

Adaptive Caching for Faster Video Generation with Diffusion Transformers

Paper • 2411.02397 • Published Nov 4 • 23

upvoted a collection about 2 months ago

LongVU

Collection

7 items • Updated Oct 31 • 27

upvoted 2 papers about 2 months ago

Framer: Interactive Frame Interpolation

Paper • 2410.18978 • Published Oct 24 • 36

STaR: Bootstrapping Reasoning With Reasoning

Paper • 2203.14465 • Published Mar 28, 2022 • 8

upvoted 3 papers 3 months ago

upvoted a collection 3 months ago

Molmo

Collection

Artifacts for open multimodal language models. • 5 items • Updated 22 days ago • 288

upvoted a paper 3 months ago

Improve Mathematical Reasoning in Language Models by Automated Process Supervision

Paper • 2406.06592 • Published Jun 5 • 26

upvoted a collection 3 months ago

LLM Reasoning Papers

Collection

Papers to improve reasoning capabilities of LLMs • 16 items • Updated 8 days ago • 87

upvoted a paper 4 months ago

xGen-MM (BLIP-3): A Family of Open Large Multimodal Models

Paper • 2408.08872 • Published Aug 16 • 98

upvoted a paper 5 months ago

SparseCraft: Few-Shot Neural Reconstruction through Stereopsis Guided Geometric Linearization

Paper • 2407.14257 • Published Jul 19 • 5

upvoted a paper 6 months ago

Scaling Synthetic Data Creation with 1,000,000,000 Personas

Paper • 2406.20094 • Published Jun 28 • 95