5 9 12

kong

royokong

AI & ML interests

None yet

Recent Activity

liked a Space 2 months ago

nanotron/ultrascale-playbook

upvoted a paper 3 months ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

liked a model 4 months ago

deepseek-ai/DeepSeek-V3-Base

View all activity

Organizations

None yet

royokong's activity

liked a Space 2 months ago

2.53k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

upvoted a paper 3 months ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 289

liked a model 4 months ago

deepseek-ai/DeepSeek-V3-Base

Updated Mar 27 • 6.3k • 1.64k

upvoted a paper 4 months ago

Apollo: An Exploration of Video Understanding in Large Multimodal Models

Paper • 2412.10360 • Published Dec 13, 2024 • 147

upvoted 2 papers 5 months ago

MH-MoE:Multi-Head Mixture-of-Experts

Paper • 2411.16205 • Published Nov 25, 2024 • 28

TÜLU 3: Pushing Frontiers in Open Language Model Post-Training

Paper • 2411.15124 • Published Nov 22, 2024 • 63

liked a dataset 6 months ago

lmms-lab/LLaVA-OneVision-Data

Viewer • Updated Oct 22, 2024 • 3.72M • 18.1k • 184

updated a model 6 months ago

royokong/e5-v

Image-Text-to-Text • Updated Oct 31, 2024 • 5.96k • 22

upvoted a paper 6 months ago

Your Mixture-of-Experts LLM Is Secretly an Embedding Model For Free

Paper • 2410.10814 • Published Oct 14, 2024 • 52

liked a dataset 6 months ago

liuhaotian/LLaVA-Pretrain

Preview • Updated Jul 6, 2023 • 1.95k • 176

updated a model 7 months ago

royokong/e5-v-2

Image-Text-to-Text • Updated Sep 30, 2024 • 2

updated a dataset 8 months ago

royokong/flickr30k_test

Viewer • Updated Aug 22, 2024 • 1k • 1.06k

New activity in royokong/flickr30k_test 8 months ago

Librarian Bot: Add language metadata for dataset

#1 opened 9 months ago by

librarian-bot

upvoted a paper 8 months ago

Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

Paper • 2408.11039 • Published Aug 20, 2024 • 61

upvoted a paper 9 months ago

E5-V: Universal Embeddings with Multimodal Large Language Models

Paper • 2407.12580 • Published Jul 17, 2024 • 41

updated 5 datasets 10 months ago