Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Shijun Dai's picture

16

Shijun Dai

Shijund

Daishijun

AI & ML interests

None yet

Organizations

None yet

Collections 2

WARM: On the Benefits of Weight Averaged Reward Models

Paper • 2401.12187 • Published Jan 22 • 17
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 143
Secrets of RLHF in Large Language Models Part II: Reward Modeling

Paper • 2401.06080 • Published Jan 11 • 25

Transformers are Multi-State RNNs

Paper • 2401.06104 • Published Jan 11 • 35

models

None public yet

datasets

None public yet

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs