Preference Optimization - a lv12 Collection

Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

lv12 's Collections

Representation Learning

Preference Optimization

Information Retrieval

Preference Optimization

updated Jun 14

x

A Roadmap to Pluralistic Alignment

Paper • 2402.05070 • Published Feb 7
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 144
SakanaAI/DiscoPOP-zephyr-7b-gemma

Text Generation • Updated Jun 13 • 5.99k • 36

Collection guide
Browse collections

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs