Edit Models filters

Inference status

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

dataset:PKU-Alignment/PKU-SafeRLHF

4-bit precision

8-bit precision

Misc with no match

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

23

Full-text search

Active filters: PKU-Alignment/PKU-SafeRLHF

PKU-Alignment/beaver-7b-v1.0-reward

Reinforcement Learning • Updated Apr 20 • 177 • 16

NCSOFT/Llama-3-OffsetBias-RM-8B

Text Classification • Updated about 6 hours ago • 1.99k • 13

PKU-Alignment/beaver-7b-v1.0

Reinforcement Learning • Updated May 9 • 12 • 9

PKU-Alignment/beaver-7b-v1.0-cost

Reinforcement Learning • Updated Apr 20 • 3.04k • 8

chargoddard/servile-harpsichord-cdpo

Text Generation • Updated Dec 10, 2023 • 685

chargoddard/piano-medley-7b

Text Generation • Updated Jan 4 • 689 • 6

LLM360/AmberSafe

Text Generation • Updated Feb 7 • 112 • 5

MaziyarPanahi/piano-medley-7b-Mistral-7B-Instruct-v0.1

Text Generation • Updated Jan 17 • 17

MaziyarPanahi/piano-medley-7b-Mistral-7B-Instruct-v0.1-GGUF

Text Generation • Updated Jan 27 • 147

PKU-Alignment/beaver-7b-v2.0

Reinforcement Learning • Updated May 9 • 6

PKU-Alignment/beaver-7b-v2.0-reward

Reinforcement Learning • Updated Apr 20 • 18

PKU-Alignment/beaver-7b-v2.0-cost

Reinforcement Learning • Updated Apr 20 • 5

PKU-Alignment/beaver-7b-v3.0

Reinforcement Learning • Updated May 9 • 30

PKU-Alignment/beaver-7b-v3.0-reward

Reinforcement Learning • Updated Apr 20 • 10

PKU-Alignment/beaver-7b-v3.0-cost

Reinforcement Learning • Updated Apr 20 • 17

PKU-Alignment/beaver-7b-unified-reward

Reinforcement Learning • Updated Apr 20 • 316

PKU-Alignment/beaver-7b-unified-cost

Reinforcement Learning • Updated Apr 20 • 407 • 1

wxzhang/dpo-selective-alpaca

Text Generation • Updated Apr 23 • 5

xiaodongguaAIGC/xdg-llama-3-8B

Text Generation • Updated Jun 24 • 63 • 2

mradermacher/piano-medley-7b-GGUF

Updated Jun 4 • 137

mradermacher/piano-medley-7b-i1-GGUF

Updated Aug 2 • 201

NCSOFT/Llama-3-OffsetBias-8B

Text2Text Generation • Updated Jul 23 • 188 • 9

mradermacher/Llama-3-OffsetBias-8B-GGUF

Text2Text Generation • Updated Jul 22 • 131 • 1