50 13 127

Nathan Lambert

natolambert

https://www.natolambert.com/

natolambert

AI & ML interests

Reinforcement learning, Ethics, Robotics, Dynamics Models

Articles

Organizations

natolambert's activity

liked a model 2 days ago

common-canvas/CommonCanvas-XL-C

Text-to-Image • Updated 2 days ago • 334 • 12

liked 2 models 3 days ago

deepseek-ai/DeepSeek-V2-Lite

Text Generation • Updated 2 days ago • 169 • 25

prometheus-eval/prometheus-8x7b-v2.0

Text2Text Generation • Updated 16 days ago • 579 • 32

liked a model 5 days ago

google/paligemma-3b-pt-896

Image-Text-to-Text • Updated 2 days ago • 3.5k • 65

liked 2 models 6 days ago

chuxin-llm/Chuxin-1.6B-Base

Text Generation • Updated 11 days ago • 84 • 13

tiiuae/falcon-11B

Text Generation • Updated 5 days ago • 16.9k • 130

liked a model 9 days ago

google/timesfm-1.0-200m

Time Series Forecasting • Updated 2 days ago • 779 • 435

liked a dataset 9 days ago

allenai/WildChat-1M

Viewer • Updated 16 days ago • 883 • 217

liked 3 models 9 days ago

refuelai/Llama-3-Refueled

Text Generation • Updated 10 days ago • 2.7k • 167

RLHFlow/pair-preference-model-LLaMA3-8B

Text Generation • Updated 2 days ago • 523 • 7

Salesforce/xgen-mm-phi3-mini-instruct-r-v1

Image-Text-to-Text • Updated 7 days ago • 2.51k • 113

liked a dataset 10 days ago

H-D-T/Buzz

Viewer • Updated 10 days ago • 306 • 142

liked a model 13 days ago

deepseek-ai/DeepSeek-V2

Text Generation • Updated 10 days ago • 14.4k • 196

liked a model 16 days ago

nvidia/Llama3-ChatQA-1.5-70B

Text Generation • Updated 2 days ago • 3.88k • 252

liked a dataset 16 days ago

lmsys/lmsys-arena-human-preference-55k

Viewer • Updated 3 days ago • 708 • 62

liked a model 16 days ago

prometheus-eval/prometheus-7b-v2.0

Text2Text Generation • Updated 16 days ago • 4.69k • 40

liked a space 20 days ago

Running

171

📈

Snowflake Arctic St Demo

liked a dataset 21 days ago

coseal/CodeUltraFeedback

Viewer • Updated Mar 15 • 8 • 20

liked a model 23 days ago

Qwen/Qwen1.5-110B

Text Generation • Updated 23 days ago • 5.49k • 75

liked a dataset 24 days ago

HannahRoseKirk/prism-alignment

Viewer • Updated 24 days ago • 429 • 23

liked a dataset 25 days ago

allenai/tulu-v2-sft-mixture-olmo-2048

Viewer • Updated 26 days ago • 1

liked a model 25 days ago

Snowflake/snowflake-arctic-instruct

Text Generation • Updated 5 days ago • 44k • 325

liked a space 26 days ago

Running on CPU Upgrade

784

🌟

C4AI Command R Plus

liked 2 models 27 days ago

jat-project/jat

Reinforcement Learning • Updated 20 days ago • 1.04k • 73

sfairXC/FsfairX-LLaMA3-RM-v0.1

Text Classification • Updated 25 days ago • 4.12k • 15

liked a space 29 days ago

Running

240

🏃

Qwen1.5 110B Chat Demo

liked a dataset about 1 month ago

PleIAs/YouTube-Commons

Viewer • Updated Apr 18 • 752 • 271

liked a model about 1 month ago

CarperAI/stable-vicuna-13b-delta

Text Generation • Updated May 19, 2023 • 752 • 458

liked a dataset about 1 month ago

gretelai/synthetic_text_to_sql

Viewer • Updated 9 days ago • 5.09k • 309

liked 7 models about 1 month ago

allenai/OLMo-1.7-7B

Text Generation • Updated about 1 month ago • 327 • 37

Qwen/CodeQwen1.5-7B

Text Generation • Updated 6 days ago • 7.52k • 56

young-geng/koala

Updated Apr 6, 2023 • 75

HuggingFaceH4/zephyr-orpo-141b-A35b-v0.1

Text Generation • Updated Apr 18 • 1.77k • 230

mrfakename/mixtral-8x22b

Updated Apr 10 • 9

mightbe/Better-PairRM

Updated 28 days ago • 277 • 10

google/recurrentgemma-2b

Text Generation • Updated 26 days ago • 9.3k • 87

liked a space about 1 month ago

Running on Zero

📉

StableLM 2 12B Chat

liked 4 models about 1 month ago

jondurbin/bagel-dpo-34b-v0.5

Text Generation • Updated Apr 17 • 1.95k • 15

stabilityai/stablelm-2-12b

Text Generation • Updated about 1 month ago • 8.87k • 99

stabilityai/stablelm-2-12b-chat

Text Generation • Updated 3 days ago • 5.67k • 73

CohereForAI/c4ai-command-r-plus

Text Generation • Updated Apr 10 • 24.8k • 1.38k

liked a dataset about 1 month ago

Hello-SimpleAI/HC3

Viewer • Updated Jan 21, 2023 • 6.28k • 167

liked 2 models about 1 month ago

jetmoe/jetmoe-8b

Text Generation • Updated Apr 15 • 1.4k • 244

openbmb/Eurus-RM-7b

Text Classification • Updated 5 days ago • 5.08k • 20

liked a space about 2 months ago

Running

2.98k

🏆🤖

LMSys Chatbot Arena Leaderboard

liked a dataset about 2 months ago

allenai/reward-bench-results

Updated about 4 hours ago • 2 • 2

liked a space about 2 months ago

Running

608

🧱

DBRX Instruct

liked 6 models about 2 months ago

mistral-community/Mistral-7B-v0.2

Text Generation • Updated Apr 16 • 47.3k • 221

Nexusflow/Starling-RM-34B

Updated Apr 3 • 2.92k • 69

weqweasdas/RM-Gemma-7B

Text Classification • Updated Mar 22 • 143 • 6

Ray2333/reward-model-Mistral-7B-instruct-Unified-Feedback

Text Classification • Updated Mar 23 • 1.28k • 10

HuggingFaceH4/starchat2-15b-v0.1

Text Generation • Updated Mar 13 • 4.68k • 88

Nexusflow/Starling-LM-7B-beta

Text Generation • Updated Apr 3 • 19.9k • 314

liked a dataset 2 months ago

allenai/reward-bench

Viewer • Updated 6 days ago • 4.29k • 39

liked a space 2 months ago

Running

102

📐

Reward Bench Leaderboard

liked a model 2 months ago

CohereForAI/c4ai-command-r-v01

Text Generation • Updated Apr 10 • 41k • 997

liked a space 2 months ago

Running

116

🦁

AI2 WildBench Leaderboard

liked 3 models 3 months ago

vikhyatk/moondream2

Image-Text-to-Text • Updated 10 days ago • 119k • 406

HuggingFaceH4/zephyr-7b-gemma-sft-v0.1

Text Generation • Updated Mar 1 • 7.56k • 12

allenai/OLMo-7B-Instruct

Text Generation • Updated 24 days ago • 25.1k • 44

Nathan Lambert

AI & ML interests

Articles

Ethics and Society Newsletter #4: Bias in Text-to-Image Models

Can foundation models label data like humans?

Creating a Coding Assistant with StarCoder

StackLLaMA: A hands-on guide to train LLaMA with RLHF

Red-Teaming Large Language Models

What Makes a Dialog Agent Useful?

Illustrating Reinforcement Learning from Human Feedback (RLHF)

Stable Diffusion with 🧨 Diffusers

Organizations

natolambert's activity

Snowflake Arctic St Demo

C4AI Command R Plus

Qwen1.5 110B Chat Demo

StableLM 2 12B Chat

LMSys Chatbot Arena Leaderboard

DBRX Instruct

Reward Bench Leaderboard

AI2 WildBench Leaderboard