Tanish Gupta's picture

Tanish Gupta

gupta-tanish

AI & ML interests

None yet

Recent Activity

updated a dataset 4 days ago

gupta-tanish/Ultrafeedback-mistral-7b-instruct-v0.2-2vs2

published a dataset 4 days ago

gupta-tanish/Ultrafeedback-mistral-7b-instruct-v0.2-2vs2

updated a dataset 5 days ago

gupta-tanish/verified-q-alignment-1vs3

View all activity

Organizations

None yet

models 6

gupta-tanish/llama3-8b-instruct-on-policy-swepo-1vsk-iteration1

Updated 14 days ago • 105

gupta-tanish/llama3.1-8b-instruct-qfa-grpo-v1

Text Generation • Updated 28 days ago • 336

gupta-tanish/llama3.1-8b-instruct-qfa-grpo

Updated 29 days ago • 28

gupta-tanish/mistral-ddo-alignment-iteration1

Updated Feb 24 • 3

gupta-tanish/llama-7b-dpo-baseline

Text Generation • Updated Sep 29, 2024 • 6

gupta-tanish/train_llama-7b-instruct_dpo_baseline

Updated Sep 29, 2024

datasets 80

gupta-tanish/Ultrafeedback-mistral-7b-instruct-v0.2-2vs2

Viewer • Updated 4 days ago • 62.7k • 12

gupta-tanish/verified-q-alignment-1vs3

Viewer • Updated 5 days ago • 2.53k • 18

gupta-tanish/Ultrafeedback-llama3-8b-instruct-1vs3-selection-swepo-on-policy-iteration2

Viewer • Updated 12 days ago • 63.1k • 23

gupta-tanish/Ultrafeedback-llama3-8b-Instruct-optimal-selection-1vs7_total_responses_24

Viewer • Updated 12 days ago • 60.8k • 21

gupta-tanish/Ultrafeedback-llama3-8b-Instruct-optimal-selection-1vs7_total_responses_16

Viewer • Updated 12 days ago • 60.8k • 22

gupta-tanish/Ultrafeedback-mistral-7b-instruct-v0.2-1vs3-optimal-selection

Viewer • Updated 13 days ago • 62.2k • 25

gupta-tanish/Ultrafeedback-mistral-7b-instruct-1vs3-kmeans-selection

Viewer • Updated 13 days ago • 62.2k • 25

gupta-tanish/Ultrafeedback-llama3-8b-instruct-1vs3-optimal-selection

Viewer • Updated 14 days ago • 62.2k • 30

gupta-tanish/Ultrafeedback-llama3-8b-instruct-1vs3-kmeans-selection

Viewer • Updated 14 days ago • 62.2k • 41

gupta-tanish/Ultrafeedback-mistral-7b-instruct-v0.2-1vs3-simpo-selection

Viewer • Updated 14 days ago • 62.7k • 39