Korean Reward Modeling - a heegyu Collection

heegyu 's Collections

R1-like Datasets

Korean Reward Modeling

Korean Pretraining Dataset

Datasets Translated to Korean

Synthetic Dataset

Reward Modeling Datasets

Pre-training Dataset

Image Generation

Domain Specific (Math, Code, etc)

Machine Translation

Korean Reward Modeling

updated Nov 19, 2024

Korean Datasets, Reward Models for RLHF

heegyu/KoSafeGuard-8b-0503

Text Generation • Updated Oct 25, 2024 • 112 • 5
heegyu/ko-reward-model-helpful-1.3b-v0.2

Text Classification • Updated Jan 10, 2024 • 17
heegyu/ko-reward-model-safety-1.3b-v0.2

Text Classification • Updated Jan 13, 2024 • 14 • 5
heegyu/ko-reward-model-helpful-roberta-large-v0.1

Text Classification • Updated Dec 31, 2023 • 114 • 1
heegyu/ko-reward-model-safety-roberta-large-v0.1

Text Classification • Updated Dec 31, 2023 • 102
heegyu/ko-reward-model-1.3b-v0.1

Text Classification • Updated Dec 7, 2023 • 18 • 1
heegyu/ko-reward-model-1.3b-v0

Text Classification • Updated Dec 1, 2023 • 20 • 1
heegyu/ko-ultrafeedback-binarized-1.3b

Text Classification • Updated Nov 27, 2023 • 11 • 2
maywell/ko_Ultrafeedback_binarized

Viewer • Updated Nov 9, 2023 • 62k • 200 • 31
maywell/ko_hh-rlhf-20k_filtered

Viewer • Updated Nov 4, 2023 • 19.4k • 119 • 4
heegyu/hh-rlhf-ko

Viewer • Updated Dec 24, 2023 • 169k • 202 • 3
heegyu/PKU-SafeRLHF-ko

Viewer • Updated Dec 31, 2023 • 320k • 161 • 4
heegyu/webgpt_comparisons_ko

Viewer • Updated Dec 5, 2023 • 19.6k • 37 • 2
SJ-Donald/orca-dpo-pairs-ko

Viewer • Updated Jan 24, 2024 • 36k • 93 • 9