학습 데이터 관련 문의드립니다.

#1
by hy18284maum - opened

안녕하세요?

유용한 모델 공유해 주셔서 감사합니다. 혹시 해당 모델 학습에 사용된 데이터에 대해 알 수 있을까요?
예시 샘플 혹은 학습 데이터에 대한 간략한 통계를 알 수 있으면 사용에 도움이 될 것 같아 문의드려 봅니다.

감사합니다.

안녕하세요. 관심 가져주셔서 감사합니다!

모델 학습에 사용된 데이터는 https://huggingface.co/datasets/lemon-mint/korean-reasoning-v02 데이터셋입니다.

해당 데이터셋으로 full finetune 방식으로 2 epochs 학습을 진행했습니다.

다만, 데이터셋 크기나 다양성, 그리고 추론 길이 측면에서 부족하다고 판단하여, 현재 추가 데이터를 활용하여 성능을 더욱 향상시킨 모델을 제작할 예정입니다.

상세한 답변 감사드립니다. 많은 도움이 되었습니다.

lemon-mint changed discussion status to closed

Sign up or log in to comment