모델들 관련 점검이 필요합니다.

#40
by DopeorNope - opened

우선 full fine-tuning이랑, pretrain이랑 구분도 안되어 있고.
fine-tuning한것이 pretrain으로 올라오는데, 이런것에 대해서 명확하게 걸러줬으면 좋겠습니다.

특히, full-fine-tuning(가중치초기화 하지 않고 그대로 이어서 몇개 레이어만 unfreeze한다음 훈련시킨)모델들이 pre-train으로 올라오는데, pre-train 모델을 새로 개발하고 있는 입장에서, 드는 리소스의 차이는 무궁무진하게 차이가 엄청 큰데.

이런것들에 확실하지 않고 남발하듯이 질서가 더럽혀지는것에 대해서, 오픈소스의 발전에 기여하고 큰 노력을 하고 있는 입장에서는 이런 것들이 빠르게 질서가 잡히고 개선이 되어야 한다고 생각합니다.

감사합니다!

제출한 제 모델은 처음에 instruct 로 제출을 했는데 누군가 다른 revision으로 pre-train이라고 제출을 해서 리더보드 상에서 태그가 pre-train으로 변경되었습니다.
모델이 오픈되어 있어 아무나 다시 제출하면 모델 태그를 변경 가능한 상황이라 좀 당황스럽네요.

upstage org

@krevas 어떤 모델명인지 알 수 있을까요?

@choco9966 LDCC/LDCC-SOLAR-10.7B 모델입니다.

@krevas 네 저도 그와관련해서 확인을 했었는데, 바뀐것에 대해서 무엇인가 잘못되었다고 생각되었는데 그런일이 있었군요..! 이런 점들에 대해서도 문제가 되지 않도록 질서가 잡혔으면 좋겠네요!

@choco9966 또한, 지금 full-finetuning과 pre-train도 구분이 조금 안되어 있어서요 이런것들도 조금 구별할 수 있게 업데이트가 되면 좋겠습니다..!

Sign up or log in to comment