파인튜닝 템플릿 질문 드립니다.

#3
by oosij - opened

안녕하세요.
우선 다양한 모델을 배포해주시는 것에 감사인사 드립니다.

다름이 아니라 llama 2 를 시작으로 파인튜닝 관련 진행 중, 타 모델도 파인튜닝하면서 개인적인 공부 중이었는데, 해당 모델에 대해서 학습이 원활하게 되지 않아서 질문 드립니다 .

제가 학습하려는 템플릿은
(싱글턴)
[INST] {query}
[/INST] {output}

(멀티턴)
[INST] {query}
[/INST] {output}

[INST] {query}
[/INST] {output}

이런 식으로 진행하는데, 잘 안되서 혹시 제 방식이 틀린건지 도움 요청드립니다.

llama 2 경우는,
{system}

명령어 :

{query}

응답 :

{output}

이런 식으로 했고, 잘 진행되었습니다만, 모델마다 instruction template가 다른 것 같고, 맞다고 생각한 부분 (위의 INST 방식) 을 진행해도 잘되지 않아
문의드립니다.

query 부분은 instruction 과 input 에 해당하는 부분을 같이 넣었습니다. (싱글/멀티를 제외한 다른 task)
예 ) 이 문서 요약해줘. # instruction

문서 내용 ~ # input

Owner

템플릿은 아마 chatml 템플릿을 사용했을겁니다.
문제가 발생하는 이유는 단순 템플릿 이슈는 아닌것같고 지금 업로드 된 모델이 심하게 under-fit 된 상태라서, 원하시는 출력이 안나오는 것 같습니다.
다른 모델로 시도 하시는 걸 추천드립니다.

답변 감사합니다...

maywell changed discussion status to closed

Sign up or log in to comment