ollama modelfile 내용 공유 부탁드려도 괜찮을까요?

#1
by sucream - opened

안녕하세요. gguf 파일 감사합니다.

현재 ollama 0.1.32버전 도커 이미지를 사용하고 있고, 다음과 같이 modelfile을 작성 후 실행하면 cli에서 사용할 때도, api로 호출할 때도 응답이 끊이지 않는 것 같습니다...혹시 작성하신 modelfile이나 추가 정보를 공유 부탁드려도 괼까요?

FROM ./llama-3-8b-it-ko-chang-Q5_K_M.gguf

TEMPLATE """{{- if .System }}<|start_header_id|>system<|end_header_id|>
{{ .System }}
<|eot_id|>
{{- end }}

<|start_header_id|>B<|end_header_id|>
{{ .Prompt }}
<|eot_id|>
<|start_header_id|>A<|end_header_id|>
"""

PARAMETER stop "<|eot_id|>"
PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|begin_of_text|>"
PARAMETER stop "<|end_of_text|>"

아래 이미지는 cli에서 실행한 결과고 ctrl + c를 누르지 않으면 답변이 멈추지 않습니다...

image.png

그리고 혹시 다음 ollama 이슈와 관련된 사항이 있을까요?
https://github.com/ollama/ollama/issues/3759

감사합니다.

stop token 에 "B" 도 한 번 추가해 보시기 바랍니다~

그냥 "B"를 추가하면 답변에 B가 들어간 내용에서도 멈춰서 안되고 "B:"도 안되는 것 같네요...ㅎㅎ

앗 그런가요? 저는 LM Studio 에서 테스트 해봤는데요 문제없이 잘 동작했거든요 제가 LM Studio Template 을 업로드 해드릴께요. Template 참고하셔서 Ollama Template 으로 만드셔도 될 것 같습니다.

template 파일 repository 에 업데이트 해놓았습니다~

teddylee777 changed discussion status to closed

Sign up or log in to comment