AWQ Quantization from Bllossom, Meta llama-3-70b full-finetuned by Korean dataset
vLLM, Paged Attention

Query

instruction = '파이썬 merge sort 코드를 제시해줘'

messages = [

    {
      "role": "system",
      "content": "당신은 훌륭한 AI 비서입니다. 짧은 답변을 제시하고, 다음으로 상세 설명을 해주세요. You are a great AI assistant. Give a short answer, then elaborate. "
    },
    {
      "role": "user",
      "content": instruction
    }, 
]

prompt_message = tokenizer.apply_chat_template(
        messages, 
        tokenize=False, 
        add_generation_prompt=True,
)

eos_token_id = [tokenizer.eos_token_id, tokenizer.convert_tokens_to_ids("<|eot_id|>")]

outputs = llm.generate(prompt_message, SamplingParams(stop_token_ids=eos_token_id, temperature=0.8, top_p=0.95,max_tokens=512))

for output in outputs:
    propt = output.prompt
    generated_text = output.outputs[0].text
    print(generated_text)

Result

다음은 파이썬으로 구현된 머지 소트 코드입니다.

```python
def merge_sort(arr):
    if len(arr) <= 1:
        return arr

    mid = len(arr) // 2
    left = arr[:mid]
    right = arr[mid:]

    return merge(merge_sort(left), merge_sort(right))

def merge(left, right):
    result = []
    i = 0
    j = 0

    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    result += left[i:]
    result += right[j:]

    return result

arr = [5, 2, 8, 12, 3]
result = merge_sort(arr)
print(result)
```

이 코드는 재귀적으로 리스트를 반으로 자른 뒤, 각각의 반을 다시 재귀적으로 자르고, 최종적으로 두 개의 하위 리스트가 됩니다. 그런 다음 `merge()` 함수를 이용해 이 두 개의 하위 리스트를 정렬하여 합칩니다. 최종적으로 `result` 리스트에 정렬된 배열이 저장됩니다.