llama-2-7b-chat-hf 를 주문 문장 이해에 미세 튜닝
-> 영화 리뷰에 관한 평가(데이터셋 : nsmc 사용)를 긍정 부정으로 분류(실제, 예측 비교)


## 테스트 데이터에 대한 분류 결과 리포트

@ **모델 평가 결과**

정확도 : 0.866

정밀도 : 0.874

재현율 : 0.8602

F1 점수 : 0.8670

Result Matrix

  |  | TP | TN |
|----------|----------|----------|
| PP | 437 | 63 |
| PN | 71 | 429 |


@ **결과 분석**

정확도는 0.866으로 나타났다.

그 중에서 실제 정답은 긍정이지만 부정으로 예측하는 수(71)가 실제 부정인데 예측 긍정(63)으로 판단하는 경우보다 더 많았다.