llama-2-7b-chat-hf 를 주문 문장 이해에 미세 튜닝 -> 영화 리뷰에 관한 평가(데이터셋 : nsmc 사용)를 긍정 부정으로 분류(실제, 예측 비교) ## 테스트 데이터에 대한 분류 결과 리포트 @ **모델 평가 결과** 정확도 : 0.866 정밀도 : 0.874 재현율 : 0.8602 F1 점수 : 0.8670 Result Matrix | | TP | TN | |----------|----------|----------| | PP | 437 | 63 | | PN | 71 | 429 | @ **결과 분석** 정확도는 0.866으로 나타났다. 그 중에서 실제 정답은 긍정이지만 부정으로 예측하는 수(71)가 실제 부정인데 예측 긍정(63)으로 판단하는 경우보다 더 많았다.