Spaces:

cocoS2
/

review-analyzer

Sleeping

review-analyzer / app.py

YeongMin

분석 초기화 버튼 제거

e018f90 27 days ago

42.8 kB

	# -- coding: utf-8 --
	"""
	리뷰 자동 검수 서비스
	Hugging Face의 Zero-Shot Classification 모델을 사용하여 리뷰를 3단계로 분석합니다.

	분석 단계:
	1. 감정 분석: 긍정 / 중립 / 부정
	2. 카테고리 분석: 배송 / 품질 / 사이즈 / 교환 / 서비스 등
	3. 리뷰 톤 탐지: 불만 / 욕설 / 허위후기 / 광고 등
	"""

	from transformers import pipeline
	import json
	from typing import List, Dict, Tuple
	from datetime import datetime
	import gradio as gr


	class ReviewAnalyzer:
	"""리뷰를 3단계로 분석하는 클래스

	1. 감정 분석: 긍정 / 중립 / 부정
	2. 카테고리 분석: 배송 / 품질 / 사이즈 / 교환 / 서비스 등
	3. 리뷰 톤 탐지: 불만 / 욕설 / 허위후기 / 광고 등
	"""

	def __init__(self):
	"""Zero-Shot Classification 파이프라인 초기화"""
	print("모델 로딩 중...")
	# 한국어를 잘 이해하는 multilingual 모델 사용
	self.classifier = pipeline(
	"zero-shot-classification",
	model="MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7"
	)

	# 1단계: 감정 분석 (개선된 프롬프트 - 구체적 예시 포함)
	self.sentiment_categories = [
	"이 리뷰는 제품이나 서비스에 만족하며 좋아하고 추천하는 긍정적인 감정을 표현합니다. 예: 좋아요, 만족, 추천, 훌륭, 최고, 감사, 마음에 들어요",
	"이 리뷰는 제품이나 서비스에 대해 중립적이고 객관적으로 사실이나 상태만을 나열하며 특별한 감정 표현이 없습니다. 예: 그냥 그래요, 보통, 무난, 평범",
	"이 리뷰는 제품이나 서비스에 실망하고 불만족스러운 부정적인 감정을 표현합니다. 예: 별로, 실망, 불만족, 최악, 화남, 후회, 환불"
	]

	self.sentiment_mapping = {
	"이 리뷰는 제품이나 서비스에 만족하며 좋아하고 추천하는 긍정적인 감정을 표현합니다. 예: 좋아요, 만족, 추천, 훌륭, 최고, 감사, 마음에 들어요": "긍정",
	"이 리뷰는 제품이나 서비스에 대해 중립적이고 객관적으로 사실이나 상태만을 나열하며 특별한 감정 표현이 없습니다. 예: 그냥 그래요, 보통, 무난, 평범": "중립",
	"이 리뷰는 제품이나 서비스에 실망하고 불만족스러운 부정적인 감정을 표현합니다. 예: 별로, 실망, 불만족, 최악, 화남, 후회, 환불": "부정"
	}

	# 2단계: 카테고리 분석 (개선된 프롬프트)
	self.topic_categories = [
	"이 리뷰는 배송과 관련된 내용을 언급합니다. 예: 배송 빠름, 배송 늦음, 포장 상태, 택배, 도착, 파손",
	"이 리뷰는 제품 품질 또는 디자인과 관련된 내용을 언급합니다. 예: 재질, 내구성, 완성도, 품질 좋음, 품질 나쁨, 튼튼, 약함, 디자인, 색상, 외관, 예쁨, 스타일, 모양, 색깔",
	"이 리뷰는 제품 사이즈와 관련된 내용을 언급합니다. 예: 크기, 사이즈, 핏, 작음, 큼, 딱 맞음, 치수",
	"이 리뷰는 교환/환불과 관련된 내용을 언급합니다. 예: 교환, 환불, 반품, 환불 신청, 교환 절차",
	"이 리뷰는 고객 서비스와 관련된 내용을 언급합니다. 예: 고객센터, 응대, 상담, A/S, 친절, 불친절",
	"이 리뷰는 가격과 관련된 내용을 언급합니다. 예: 가격, 가성비, 비쌈, 저렴, 할인, 비용, 돈",
	"이 리뷰는 제품 기능/성능과 관련된 내용을 언급합니다. 예: 기능, 성능, 작동, 효과, 사용감, 편리함"
	]

	self.topic_mapping = {
	"이 리뷰는 배송과 관련된 내용을 언급합니다. 예: 배송 빠름, 배송 늦음, 포장 상태, 택배, 도착, 파손": "배송",
	"이 리뷰는 제품 품질 또는 디자인과 관련된 내용을 언급합니다. 예: 재질, 내구성, 완성도, 품질 좋음, 품질 나쁨, 튼튼, 약함, 디자인, 색상, 외관, 예쁨, 스타일, 모양, 색깔": "품질/디자인",
	"이 리뷰는 제품 사이즈와 관련된 내용을 언급합니다. 예: 크기, 사이즈, 핏, 작음, 큼, 딱 맞음, 치수": "사이즈",
	"이 리뷰는 교환/환불과 관련된 내용을 언급합니다. 예: 교환, 환불, 반품, 환불 신청, 교환 절차": "교환/환불",
	"이 리뷰는 고객 서비스와 관련된 내용을 언급합니다. 예: 고객센터, 응대, 상담, A/S, 친절, 불친절": "서비스",
	"이 리뷰는 가격과 관련된 내용을 언급합니다. 예: 가격, 가성비, 비쌈, 저렴, 할인, 비용, 돈": "가격",
	"이 리뷰는 제품 기능/성능과 관련된 내용을 언급합니다. 예: 기능, 성능, 작동, 효과, 사용감, 편리함": "기능/성능"
	}

	# 3단계: 리뷰 톤 탐지 (개선된 프롬프트 - 일반 우선)
	self.tone_categories = [
	"이 리뷰는 제품에 대한 솔직한 감상과 평가를 담고 있으며, 긍정적이든 부정적이든 진실된 사용 경험을 공유합니다",
	"이 리뷰는 제품의 결함, 배송지연, 서비스 문제 등 명백한 불만사항을 언급하며 부정적인 경험을 표현합니다",
	"이 리뷰는 텔레그램, 카카오톡 등 메신저 아이디(@로 시작), 전화번호, 이메일 같은 연락처를 포함하거나, '연락주세요', '도매가', '반값', '할인', '쿠폰' 등으로 다른 판매처나 거래를 유도하는 명백한 광고/스팸 내용입니다"
	]

	self.tone_mapping = {
	"이 리뷰는 제품에 대한 솔직한 감상과 평가를 담고 있으며, 긍정적이든 부정적이든 진실된 사용 경험을 공유합니다": "일반",
	"이 리뷰는 제품의 결함, 배송지연, 서비스 문제 등 명백한 불만사항을 언급하며 부정적인 경험을 표현합니다": "불만",
	"이 리뷰는 텔레그램, 카카오톡 등 메신저 아이디(@로 시작), 전화번호, 이메일 같은 연락처를 포함하거나, '연락주세요', '도매가', '반값', '할인', '쿠폰' 등으로 다른 판매처나 거래를 유도하는 명백한 광고/스팸 내용입니다": "광고"
	}

	print("모델 로딩 완료!")
	print("✓ 3단계 분석 모드 활성화 (감정 → 카테고리 → 톤)")

	def preprocess_text(self, text: str) -> str:
	"""
	텍스트 전처리 (성능 개선용)

	Args:
	text: 원본 텍스트

	Returns:
	전처리된 텍스트
	"""
	# 앞뒤 공백 제거
	text = text.strip()

	# 연속된 공백을 하나로
	import re
	text = re.sub(r'\s+', ' ', text)

	return text

	def split_into_sentences(self, text: str) -> List[str]:
	"""
	텍스트를 문장 단위로 분리

	Args:
	text: 원본 텍스트

	Returns:
	문장 리스트
	"""
	import re

	# 문장 종결 기호를 기준으로 분리 (., !, ?, ~, ㅎㅎ, ㅋㅋ 등 고려)
	# 이모티콘과 특수문자 패턴 보존
	sentences = re.split(r'[.!?~]+\s*', text)

	# 빈 문장 제거 및 정리
	sentences = [s.strip() for s in sentences if s.strip() and len(s.strip()) > 2]

	return sentences if sentences else [text]

	def analyze_sentiment(self, text: str, use_sentence_split: bool = True) -> Dict:
	"""
	1단계: 감정 분석 (긍정 / 중립 / 부정)

	Args:
	text: 리뷰 텍스트
	use_sentence_split: 문장 분리 후 분석 여부 (긴 문장 개선용)

	Returns:
	감정 분석 결과
	"""
	# 긴 문장(100자 이상)인 경우 문장 분리 후 분석
	if use_sentence_split and len(text) > 100:
	sentences = self.split_into_sentences(text)

	if len(sentences) > 1:
	# 각 문장별 감정 점수 수집
	all_scores = {cat: [] for cat in self.sentiment_mapping.values()}

	for sentence in sentences:
	result = self.classifier(
	sentence,
	self.sentiment_categories,
	multi_label=False
	)

	# 각 카테고리별 점수 수집
	for label, score in zip(result['labels'], result['scores']):
	category = self.sentiment_mapping[label]
	all_scores[category].append(score)

	# 평균 점수 계산
	avg_scores = {
	cat: sum(scores) / len(scores) if scores else 0
	for cat, scores in all_scores.items()
	}

	# 가장 높은 점수의 감정 선택
	top_sentiment = max(avg_scores.items(), key=lambda x: x[1])
	sentiment = top_sentiment[0]
	confidence = top_sentiment[1]

	scores_dict = {
	cat: round(score * 100, 2)
	for cat, score in avg_scores.items()
	}

	return {
	"sentiment": sentiment,
	"confidence": round(confidence * 100, 2),
	"scores": scores_dict,
	"method": "sentence_split"
	}

	# 기본 단일 분석
	result = self.classifier(
	text,
	self.sentiment_categories,
	multi_label=False
	)

	top_category = result['labels'][0]
	top_score = result['scores'][0]
	sentiment = self.sentiment_mapping[top_category]

	scores_dict = {
	self.sentiment_mapping[label]: round(score * 100, 2)
	for label, score in zip(result['labels'], result['scores'])
	}

	return {
	"sentiment": sentiment,
	"confidence": round(top_score * 100, 2),
	"scores": scores_dict,
	"method": "single"
	}

	def analyze_category(self, text: str, top_k: int = 3, use_sentence_split: bool = True, min_threshold: float = 0.25) -> Dict:
	"""
	2단계: 카테고리 분석 (배송 / 품질 / 사이즈 / 교환 / 서비스 등)

	Args:
	text: 리뷰 텍스트
	top_k: 상위 몇 개 카테고리를 반환할지 (기본 3개)
	use_sentence_split: 문장 분리 후 분석 여부 (긴 문장 개선용)
	min_threshold: 카테고리 선택 최소 임계값 (기본 0.25 = 25%)

	Returns:
	카테고리 분석 결과
	"""
	# 긴 문장인 경우 문장별로 분석 후 집계
	if use_sentence_split and len(text) > 100:
	sentences = self.split_into_sentences(text)

	if len(sentences) > 1:
	# 각 카테고리별 점수 누적
	accumulated_scores = {cat: [] for cat in self.topic_mapping.values()}

	for sentence in sentences:
	result = self.classifier(
	sentence,
	self.topic_categories,
	multi_label=True
	)

	# 카테고리별 점수 수집
	for label, score in zip(result['labels'], result['scores']):
	category = self.topic_mapping[label]
	accumulated_scores[category].append(score)

	# 최대 점수로 집계 (어느 한 문장에서라도 높게 나오면 해당 카테고리로 인정)
	max_scores = {
	cat: max(scores) if scores else 0
	for cat, scores in accumulated_scores.items()
	}

	# 점수 기준으로 정렬
	sorted_categories = sorted(max_scores.items(), key=lambda x: x[1], reverse=True)

	# 상위 k개 선택 (임계값 이상만)
	categories = []
	for cat, score in sorted_categories[:top_k]:
	if score >= min_threshold:
	categories.append({
	"category": cat,
	"confidence": round(score * 100, 2)
	})

	all_scores = {
	cat: round(score * 100, 2)
	for cat, score in sorted_categories
	}

	return {
	"main_categories": categories,
	"all_scores": all_scores,
	"method": "sentence_split"
	}

	# 기본 단일 분석
	result = self.classifier(
	text,
	self.topic_categories,
	multi_label=True # 여러 카테고리가 동시에 해당될 수 있음
	)

	# 상위 k개의 카테고리 추출
	categories = []
	for i in range(min(top_k, len(result['labels']))):
	label = result['labels'][i]
	score = result['scores'][i]
	# 임계값 이상의 확신도를 가진 카테고리만 포함
	if score >= min_threshold:
	categories.append({
	"category": self.topic_mapping[label],
	"confidence": round(score * 100, 2)
	})

	all_scores = {
	self.topic_mapping[label]: round(score * 100, 2)
	for label, score in zip(result['labels'], result['scores'])
	}

	return {
	"main_categories": categories,
	"all_scores": all_scores,
	"method": "single"
	}

	def analyze_tone(self, text: str) -> Dict:
	"""
	3단계: 리뷰 톤 탐지 (불만 / 욕설 / 허위후기 / 광고 등)

	Args:
	text: 리뷰 텍스트

	Returns:
	톤 분석 결과
	"""
	result = self.classifier(
	text,
	self.tone_categories,
	multi_label=False
	)

	top_category = result['labels'][0]
	top_score = result['scores'][0]
	tone = self.tone_mapping[top_category]

	scores_dict = {
	self.tone_mapping[label]: round(score * 100, 2)
	for label, score in zip(result['labels'], result['scores'])
	}

	return {
	"tone": tone,
	"confidence": round(top_score * 100, 2),
	"scores": scores_dict
	}

	def generate_rating_from_sentiment(self, category: str, confidence: float, sentiment: str) -> int:
	"""
	카테고리별 감정과 확신도를 기반으로 별점 생성

	Args:
	category: 카테고리명
	confidence: 확신도 (0-100)
	sentiment: 감정 (긍정/중립/부정)

	Returns:
	별점 (1-5)
	"""
	# 기본 점수: 감정에 따라
	if sentiment == "긍정":
	base_score = 4.5
	elif sentiment == "중립":
	base_score = 3.0
	else: # 부정
	base_score = 1.5

	# 확신도에 따라 점수 조정
	confidence_factor = confidence / 100.0
	final_score = base_score * confidence_factor + 2.5 * (1 - confidence_factor)

	# 1-5 사이로 클램핑
	final_score = max(1, min(5, final_score))

	return round(final_score)

	def extract_evidence_from_text(self, text: str, category: str, sentiment: str = None) -> str:
	"""
	텍스트에서 특정 카테고리 관련 근거 문장 추출
	카테고리 키워드가 포함된 조각만 추출하며, 감정과 일치하는 근거 우선

	Args:
	text: 리뷰 텍스트
	category: 카테고리명
	sentiment: 해당 카테고리의 감정 ("긍정"/"부정"/"중립", None이면 무시)

	Returns:
	근거 문장 (따옴표로 감싸진 형태)
	"""
	import re

	# 카테고리별 키워드 매핑
	keywords = {
	"배송": ["배송", "택배", "도착", "포장"],
	"품질/디자인": ["품질", "재질", "튼튼", "내구", "완성도", "털빠짐", "빠짐", "디자인", "색상", "스타일", "외관"],
	"사이즈": ["사이즈", "크기", "핏", "치수"],
	"교환/환불": ["교환", "환불", "반품"],
	"서비스": ["서비스", "고객센터", "응대", "친절"],
	"가격": ["가격", "가성비", "비싸", "저렴", "할인", "돈"],
	"기능/성능": ["기능", "성능", "작동", "효과", "사용"]
	}

	if category not in keywords:
	return "-"

	category_keywords = keywords[category]

	# 감정 키워드
	positive_keywords = ["좋", "훌륭", "만족", "최고", "예쁘", "이쁘", "딱맞", "빠르", "괜찮", "완벽", "멋지", "감사"]
	negative_keywords = ["별로", "아쉽", "실망", "최악", "짜증", "문제", "나쁘", "형편없", "엉망", "후회", "다르", "안", "못", "복잡"]

	# 전체 텍스트를 조각으로 나누기
	chunks = re.split(r'[,]\|\s+그리고\s+\|\s+근데\s+\|\s+하지만\s+\|\s+인데\s+', text)

	matching_chunks = []
	for chunk in chunks:
	chunk = chunk.strip()
	# 이 조각에 카테고리 키워드가 있는지 확인
	has_category = False
	for keyword in category_keywords:
	if keyword in chunk and len(chunk) > 5:
	has_category = True
	break

	if not has_category:
	continue

	# sentiment가 지정된 경우, 감정과 일치하는 조각 찾기
	if sentiment:
	chunk_lower = chunk.lower()
	has_positive = any(kw in chunk_lower for kw in positive_keywords)
	has_negative = any(kw in chunk_lower for kw in negative_keywords)

	# 감정과 일치하는지 확인
	if sentiment == "긍정" and has_positive and not has_negative:
	matching_chunks.append((chunk, True)) # 감정 일치
	elif sentiment == "부정" and has_negative:
	matching_chunks.append((chunk, True)) # 감정 일치
	else:
	matching_chunks.append((chunk, False)) # 감정 불일치
	else:
	matching_chunks.append((chunk, True))

	# 감정이 일치하는 조각 우선, 없으면 첫 번째 조각
	for chunk, is_match in matching_chunks:
	if is_match:
	if len(chunk) > 20:
	chunk = chunk[:20]
	return f'"{chunk}"'

	# 감정 일치 조각이 없으면 첫 번째 조각 반환
	if matching_chunks:
	chunk = matching_chunks[0][0]
	if len(chunk) > 20:
	chunk = chunk[:20]
	return f'"{chunk}"'

	return "-"

	def analyze_sentiment_for_category(self, text: str, category: str) -> str:
	"""
	특정 카테고리에 대한 감정 분석
	카테고리 키워드 근처의 감정 표현만 분석합니다.

	Args:
	text: 리뷰 텍스트
	category: 카테고리명

	Returns:
	감정 (긍정/중립/부정)
	"""
	import re

	# 카테고리 관련 키워드
	keywords = {
	"배송": ["배송", "택배", "도착", "포장"],
	"품질/디자인": ["품질", "재질", "튼튼", "내구", "완성도", "털빠짐", "빠짐", "디자인", "색상", "스타일", "외관"],
	"사이즈": ["사이즈", "크기", "핏", "치수"],
	"교환/환불": ["교환", "환불", "반품"],
	"서비스": ["서비스", "고객센터", "응대", "친절"],
	"가격": ["가격", "가성비", "비싸", "저렴", "할인", "돈"],
	"기능/성능": ["기능", "성능", "작동", "효과", "사용"]
	}

	# 부정 키워드 (부정 키워드를 먼저 체크해야 정확함)
	negative_keywords = ["별로", "아쉽", "실망", "최악", "짜증", "문제", "나쁘", "형편없", "엉망", "후회", "다르", "안", "못"]

	# 긍정 키워드 (명시적 긍정 표현)
	positive_keywords = ["좋", "훌륭", "만족", "최고", "예쁘", "이쁘", "딱맞", "빠르", "괜찮", "완벽", "멋지", "감사"]

	if category not in keywords:
	return "중립"

	# 카테고리 키워드가 포함된 구간 찾기
	category_keywords = keywords[category]

	# 전체 텍스트를 조각으로 나누기 (쉼표, 그리고, 하지만 등으로 분리)
	# 예: "배송은 빠른데 품질이 별로예요" -> ["배송은 빠른데", "품질이 별로예요"]
	chunks = re.split(r'[,]\|\s+그리고\s+\|\s+근데\s+\|\s+하지만\s+\|\s+인데\s+', text)

	for chunk in chunks:
	# 이 조각에 카테고리 키워드가 있는지 확인
	has_category = False
	for keyword in category_keywords:
	if keyword in chunk:
	has_category = True
	break

	if not has_category:
	continue

	# 이 조각 내에서만 감정 판단
	chunk_lower = chunk.lower()

	# 부정 키워드를 먼저 체크 (우선순위가 높음)
	for neg_keyword in negative_keywords:
	if neg_keyword in chunk_lower:
	return "부정"

	# 긍정 키워드 체크
	for pos_keyword in positive_keywords:
	if pos_keyword in chunk_lower:
	return "긍정"

	# 기본값은 중립
	return "중립"

	def extract_tone_evidence(self, text: str) -> Dict[str, str]:
	"""
	전체 톤의 긍정/부정 근거 추출

	Args:
	text: 리뷰 텍스트

	Returns:
	{"positive": "긍정 근거", "negative": "부정 근거"}
	"""
	import re

	# 긍정 키워드
	positive_keywords = ["좋", "훌륭", "만족", "최고", "예쁘", "이쁘", "딱맞", "빠르", "괜찮", "완벽", "멋지", "감사"]

	# 부정 키워드
	negative_keywords = ["별로", "아쉽", "실망", "최악", "짜증", "문제", "나쁘", "형편없", "엉망", "후회", "다르", "복잡", "불편","느리", "느림", "늦", "지연"]

	# 텍스트를 조각으로 나누기
	chunks = re.split(r'[,.]\|\s+그리고\s+\|\s+근데\s+\|\s+하지만\s+\|\s+인데\s+', text)

	positive_evidence = []
	negative_evidence = []

	for chunk in chunks:
	chunk = chunk.strip()
	if len(chunk) < 3:
	continue

	chunk_lower = chunk.lower()

	# 긍정 키워드 체크 - chunk 그대로 사용
	for keyword in positive_keywords:
	if keyword in chunk_lower:
	# chunk를 그대로 사용 (이미 조각으로 분리되어 있으므로)
	evidence = chunk
	if len(evidence) > 20:
	evidence = evidence[:20]
	positive_evidence.append(f'"{evidence}"')
	break

	# 부정 키워드 체크 - chunk 그대로 사용
	for keyword in negative_keywords:
	if keyword in chunk_lower:
	# chunk를 그대로 사용 (이미 조각으로 분리되어 있으므로)
	evidence = chunk
	if len(evidence) > 20:
	evidence = evidence[:20]
	negative_evidence.append(f'"{evidence}"')
	break

	# 최대 2개씩만 표시
	positive_text = ", ".join(positive_evidence[:2]) if positive_evidence else "-"
	negative_text = ", ".join(negative_evidence[:2]) if negative_evidence else "-"

	return {
	"positive": positive_text,
	"negative": negative_text
	}

	def generate_comprehensive_analysis(self, review_text: str, analysis_result: Dict) -> Dict:
	"""
	종합 분석 생성 - 항목별 평가 및 요약

	Args:
	review_text: 원본 리뷰 텍스트
	analysis_result: 3단계 분석 결과

	Returns:
	종합 분석 결과
	"""
	sentiment = analysis_result['sentiment']['sentiment']
	sentiment_scores = analysis_result['sentiment']['scores']
	tone = analysis_result['tone']['tone']

	# 모든 가능한 카테고리를 검사 (AI 결과와 무관하게)
	all_possible_categories = ["배송", "품질/디자인", "사이즈", "교환/환불", "서비스", "가격", "기능/성능"]

	# 항목별 평가
	item_ratings = []
	for category in all_possible_categories:
	# 해당 카테고리의 감정 분석 (먼저 감정을 파악)
	category_sentiment = self.analyze_sentiment_for_category(review_text, category)

	# 근거 추출 (감정과 일치하는 근거 우선)
	evidence = self.extract_evidence_from_text(review_text, category, category_sentiment)

	# 근거가 없으면 해당 항목 제외
	if evidence == "-":
	continue

	# 별점 계산 (카테고리별 감정 기반)
	if category_sentiment == "부정":
	rating = 2
	elif category_sentiment == "긍정":
	rating = 5
	else:
	rating = 3

	item_ratings.append({
	"category": category,
	"rating": rating,
	"evidence": evidence,
	"sentiment": category_sentiment
	})

	# 전체 톤 비율
	positive_ratio = sentiment_scores.get('긍정', 0)
	negative_ratio = sentiment_scores.get('부정', 0)
	neutral_ratio = sentiment_scores.get('중립', 0)

	# 전체 톤 근거 추출
	tone_evidence = self.extract_tone_evidence(review_text)

	# 요약 문장 생성
	summary = self.generate_summary_sentence(review_text, item_ratings, sentiment)

	return {
	"item_ratings": item_ratings,
	"tone_ratio": {
	"positive": round(positive_ratio),
	"negative": round(negative_ratio),
	"neutral": round(neutral_ratio)
	},
	"tone_evidence": tone_evidence,
	"summary": summary,
	"overall_sentiment": sentiment
	}

	def generate_summary_sentence(self, review_text: str, item_ratings: List[Dict], sentiment: str) -> str:
	"""
	요약 문장 자동 생성

	Args:
	review_text: 원본 리뷰
	item_ratings: 항목별 평가
	sentiment: 전체 감정

	Returns:
	요약 문장
	"""
	# 높은 평가 항목과 낮은 평가 항목 찾기
	high_rated = [item for item in item_ratings if item['rating'] >= 4]
	low_rated = [item for item in item_ratings if item['rating'] <= 2]

	if high_rated and low_rated:
	# 장단점이 모두 있는 경우
	high_cats = ", ".join([item['category'] for item in high_rated[:2]])
	low_cats = ", ".join([item['category'] for item in low_rated[:2]])
	return f"{high_cats}은(는) 좋지만, {low_cats} 부분이 아쉬운 제품이에요."

	elif high_rated:
	# 긍정적인 경우
	high_cats = ", ".join([item['category'] for item in high_rated[:3]])
	return f"{high_cats} 모두 만족스러운 제품이에요."

	elif low_rated:
	# 부정적인 경우
	low_cats = ", ".join([item['category'] for item in low_rated[:3]])
	return f"{low_cats} 부분이 기대에 못 미치는 제품이에요."

	else:
	# 중립적인 경우
	if sentiment == "긍정":
	return "전반적으로 만족스러운 제품이에요."
	elif sentiment == "부정":
	return "전반적으로 아쉬움이 남는 제품이에요."
	else:
	return "무난한 수준의 제품이에요."

	def analyze_review(self, review_text: str, include_comprehensive: bool = True) -> Dict:
	"""
	단일 리뷰를 3단계로 분석합니다.

	Args:
	review_text: 분석할 리뷰 텍스트
	include_comprehensive: 종합 분석 포함 여부

	Returns:
	3단계 분석 결과를 포함한 딕셔너리
	"""
	# 텍스트 전처리
	processed_text = self.preprocess_text(review_text)

	# 1단계: 감정 분석
	sentiment_result = self.analyze_sentiment(processed_text)

	# 2단계: 카테고리 분석
	category_result = self.analyze_category(processed_text)

	# 3단계: 톤 분석
	tone_result = self.analyze_tone(processed_text)

	result = {
	"review": review_text,
	"sentiment": sentiment_result,
	"categories": category_result,
	"tone": tone_result,
	"timestamp": datetime.now().isoformat()
	}

	# 종합 분석 추가
	if include_comprehensive:
	result["comprehensive"] = self.generate_comprehensive_analysis(review_text, result)

	return result

	def analyze_reviews(self, reviews: List[str]) -> List[Dict]:
	"""
	여러 리뷰를 일괄 분석합니다.

	Args:
	reviews: 분석할 리뷰 텍스트 리스트

	Returns:
	분류 결과 리스트
	"""
	results = []
	for idx, review in enumerate(reviews, 1):
	print(f"\n[{idx}/{len(reviews)}] 분석 중...")
	result = self.analyze_review(review)
	results.append(result)
	return results

	def print_results(self, results: List[Dict]):
	"""분석 결과를 보기 좋게 출력합니다."""
	print("\n" + "="*80)
	print("리뷰 3단계 분석 결과")
	print("="*80)

	for idx, result in enumerate(results, 1):
	print(f"\n[리뷰 #{idx}]")
	print(f"내용: {result['review']}")
	print(f"\n1️⃣ 감정: {result['sentiment']['sentiment']} ({result['sentiment']['confidence']}%)")

	# 카테고리 출력
	categories_str = ', '.join([f"{c['category']} ({c['confidence']}%)" for c in result['categories']['main_categories']])
	print(f"2️⃣ 카테고리: {categories_str}")
	print(f"3️⃣ 톤: {result['tone']['tone']} ({result['tone']['confidence']}%)")

	print("\n" + "="*80)

	def save_results(self, results: List[Dict], filename: str = "review_results.json"):
	"""분석 결과를 JSON 파일로 저장합니다."""
	with open(filename, 'w', encoding='utf-8') as f:
	json.dump(results, f, ensure_ascii=False, indent=2)
	print(f"\n결과가 {filename}에 저장되었습니다.")

	def load_reviews_from_csv(self, csv_file: str) -> List[str]:
	"""
	CSV 파일에서 리뷰를 로드합니다.

	Args:
	csv_file: CSV 파일 경로

	Returns:
	리뷰 텍스트 리스트
	"""
	reviews = []
	with open(csv_file, 'r', encoding='utf-8') as f:
	reader = csv.DictReader(f)
	for row in reader:
	reviews.append(row['review_text'])
	return reviews

	def analyze_for_gradio(self, review_text: str):
	"""
	Gradio UI용 리뷰 분석 함수

	Args:
	review_text: 분석할 리뷰 텍스트

	Returns:
	(감정 결과, 카테고리 결과, 톤 결과, 감정 분포, 카테고리 분포, 톤 분포) 튜플
	"""
	if not review_text or review_text.strip() == "":
	return "⚠️ 리뷰를 입력해주세요", "", "", {}, {}, {}

	result = self.analyze_review(review_text, include_comprehensive=False)

	# 1단계: 감정 분석 결과
	sentiment = result['sentiment']['sentiment']
	sentiment_conf = result['sentiment']['confidence']

	sentiment_output = f"{sentiment} ({sentiment_conf}%)"

	# 2단계: 카테고리 분석 결과
	categories = result['categories']['main_categories']
	if categories:
	category_list = [f"• {c['category']}" for c in categories]
	category_output = "\n".join(category_list)
	else:
	category_output = "해당 카테고리 없음"

	# 3단계: 톤 분석 결과
	tone = result['tone']['tone']
	tone_conf = result['tone']['confidence']

	tone_output = f"{tone} ({tone_conf}%)"

	# 확률 분포 딕셔너리들 (Gradio Label 컴포넌트용)
	sentiment_probs = {
	k: v / 100.0 for k, v in result['sentiment']['scores'].items()
	}

	category_probs = {
	k: v / 100.0 for k, v in result['categories']['all_scores'].items()
	}

	tone_probs = {
	k: v / 100.0 for k, v in result['tone']['scores'].items()
	}

	return sentiment_output, category_output, tone_output, sentiment_probs, category_probs, tone_probs

	def format_comprehensive_analysis(self, comprehensive: Dict) -> str:
	"""
	종합 분석 결과를 마크다운 형식으로 포맷팅

	Args:
	comprehensive: 종합 분석 딕셔너리

	Returns:
	마크다운 형식의 문자열
	"""
	output = "\| 항목 \| 감정 \| 만족도 \| 근거 \|\n"
	output += "\|------\|------\|--------\|------\|\n"

	# 항목별 평가
	for item in comprehensive['item_ratings']:
	stars = "⭐️" * item['rating']
	sentiment = item.get('sentiment', '중립')
	output += f"\| {item['category']} \| {sentiment} \| {stars} \| {item['evidence']} \|\n"

	# 전체 톤
	tone_ratio = comprehensive['tone_ratio']
	tone_evidence = comprehensive.get('tone_evidence', {"positive": "-", "negative": "-"})

	tone_summary = ""
	if tone_ratio['positive'] > tone_ratio['negative'] + 20:
	tone_summary = "긍정이 우세함"
	elif tone_ratio['negative'] > tone_ratio['positive'] + 20:
	tone_summary = "부정이 우세함"
	else:
	tone_summary = "긍정과 부정이 혼재됨"

	# 전체 톤 근거 포맷팅: "긍정: xxx / 부정: xxx"
	tone_evidence_text = f"긍정: {tone_evidence['positive']} / 부정: {tone_evidence['negative']}"

	output += f"\| 전체 톤 \| {tone_summary} \| 긍정 {tone_ratio['positive']} : 부정 {tone_ratio['negative']} \| {tone_evidence_text} \|\n"

	return output


	# 전역 분석기 인스턴스 (Gradio 앱 시작 시 한 번만 로드)
	analyzer = None


	def get_analyzer():
	"""분석기 싱글톤 인스턴스 반환"""
	global analyzer
	if analyzer is None:
	analyzer = ReviewAnalyzer()
	return analyzer


	def create_gradio_app():
	"""Gradio 웹 애플리케이션 생성"""

	# 분석기 초기화
	review_analyzer = get_analyzer()

	# 샘플 리뷰 예시
	examples = [
	["정말 좋은 제품이에요! 배송도 빠르고 품질도 훌륭합니다. 다음에도 또 구매할게요!"],
	["완전 실망이에요. 사진이랑 완전 다르고 품질도 별로입니다. 환불 신청했습니다. 다만 환불 처리는 빨라서 좋았어요."],
	["핏도 넘이쁘고 사이즈도 딱맞고 다좋은데 털빠짐이 장난이 아니예요~~감수할만한데 은근 짜증날수도? 그냥 입으면 고양이마냥 털을 뿜내요 ㅎㅎ"],
	["텔레그램 @abcd1234로 연락주시면 반값에 드립니다. 도매가로 판매중!"],
	["배송이 생각보다 빨라서 좋았어요. 품질도 괜찮고 가격대비 만족합니다."],
	["사이즈가 너무 작아요. 교환하려고 했는데 절차가 복잡하네요."],
	["디자인은 예쁜데 품질이 가격에 비해 별로입니다. 그냥저냥이에요."],
	["세트 가격 가성비 최고예용❤️🤍　따뜻하고 폭닥폭닥한 느낌 너무 조아여!! 핏 너무 예뻐용!!!"]
	]

	# Gradio 인터페이스 생성 - 모던 대시보드 레이아웃
	with gr.Blocks(
	title="리뷰 3단계 분석 서비스",
	theme=gr.themes.Default(
	primary_hue="blue",
	secondary_hue="slate",
	neutral_hue="slate",
	font=gr.themes.GoogleFont("Noto Sans KR")
	),
	css="""
	.card-header {
	font-size: 1.2em;
	font-weight: bold;
	margin-bottom: 10px;
	padding: 10px;
	border-radius: 8px;
	text-align: center;
	}
	.sentiment-positive { background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); color: white; }
	.sentiment-neutral { background: #6b7280; color: white; }
	.sentiment-negative { background: linear-gradient(135deg, #fa709a 0%, #fee140 100%); color: white; }
	.metric-card {
	border: 2px solid #e5e7eb;
	border-radius: 12px;
	padding: 10px;
	background: white;
	box-shadow: 0 2px 8px rgba(0,0,0,0.1);
	}
	.big-emoji { font-size: 3em; text-align: center; margin: 10px 0; }
	.big-text { font-size: 1.8em; font-weight: bold; text-align: center; margin: 5px 0; }
	.confidence { font-size: 1.2em; color: #6b7280; text-align: center; }
	/* Label 컴포넌트 패딩 조정 - 각 확률 항목들의 패딩 줄이기 */
	.label .output-class { padding: 6px 12px !important; }
	.label-wrap .output-class { padding: 6px 12px !important; }
	.compact-label .output-class { padding: 6px 12px !important; }
	"""
	) as demo:

	# 헤더
	gr.Markdown("""
	# 🔍 리뷰 분석 대시보드

	AI 기반 3단계 분석으로 리뷰를 자동으로 검수하고 인사이트를 추출합니다.
	""")

	# 2단 레이아웃: 리뷰입력 / 분석결과

	with gr.Row():
	# 왼쪽: 입력 섹션
	with gr.Column(scale=1):
	gr.Markdown("## 리뷰 입력")
	review_input = gr.Textbox(
	label="TextBox",
	placeholder="분석할 리뷰 내용을 입력해주세요...",
	lines=10,
	max_lines=20
	)
	submit_btn = gr.Button("🔍 분석 시작", variant="primary", size="lg")

	gr.Examples(
	examples=examples,
	inputs=review_input,
	label="💡 예시 리뷰"
	)

	# 오른쪽: 3단계 분석
	with gr.Column(scale=1):
	gr.Markdown("## 분석 결과")

	# 1단계: 감정 분석
	gr.HTML('<div class="card-header sentiment-neutral">1. 감정 분석</div>')
	with gr.Group(elem_classes="metric-card"):
	sentiment_output = gr.Textbox(
	label="",
	lines=1,
	interactive=False,
	show_label=False,
	container=False,
	elem_classes="big-text",
	visible=False
	)
	sentiment_prob = gr.Label(
	label="확률 분포",
	num_top_classes=3,
	show_label=False,
	elem_classes="compact-label"
	)

	# 2단계: 카테고리 분석
	gr.HTML('<div class="card-header sentiment-neutral">2. 카테고리 분석</div>')
	with gr.Group(elem_classes="metric-card"):
	category_output = gr.Textbox(
	label="",
	lines=4,
	interactive=False,
	show_label=False,
	container=False,
	visible=False
	)
	category_prob = gr.Label(
	label="확률 분포",
	num_top_classes=5,
	show_label=False,
	elem_classes="compact-label"
	)

	# 3단계: 톤 탐지
	gr.HTML('<div class="card-header sentiment-neutral">3. 리뷰 톤 탐지</div>')
	with gr.Group(elem_classes="metric-card"):
	tone_output = gr.Textbox(
	label="",
	lines=1,
	interactive=False,
	show_label=False,
	container=False,
	elem_classes="big-text",
	visible=False
	)
	tone_prob = gr.Label(
	label="확률 분포",
	num_top_classes=3,
	show_label=False,
	elem_classes="compact-label"
	)

	# 이벤트 핸들러
	submit_btn.click(
	fn=review_analyzer.analyze_for_gradio,
	inputs=review_input,
	outputs=[sentiment_output, category_output, tone_output,
	sentiment_prob, category_prob, tone_prob]
	)

	review_input.submit(
	fn=review_analyzer.analyze_for_gradio,
	inputs=review_input,
	outputs=[sentiment_output, category_output, tone_output,
	sentiment_prob, category_prob, tone_prob]
	)


	return demo


	def main():
	"""메인 실행 함수"""
	print("리뷰 자동 검수 서비스 시작")
	print("-" * 80)

	# Gradio 앱 실행
	app = create_gradio_app()
	app.launch(
	server_name="0.0.0.0",
	server_port=7860,
	share=False,
	inbrowser=True
	)


	if __name__ == "__main__":
	main()