AI-OMS-Analyze

Sleeping

App Files Files Community

AI-OMS-Analyze / scripts /summary.py

bboat

Update scripts/summary.py

1da28ef verified 3 months ago

raw

history blame contribute delete

22.4 kB

	import os
	import pandas as pd
	import numpy as np
	from typing import Dict, Tuple, Optional
	from pathlib import Path
	from datetime import datetime, timedelta

	# Prefer HF router via OpenAI-compatible client. Use env `HF_TOKEN`.
	# HF_TOKEN loaded lazily to allow dotenv loading after import
	def get_hf_token():
	return os.environ.get('HF_TOKEN')

	def openai_summary(text: str, verbosity: str = 'brief', model: str = 'meta-llama/Llama-3.1-8B-Instruct:novita') -> str:
	HF_TOKEN = get_hf_token()
	if not HF_TOKEN:
	return None
	try:
	# Import here to avoid requiring OpenAI client unless HF_TOKEN set
	from openai import OpenAI
	client = OpenAI(base_url="https://router.huggingface.co/v1", api_key=HF_TOKEN)
	if verbosity == 'analyze':
	instruction = 'วิเคราะห์สาเหตุไฟฟ้าจากข้อมูลนี้ สรุปไม่เกิน 3-4 บรรทัด (ไทย) ระบุสาเหตุทางเทคนิค ผลกระทบต่อลูกค้าและระบบ และช่วงเวลา:'
	elif verbosity == 'recommend':
	instruction = 'วิเคราะห์สาเหตุไฟฟ้าจากข้อมูลนี้ พร้อมแนะนำการแก้ไข สรุปไม่เกิน 3-4 บรรทัด (ไทย) ระบุสาเหตุทางเทคนิค ผลกระทบต่อลูกค้าและระบบ ช่วงเวลาและข้อเสนอแนะในการป้องกัน:'
	prompt = f"{instruction}\n\n{text}\n\nสรุป:"
	completion = client.chat.completions.create(
	model=model,
	messages=[{"role": "user", "content": prompt}],
	max_tokens=1000,
	)
	# Extract text from response
	choice = completion.choices[0]
	msg = choice.message
	content = msg.content
	return content.strip() if content else None
	except Exception:
	return None

	def calculate_outage_duration_minutes(df: pd.DataFrame) -> pd.Series:
	"""
	คำนวณระยะเวลาการขัดข้องเป็นนาที
	"""
	durations = pd.Series(index=df.index, dtype='float64')

	# ลองใช้คอลัมน์ต่างๆ สำหรับคำนวณระยะเวลา
	if 'OutageDateTime' in df.columns and 'FirstRestoDateTime' in df.columns:
	outage_time = pd.to_datetime(df['OutageDateTime'], dayfirst=True, errors='coerce')
	restore_time = pd.to_datetime(df['FirstRestoDateTime'], dayfirst=True, errors='coerce')
	durations = (restore_time - outage_time).dt.total_seconds() / 60
	elif 'OutageDateTime' in df.columns and 'LastRestoDateTime' in df.columns:
	outage_time = pd.to_datetime(df['OutageDateTime'], dayfirst=True, errors='coerce')
	restore_time = pd.to_datetime(df['LastRestoDateTime'], dayfirst=True, errors='coerce')
	durations = (restore_time - outage_time).dt.total_seconds() / 60
	elif 'CreateEventDateTime' in df.columns and 'CloseEventDateTime' in df.columns:
	create_time = pd.to_datetime(df['CreateEventDateTime'], dayfirst=True, errors='coerce')
	close_time = pd.to_datetime(df['CloseEventDateTime'], dayfirst=True, errors='coerce')
	durations = (close_time - create_time).dt.total_seconds() / 60

	# แทนที่ค่าลบหรือ NaN ด้วย 0
	durations = durations.fillna(0)
	durations = durations.where(durations >= 0, 0)

	return durations

	def compute_reliability_metrics(df: pd.DataFrame, total_customers: float) -> Dict:
	"""
	คำนวณตัวชี้วัดความน่าเชื่อถือของระบบไฟฟ้า

	สูตรการคำนวณ:
	SAIFI = Σ(λᵢ × Nᵢ) / Nₜ
	SAIDI = Σ(Uᵢ × Nᵢ) / Nₜ
	CAIDI = SAIDI / SAIFI
	MAIFI = Σ(λₘᵢ × Nᵢ) / Nₜ
	CTAIDI = Σ(rᵢ × Nᵢ × λᵢ) / Σ(Nᵢ × λᵢ)
	ASAI = (Nₜ × T - Σ(rᵢ × Nᵢ)) / (Nₜ × T)

	โดยที่:
	λᵢ = ความถี่การขัดข้องของจุดโหลด i
	Nᵢ = จำนวนลูกค้าที่ได้รับผลกระทบในจุดโหลด i
	Nₜ = จำนวนลูกค้าทั้งหมดในระบบ
	Uᵢ = ระยะเวลาขัดข้องรายปีของจุดโหลด i (นาที)
	rᵢ = ระยะเวลาขัดข้องเฉลี่ยต่อครั้งของจุดโหลด i (นาที)
	λₘᵢ = ความถี่การขัดข้องชั่วคราว (< 1 นาที)
	T = ระยะเวลารวม (8760 ชั่วโมง = 525,600 นาที)
	"""

	# เตรียมข้อมูล
	df_clean = df.copy()

	# คำนวณระยะเวลาขัดข้อง
	df_clean['duration_minutes'] = calculate_outage_duration_minutes(df_clean)

	# จำนวนลูกค้าที่ได้รับผลกระทบ
	if 'AffectedCustomer' in df_clean.columns:
	df_clean['affected_customers'] = pd.to_numeric(df_clean['AffectedCustomer'], errors='coerce').fillna(0)
	else:
	df_clean['affected_customers'] = 0

	# แยกประเภทการขัดข้อง
	df_clean['is_momentary'] = df_clean['duration_minutes'] < 1 # ขัดข้องชั่วคราว < 1 นาที
	df_clean['is_sustained'] = df_clean['duration_minutes'] >= 1 # ขัดข้องยาวนาน >= 1 นาที

	# คำนวณตัวชี้วัด

	# 1. SAIFI - System Average Interruption Frequency Index
	# SAIFI = Σ(λᵢ × Nᵢ) / Nₜ
	sustained_interruptions = df_clean[df_clean['is_sustained']]
	total_customer_interruptions = sustained_interruptions['affected_customers'].sum()
	saifi = total_customer_interruptions / total_customers if total_customers > 0 else 0

	# 2. SAIDI - System Average Interruption Duration Index
	# SAIDI = Σ(Uᵢ × Nᵢ) / Nₜ
	customer_minutes = (sustained_interruptions['duration_minutes'] * sustained_interruptions['affected_customers']).sum()
	saidi = customer_minutes / total_customers if total_customers > 0 else 0

	# 3. CAIDI - Customer Average Interruption Duration Index
	# CAIDI = SAIDI / SAIFI
	caidi = saidi / saifi if saifi > 0 else 0

	# 4. MAIFI - Momentary Average Interruption Frequency Index
	# MAIFI = Σ(λₘᵢ × Nᵢ) / Nₜ
	momentary_interruptions = df_clean[df_clean['is_momentary']]
	total_momentary_customer_interruptions = momentary_interruptions['affected_customers'].sum()
	maifi = total_momentary_customer_interruptions / total_customers if total_customers > 0 else 0

	# 5. CTAIDI - Customer Total Average Interruption Duration Index
	# CTAIDI = Σ(rᵢ × Nᵢ × λᵢ) / Σ(Nᵢ × λᵢ)
	total_customer_duration = (df_clean['duration_minutes'] * df_clean['affected_customers']).sum()
	total_customer_events = df_clean['affected_customers'].sum()
	ctaidi = total_customer_duration / total_customer_events if total_customer_events > 0 else 0

	# 6. ASAI - Average Service Availability Index
	# ASAI = (Nₜ × T - Σ(rᵢ × Nᵢ)) / (Nₜ × T)
	total_minutes_per_year = 525600 # 365 × 24 × 60
	total_available_customer_minutes = total_customers * total_minutes_per_year
	total_unavailable_customer_minutes = customer_minutes
	asai = (total_available_customer_minutes - total_unavailable_customer_minutes) / total_available_customer_minutes if total_available_customer_minutes > 0 else 0
	asai_percent = asai * 100

	# 7. ASUI - Average Service Unavailability Index
	asui = (1 - asai) * 100

	# 8. ENS - Energy Not Supplied (ประมาณการ)
	# สมมติว่าลูกค้าแต่ละรายใช้ไฟฟ้าเฉลี่ย 3 kW
	average_demand_kw = 3.0
	ens_kwh = (total_unavailable_customer_minutes / 60) * average_demand_kw

	# 9. AENS - Average Energy Not Supplied per Customer
	aens = ens_kwh / total_customers if total_customers > 0 else 0

	# สถิติเพิ่มเติม
	total_events = len(df_clean)
	total_sustained_events = len(sustained_interruptions)
	total_momentary_events = len(momentary_interruptions)
	avg_duration_per_event = df_clean['duration_minutes'].mean()
	max_duration = df_clean['duration_minutes'].max()
	total_affected = df_clean['affected_customers'].sum()

	return {
	# Primary Reliability Indices
	'SAIFI': round(saifi, 4),
	'SAIDI': round(saidi, 2),
	'CAIDI': round(caidi, 2),
	'MAIFI': round(maifi, 4),

	# Additional Indices
	'CTAIDI': round(ctaidi, 2),
	'ASAI': round(asai, 6),
	'ASAI_percent': round(asai_percent, 4),
	'ASUI_percent': round(asui, 4),
	'ENS_kWh': round(ens_kwh, 2),
	'AENS_kWh_per_customer': round(aens, 4),

	# Supporting Statistics
	'total_events': total_events,
	'sustained_events': total_sustained_events,
	'momentary_events': total_momentary_events,
	'total_customer_interruptions': int(total_customer_interruptions),
	'total_customer_minutes': round(customer_minutes, 2),
	'avg_duration_per_event_minutes': round(avg_duration_per_event, 2),
	'max_duration_minutes': round(max_duration, 2),
	'total_affected_customers': int(total_affected)
	}

	def create_reliability_dataframe(metrics: Dict) -> pd.DataFrame:
	"""
	สร้าง DataFrame สำหรับแสดงตัวชี้วัดความน่าเชื่อถือ
	"""
	reliability_data = [
	{
	'Metric': 'SAIFI',
	'Full Name': 'System Average Interruption Frequency Index',
	'Value': metrics['SAIFI'],
	'Unit': 'ครั้ง/ลูกค้า/ปี',
	'Formula': 'Σ(λᵢ × Nᵢ) / Nₜ',
	'Description': 'ความถี่เฉลี่ยของการขัดข้องต่อลูกค้าต่อปี',
	'Good_Value': '< 1.0'
	},
	{
	'Metric': 'SAIDI',
	'Full Name': 'System Average Interruption Duration Index',
	'Value': metrics['SAIDI'],
	'Unit': 'นาที/ลูกค้า/ปี',
	'Formula': 'Σ(Uᵢ × Nᵢ) / Nₜ',
	'Description': 'ระยะเวลาขัดข้องเฉลี่ยต่อลูกค้าต่อปี',
	'Good_Value': '< 200'
	},
	{
	'Metric': 'CAIDI',
	'Full Name': 'Customer Average Interruption Duration Index',
	'Value': metrics['CAIDI'],
	'Unit': 'นาที/ครั้ง',
	'Formula': 'SAIDI / SAIFI',
	'Description': 'ระยะเวลาขัดข้องเฉลี่ยต่อครั้งที่เกิดขัดข้อง',
	'Good_Value': '< 120'
	},
	{
	'Metric': 'MAIFI',
	'Full Name': 'Momentary Average Interruption Frequency Index',
	'Value': metrics['MAIFI'],
	'Unit': 'ครั้ง/ลูกค้า/ปี',
	'Formula': 'Σ(λₘᵢ × Nᵢ) / Nₜ',
	'Description': 'ความถี่เฉลี่ยของการขัดข้องชั่วคราว (< 1 นาที)',
	'Good_Value': '< 5.0'
	},
	{
	'Metric': 'CTAIDI',
	'Full Name': 'Customer Total Average Interruption Duration Index',
	'Value': metrics['CTAIDI'],
	'Unit': 'นาที/ครั้ง',
	'Formula': 'Σ(rᵢ × Nᵢ × λᵢ) / Σ(Nᵢ × λᵢ)',
	'Description': 'ระยะเวลาขัดข้องเฉลี่ยรวมทั้งชั่วคราวและยาวนาน',
	'Good_Value': '< 100'
	},
	{
	'Metric': 'ASAI',
	'Full Name': 'Average Service Availability Index',
	'Value': metrics['ASAI_percent'],
	'Unit': '%',
	'Formula': '(Nₜ×T - Σ(rᵢ×Nᵢ)) / (Nₜ×T) × 100',
	'Description': 'ดัชนีความพร้อมใช้งานเฉลี่ยของระบบ',
	'Good_Value': '> 99.95%'
	},
	{
	'Metric': 'ASUI',
	'Full Name': 'Average Service Unavailability Index',
	'Value': metrics['ASUI_percent'],
	'Unit': '%',
	'Formula': '100 - ASAI',
	'Description': 'ดัชนีความไม่พร้อมใช้งานเฉลี่ยของระบบ',
	'Good_Value': '< 0.05%'
	},
	{
	'Metric': 'AENS',
	'Full Name': 'Average Energy Not Supplied per Customer',
	'Value': metrics['AENS_kWh_per_customer'],
	'Unit': 'kWh/ลูกค้า/ปี',
	'Formula': 'ENS / Nₜ',
	'Description': 'พลังงานไฟฟ้าเฉลี่ยที่ไม่สามารถจ่ายให้ลูกค้าได้',
	'Good_Value': '< 10'
	}
	]

	return pd.DataFrame(reliability_data)

	def interpret_reliability_metrics(metrics: Dict) -> str:
	"""
	ตีความผลตัวชี้วัดความน่าเชื่อถือ
	"""
	interpretations = []

	# SAIFI interpretation
	saifi = metrics['SAIFI']
	if saifi < 1.0:
	interpretations.append("SAIFI: ดีมาก - ลูกค้าขัดข้องน้อยกว่า 1 ครั้งต่อปี")
	elif saifi < 2.0:
	interpretations.append("SAIFI: ดี - ลูกค้าขัดข้องประมาณ 1-2 ครั้งต่อปี")
	elif saifi < 5.0:
	interpretations.append("SAIFI: พอใช้ - ลูกค้าขัดข้อง 2-5 ครั้งต่อปี")
	else:
	interpretations.append("SAIFI: ต้องปรับปรุง - ลูกค้าขัดข้องบ่อยเกิน 5 ครั้งต่อปี")

	# SAIDI interpretation
	saidi = metrics['SAIDI']
	if saidi < 100:
	interpretations.append("SAIDI: ดีมาก - ขัดข้องน้อยกว่า 100 นาทีต่อปี")
	elif saidi < 200:
	interpretations.append("SAIDI: ดี - ขัดข้อง 100-200 นาทีต่อปี")
	elif saidi < 500:
	interpretations.append("SAIDI: พอใช้ - ขัดข้อง 200-500 นาทีต่อปี")
	else:
	interpretations.append("SAIDI: ต้องปรับปรุง - ขัดข้องเกิน 500 นาทีต่อปี")

	# ASAI interpretation
	asai = metrics['ASAI_percent']
	if asai > 99.98:
	interpretations.append("ASAI: ดีเยี่ยม - ระบบพร้อมใช้งานเกิน 99.98%")
	elif asai > 99.95:
	interpretations.append("ASAI: ดีมาก - ระบบพร้อมใช้งาน 99.95-99.98%")
	elif asai > 99.90:
	interpretations.append("ASAI: ดี - ระบบพร้อมใช้งาน 99.90-99.95%")
	else:
	interpretations.append("ASAI: ต้องปรับปรุง - ระบบพร้อมใช้งานต่ำกว่า 99.90%")

	return " \| ".join(interpretations)

	def summarize_overall(df: pd.DataFrame, use_hf: bool = False, model: str = 'meta-llama/Llama-3.1-8B-Instruct:novita', total_customers: float = None) -> Dict:
	"""Summarize overall outage data with enhanced reliability metrics and GenAI analysis."""

	# Basic statistics
	total_events = len(df)
	date_cols = ['OutageDateTime', 'FirstRestoDateTime', 'LastRestoDateTime', 'CreateEventDateTime', 'CloseEventDateTime']

	# Parse dates
	df_copy = df.copy()
	for col in date_cols:
	if col in df_copy.columns:
	df_copy[col] = pd.to_datetime(df_copy[col], dayfirst=True, errors='coerce')

	# Calculate basic metrics
	if 'OutageDateTime' in df_copy.columns:
	date_range = f"{df_copy['OutageDateTime'].min()} ถึง {df_copy['OutageDateTime'].max()}" if pd.notna(df_copy['OutageDateTime'].min()) else "ไม่ระบุ"
	else:
	date_range = "ไม่ระบุ"

	# Event types
	event_types = df_copy.get('EventType', pd.Series()).value_counts().head(5).to_dict()

	# Affected customers
	total_affected = 0
	if 'AffectedCustomer' in df_copy.columns:
	total_affected = pd.to_numeric(df_copy['AffectedCustomer'], errors='coerce').sum()

	# Create basic summary text
	basic_summary = f"""
	ข้อมูลไฟฟ้าล้มทั้งหมด:
	- จำนวนเหตุการณ์ทั้งหมด: {total_events}
	- ช่วงเวลาที่เกิดเหตุการณ์: {date_range}
	- ประเภทเหตุการณ์หลัก: {', '.join([f'{k}: {v}' for k, v in event_types.items()])}
	- จำนวนลูกค้าที่ได้รับผลกระทบทั้งหมด: {int(total_affected) if not pd.isna(total_affected) else 'ไม่ระบุ'}
	"""

	# Compute reliability metrics
	reliability_metrics = {}
	reliability_df = pd.DataFrame()
	reliability_summary = ""
	reliability_interpretation = ""

	if total_customers and total_customers > 0:
	try:
	reliability_metrics = compute_reliability_metrics(df_copy, total_customers)
	reliability_df = create_reliability_dataframe(reliability_metrics)
	reliability_interpretation = interpret_reliability_metrics(reliability_metrics)

	reliability_summary = f"""
	ดัชนีความน่าเชื่อถือของระบบไฟฟ้า:

	ตัวชี้วัดหลัก:
	- SAIFI: {reliability_metrics['SAIFI']:.4f} ครั้ง/ลูกค้า/ปี (ความถี่การขัดข้อง)
	- SAIDI: {reliability_metrics['SAIDI']:.2f} นาที/ลูกค้า/ปี (ระยะเวลาขัดข้อง)
	- CAIDI: {reliability_metrics['CAIDI']:.2f} นาที/ครั้ง (ระยะเวลาเฉลี่ยต่อครั้ง)
	- MAIFI: {reliability_metrics['MAIFI']:.4f} ครั้ง/ลูกค้า/ปี (ขัดข้องชั่วคราว)

	ตัวชี้วัดเพิ่มเติม:
	- ASAI: {reliability_metrics['ASAI_percent']:.4f}% (ความพร้อมใช้งาน)
	- ASUI: {reliability_metrics['ASUI_percent']:.4f}% (ความไม่พร้อมใช้งาน)
	- AENS: {reliability_metrics['AENS_kWh_per_customer']:.4f} kWh/ลูกค้า/ปี (พลังงานที่สูญเสีย)

	การตีความ: {reliability_interpretation}

	สถิติสนับสนุน:
	- เหตุการณ์ยาวนาน: {reliability_metrics['sustained_events']} ครั้ง
	- เหตุการณ์ชั่วคราว: {reliability_metrics['momentary_events']} ครั้ง
	- ระยะเวลาเฉลี่ยต่อเหตุการณ์: {reliability_metrics['avg_duration_per_event_minutes']:.2f} นาที
	- ระยะเวลาสูงสุด: {reliability_metrics['max_duration_minutes']:.2f} นาที
	"""
	basic_summary += reliability_summary

	except Exception as e:
	reliability_summary = f"ไม่สามารถคำนวณดัชนีความน่าเชื่อถือได้: {str(e)}"

	# Use GenAI for overall summary with enhanced context
	ai_summary = None
	if use_hf and get_hf_token():
	try:
	instruction = """สรุปภาพรวมข้อมูลไฟฟ้าล้มและวิเคราะห์ตัวชี้วัดความน่าเชื่อถือ สรุปเป็น 2-3 ย่อหน้า (ไทย) ประกอบด้วย:
	1. ภาพรวมเหตุการณ์และผลกระทบ
	2. การวิเคราะห์ตัวชี้วัด SAIFI, SAIDI, ASAI และการตีความ
	3. ข้อเสนอแนะในการปรับปรุงประสิทธิภาพและความน่าเชื่อถือของระบบ:"""

	prompt = f"{instruction}\n\n{basic_summary}\n\nสรุปภาพรวมและการวิเคราะห์:"
	ai_summary = openai_summary(prompt, verbosity='recommend', model=model)
	except Exception as e:
	ai_summary = f"ไม่สามารถสร้างสรุปด้วย AI ได้: {str(e)}"

	return {
	'total_events': total_events,
	'date_range': date_range,
	'event_types': event_types,
	'total_affected_customers': int(total_affected) if not pd.isna(total_affected) else None,
	'basic_summary': basic_summary.strip(),
	'reliability_summary': reliability_summary.strip() if reliability_summary else None,
	'reliability_metrics': reliability_metrics,
	'reliability_df': reliability_df,
	'reliability_interpretation': reliability_interpretation,
	'ai_summary': ai_summary,
	'formulas': {
	'SAIFI': 'Σ(λᵢ × Nᵢ) / Nₜ',
	'SAIDI': 'Σ(Uᵢ × Nᵢ) / Nₜ',
	'CAIDI': 'SAIDI / SAIFI',
	'MAIFI': 'Σ(λₘᵢ × Nᵢ) / Nₜ',
	'ASAI': '(Nₜ×T - Σ(rᵢ×Nᵢ)) / (Nₜ×T) × 100',
	'AENS': 'ENS / Nₜ'
	}
	}