Spaces:

ttzzs
/

chronos2-excel-forecasting-api

Build error

App Files Files Community

chronos2-excel-forecasting-api / app /domain /services /backtest_service.py

ttzzs

Deploy Chronos2 Forecasting API v3.0.0 with new SOLID architecture

c40c447 verified about 1 month ago

raw

history blame contribute delete

7.29 kB

	"""
	Servicio de dominio para backtesting.

	Este servicio encapsula la lógica de validación de modelos,
	cumpliendo con SRP y DIP.
	"""

	import numpy as np
	from dataclasses import dataclass
	from typing import List
	from app.domain.interfaces.forecast_model import IForecastModel
	from app.domain.interfaces.data_transformer import IDataTransformer
	from app.domain.models.time_series import TimeSeries
	from app.domain.models.forecast_config import ForecastConfig
	from app.utils.logger import setup_logger

	logger = setup_logger(__name__)


	@dataclass
	class BacktestMetrics:
	"""
	Métricas de evaluación de un backtest.

	Attributes:
	mae: Mean Absolute Error
	mape: Mean Absolute Percentage Error (%)
	rmse: Root Mean Squared Error
	wql: Weighted Quantile Loss (para cuantil 0.5)
	"""
	mae: float
	mape: float
	rmse: float
	wql: float

	def to_dict(self) -> dict:
	"""Serializa las métricas"""
	return {
	"mae": self.mae,
	"mape": self.mape,
	"rmse": self.rmse,
	"wql": self.wql
	}


	@dataclass
	class BacktestResult:
	"""
	Resultado completo de un backtest.

	Attributes:
	metrics: Métricas de evaluación
	forecast: Valores pronosticados
	actuals: Valores reales
	timestamps: Timestamps del período de prueba
	"""
	metrics: BacktestMetrics
	forecast: List[float]
	actuals: List[float]
	timestamps: List[str]

	def to_dict(self) -> dict:
	"""Serializa el resultado"""
	return {
	"metrics": self.metrics.to_dict(),
	"forecast": self.forecast,
	"actuals": self.actuals,
	"timestamps": self.timestamps
	}


	class BacktestService:
	"""
	Servicio de dominio para backtesting de modelos.

	Realiza validación de modelos separando la serie en train/test
	y comparando pronósticos con valores reales.

	Attributes:
	model: Modelo de forecasting
	transformer: Transformador de datos

	Example:
	>>> service = BacktestService(model, transformer)
	>>> series = TimeSeries(values=[100, 102, 105, 103, 108, 112, 115])
	>>> result = service.simple_backtest(series, test_length=3)
	>>> result.metrics.mae < 5 # Buen modelo
	True
	"""

	def __init__(
	self,
	model: IForecastModel,
	transformer: IDataTransformer
	):
	"""
	Inicializa el servicio.

	Args:
	model: Implementación de IForecastModel
	transformer: Implementación de IDataTransformer
	"""
	self.model = model
	self.transformer = transformer
	logger.info("BacktestService initialized")

	def simple_backtest(
	self,
	series: TimeSeries,
	test_length: int,
	config: ForecastConfig = None
	) -> BacktestResult:
	"""
	Realiza un backtest simple: train/test split.

	Separa la serie en train (histórico) y test (validación),
	genera pronóstico para el período test y calcula métricas.

	Args:
	series: Serie temporal completa
	test_length: Número de puntos para test (final de la serie)
	config: Configuración del forecast (opcional)

	Returns:
	BacktestResult: Resultado con métricas y pronósticos

	Raises:
	ValueError: Si test_length >= longitud de la serie

	Example:
	>>> series = TimeSeries(values=[100, 102, 105, 103, 108])
	>>> result = service.simple_backtest(series, test_length=2)
	>>> len(result.forecast)
	2
	"""
	logger.info(
	f"Running simple backtest for series '{series.series_id}' "
	f"(total_length={series.length}, test_length={test_length})"
	)

	# Validar
	if test_length >= series.length:
	raise ValueError(
	f"test_length ({test_length}) debe ser menor que "
	f"la longitud de la serie ({series.length})"
	)

	if test_length < 1:
	raise ValueError(f"test_length debe ser >= 1, recibido: {test_length}")

	# Configuración por defecto si no se proporciona
	if config is None:
	config = ForecastConfig(
	prediction_length=test_length,
	quantile_levels=[0.5], # Solo mediana para backtest
	freq=series.freq
	)
	else:
	# Ajustar prediction_length
	config.prediction_length = test_length

	# Separar train/test
	train_length = series.length - test_length
	train_series = series.get_subset(0, train_length)
	test_values = series.values[train_length:]

	logger.debug(f"Train length: {train_length}, Test length: {test_length}")

	# Construir DataFrame de train
	context_df = self.transformer.build_context_df(
	values=train_series.values,
	timestamps=train_series.timestamps,
	series_id=series.series_id,
	freq=config.freq
	)

	# Predecir
	pred_df = self.model.predict(
	context_df=context_df,
	prediction_length=test_length,
	quantile_levels=[0.5]
	)

	# Parsear resultado
	result = self.transformer.parse_prediction_result(
	pred_df=pred_df,
	quantile_levels=[0.5]
	)

	forecast = np.array(result["median"], dtype=float)
	actuals = np.array(test_values, dtype=float)

	# Calcular métricas
	metrics = self._calculate_metrics(forecast, actuals)

	logger.info(
	f"Backtest completed: MAE={metrics.mae:.2f}, "
	f"MAPE={metrics.mape:.2f}%, RMSE={metrics.rmse:.2f}"
	)

	return BacktestResult(
	metrics=metrics,
	forecast=forecast.tolist(),
	actuals=actuals.tolist(),
	timestamps=result["timestamps"]
	)

	def _calculate_metrics(
	self,
	forecast: np.ndarray,
	actuals: np.ndarray
	) -> BacktestMetrics:
	"""
	Calcula métricas de evaluación.

	Args:
	forecast: Valores pronosticados
	actuals: Valores reales

	Returns:
	BacktestMetrics: Métricas calculadas
	"""
	# MAE: Mean Absolute Error
	mae = float(np.mean(np.abs(actuals - forecast)))

	# MAPE: Mean Absolute Percentage Error
	eps = 1e-8
	mape = float(np.mean(np.abs((actuals - forecast) / (actuals + eps)))) * 100.0

	# RMSE: Root Mean Squared Error
	rmse = float(np.sqrt(np.mean((actuals - forecast) ** 2)))

	# WQL: Weighted Quantile Loss (para cuantil 0.5 = MAE/2)
	tau = 0.5
	diff = actuals - forecast
	wql = float(np.mean(np.maximum(tau * diff, (tau - 1) * diff)))

	return BacktestMetrics(
	mae=mae,
	mape=mape,
	rmse=rmse,
	wql=wql
	)