- Testar PPO com TI de hoje e ontem - Testar log return como reward