Spaces:

samkeet
/

MediaMixOptimization

Sleeping

App Files Files Community

MediaMixOptimization / ppt_utils.py

samkeet

Upload 40 files

00b00eb verified 9 days ago

raw

history blame contribute delete

62 kB

	import pandas as pd
	import numpy as np
	import pptx
	from pptx import Presentation
	from pptx.chart.data import CategoryChartData, ChartData
	from pptx.enum.chart import XL_CHART_TYPE, XL_LEGEND_POSITION, XL_LABEL_POSITION
	from pptx.enum.chart import XL_TICK_LABEL_POSITION
	from pptx.util import Inches, Pt
	import os
	import pickle
	from pathlib import Path
	from sklearn.metrics import (
	mean_absolute_error,
	r2_score,
	mean_absolute_percentage_error,
	)
	import streamlit as st
	from collections import OrderedDict
	from utilities import get_metrics_names, initialize_data, retrieve_pkl_object_without_warning
	from io import BytesIO
	from pptx.dml.color import RGBColor
	from post_gres_cred import db_cred
	schema=db_cred['schema']

	from constants import (
	TITLE_FONT_SIZE,
	AXIS_LABEL_FONT_SIZE,
	CHART_TITLE_FONT_SIZE,
	AXIS_TITLE_FONT_SIZE,
	DATA_LABEL_FONT_SIZE,
	LEGEND_FONT_SIZE,
	PIE_LEGEND_FONT_SIZE
	)


	def format_response_metric(target):
	if target.startswith('response_metric_'):
	target = target.replace('response_metric_', '')
	target = target.replace("_", " ").title()
	return target


	def smape(actual, forecast):
	# Symmetric Mape (SMAPE) eliminates shortcomings of MAPE :
	## 1. MAPE becomes insanely high when actual is close to 0
	## 2. MAPE is more favourable to underforecast than overforecast
	return (1 / len(actual)) * np.sum(1 * np.abs(forecast - actual) / (np.abs(actual) + np.abs(forecast)))


	def safe_num_to_per(num):
	try:
	return "{:.0%}".format(num)
	except:
	return num


	# Function to convert numbers to abbreviated format
	def convert_number_to_abbreviation(number):
	try:
	number = float(number)
	if number >= 1000000:
	return f'{number / 1000000:.1f} M'
	elif number >= 1000:
	return f'{number / 1000:.1f} K'
	else:
	return str(number)
	except:
	return number


	def round_off(x, round_off_decimal=0):
	# round off
	try:
	x = float(x)
	if x < 1 and x > 0:
	round_off_decimal = int(np.floor(np.abs(np.log10(x)))) + max(round_off_decimal, 1)
	x = np.round(x, round_off_decimal)
	elif x < 0 and x > -1:
	round_off_decimal = int(np.floor(np.abs(np.log10(np.abs(x))))) + max(round_off_decimal, 1)
	x = -np.round(x, round_off_decimal)
	else:
	x = np.round(x, round_off_decimal)
	return x
	except:
	return x


	def fill_table_placeholder(table_placeholder, slide, df, column_width=None, table_height=None):
	cols = len(df.columns)
	rows = len(df)

	if table_height is None:
	table_height = table_placeholder.height

	x, y, cx, cy = table_placeholder.left, table_placeholder.top, table_placeholder.width, table_height
	table = slide.shapes.add_table(rows + 1, cols, x, y, cx, cy).table

	# Populate the table with data from the DataFrame
	for row_idx, row in enumerate(df.values):
	for col_idx, value in enumerate(row):
	cell = table.cell(row_idx + 1, col_idx)
	cell.text = str(value)
	for col_idx, value in enumerate(df.columns):
	cell = table.cell(0, col_idx)
	cell.text = str(value)

	if column_width is not None:
	for col_idx, column_width in column_width.items():
	table.columns[col_idx].width = Inches(column_width)

	table_placeholder._element.getparent().remove(table_placeholder._element)


	def bar_chart(chart_placeholder, slide, chart_data, titles={}, min_y=None, max_y=None, type='V', legend=True,
	label_type=None, xaxis_pos=None):
	x, y, cx, cy = chart_placeholder.left, chart_placeholder.top, chart_placeholder.width, chart_placeholder.height
	if type == 'V':
	graphic_frame = slide.shapes.add_chart(
	XL_CHART_TYPE.COLUMN_CLUSTERED, x, y, cx, cy, chart_data
	)
	if type == 'H':
	graphic_frame = slide.shapes.add_chart(
	XL_CHART_TYPE.BAR_CLUSTERED, x, y, cx, cy, chart_data
	)
	chart = graphic_frame.chart

	category_axis = chart.category_axis
	value_axis = chart.value_axis

	# Add chart title
	if 'chart_title' in titles.keys():
	chart.has_title = True
	chart.chart_title.text_frame.text = titles['chart_title']
	chart_title = chart.chart_title.text_frame.paragraphs[0].runs[0]
	chart_title.font.size = Pt(CHART_TITLE_FONT_SIZE)

	# Add axis titles
	if 'x_axis' in titles.keys():
	category_axis.has_title = True
	category_axis.axis_title.text_frame.text = titles['x_axis']
	category_title = category_axis.axis_title.text_frame.paragraphs[0].runs[0]
	category_title.font.size = Pt(AXIS_TITLE_FONT_SIZE)

	if 'y_axis' in titles.keys():
	value_axis.has_title = True
	value_axis.axis_title.text_frame.text = titles['y_axis']
	value_title = value_axis.axis_title.text_frame.paragraphs[0].runs[0]
	value_title.font.size = Pt(AXIS_TITLE_FONT_SIZE)

	if xaxis_pos == 'low':
	category_axis.tick_label_position = XL_TICK_LABEL_POSITION.LOW

	# Customize the chart
	if legend:
	chart.has_legend = True
	chart.legend.position = XL_LEGEND_POSITION.BOTTOM
	chart.legend.font.size = Pt(LEGEND_FONT_SIZE)
	chart.legend.include_in_layout = False

	# Adjust font size for axis labels
	category_axis.tick_labels.font.size = Pt(AXIS_LABEL_FONT_SIZE)
	value_axis.tick_labels.font.size = Pt(AXIS_LABEL_FONT_SIZE)

	if min_y is not None:
	value_axis.minimum_scale = min_y # Adjust this value as needed

	if max_y is not None:
	value_axis.maximum_scale = max_y # Adjust this value as needed

	plot = chart.plots[0]
	plot.has_data_labels = True
	data_labels = plot.data_labels

	if label_type == 'per':
	data_labels.number_format = '0"%"'
	elif label_type == '$':
	data_labels.number_format = '$[>=1000000]#,##0.0,,"M";$[>=1000]#,##0.0,"K";$#,##0'
	elif label_type == '$1':
	data_labels.number_format = '$[>=1000000]#,##0,,"M";$[>=1000]#,##0,"K";$#,##0'
	elif label_type == 'M':
	data_labels.number_format = '#0.0,,"M"'
	elif label_type == 'M1':
	data_labels.number_format = '#0.00,,"M"'
	elif label_type == 'K':
	data_labels.number_format = '#0.0,"K"'

	data_labels.font.size = Pt(DATA_LABEL_FONT_SIZE)

	chart_placeholder._element.getparent().remove(chart_placeholder._element)


	def line_chart(chart_placeholder, slide, chart_data, titles={}, min_y=None, max_y=None):
	# Add the chart to the slide
	x, y, cx, cy = chart_placeholder.left, chart_placeholder.top, chart_placeholder.width, chart_placeholder.height

	chart = slide.shapes.add_chart(
	XL_CHART_TYPE.LINE, x, y, cx, cy, chart_data
	).chart

	chart.has_legend = True
	chart.legend.position = XL_LEGEND_POSITION.BOTTOM
	chart.legend.font.size = Pt(LEGEND_FONT_SIZE)

	category_axis = chart.category_axis
	value_axis = chart.value_axis

	if min_y is not None:
	value_axis.minimum_scale = min_y

	if max_y is not None:
	value_axis.maximum_scale = max_y

	if min_y is not None and max_y is not None:
	value_axis.major_unit = int((max_y - min_y) / 2)

	if 'chart_title' in titles.keys():
	chart.has_title = True
	chart.chart_title.text_frame.text = titles['chart_title']
	chart_title = chart.chart_title.text_frame.paragraphs[0].runs[0]
	chart_title.font.size = Pt(CHART_TITLE_FONT_SIZE)

	if 'x_axis' in titles.keys():
	category_axis.has_title = True
	category_axis.axis_title.text_frame.text = titles['x_axis']
	category_title = category_axis.axis_title.text_frame.paragraphs[0].runs[0]
	category_title.font.size = Pt(AXIS_TITLE_FONT_SIZE)

	if 'y_axis' in titles.keys():
	value_axis.has_title = True
	value_axis.axis_title.text_frame.text = titles['y_axis']
	value_title = value_axis.axis_title.text_frame.paragraphs[0].runs[0]
	value_title.font.size = Pt(AXIS_TITLE_FONT_SIZE)

	# Adjust font size for axis labels
	category_axis.tick_labels.font.size = Pt(AXIS_LABEL_FONT_SIZE)
	value_axis.tick_labels.font.size = Pt(AXIS_LABEL_FONT_SIZE)

	plot = chart.plots[0]
	series = plot.series[1]
	line = series.format.line
	line.color.rgb = RGBColor(141, 47, 0)

	chart_placeholder._element.getparent().remove(chart_placeholder._element)


	def pie_chart(chart_placeholder, slide, chart_data, title):
	# Add the chart to the slide
	x, y, cx, cy = chart_placeholder.left, chart_placeholder.top, chart_placeholder.width, chart_placeholder.height

	chart = slide.shapes.add_chart(
	XL_CHART_TYPE.PIE, x, y, cx, cy, chart_data
	).chart

	chart.has_legend = True
	chart.legend.position = XL_LEGEND_POSITION.RIGHT
	chart.legend.include_in_layout = False
	chart.legend.font.size = Pt(PIE_LEGEND_FONT_SIZE)

	chart.plots[0].has_data_labels = True
	data_labels = chart.plots[0].data_labels
	data_labels.number_format = '0%'
	data_labels.position = XL_LABEL_POSITION.OUTSIDE_END
	data_labels.font.size = Pt(DATA_LABEL_FONT_SIZE)

	chart.has_title = True
	chart.chart_title.text_frame.text = title
	chart_title = chart.chart_title.text_frame.paragraphs[0].runs[0]
	chart_title.font.size = Pt(CHART_TITLE_FONT_SIZE)

	chart_placeholder._element.getparent().remove(chart_placeholder._element)


	def title_and_table(slide, title, df, column_width=None, custom_table_height=False):
	placeholders = slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = slide.placeholders[ph_idx[0]]
	title_ph.text = title
	title_ph.text_frame.paragraphs[0].font.size = Pt(TITLE_FONT_SIZE)

	table_placeholder = slide.placeholders[ph_idx[1]]

	table_height = None
	if custom_table_height:
	if len(df) < 4:
	table_height = int(np.ceil(table_placeholder.height / 2))

	fill_table_placeholder(table_placeholder, slide, df, column_width, table_height)

	# try:
	# font_size = 18 # default for 3*3
	# if cols < 3:
	# row_diff = 3 - rows
	# font_size = font_size + ((row_diff)*2) # 1 row less -> 2 pt font size increase & vice versa
	# else:
	# row_diff = 2 - rows
	# font_size = font_size + ((row_diff)*2)
	# for row in table.rows:
	# for cell in row.cells:
	# cell.text_frame.paragraphs[0].runs[0].font.size = Pt(font_size)
	# except Exception as e :
	# print("*"30)
	# print(e)
	# else:
	# except Exception as e:
	# print('table', e)
	return slide


	def data_import(data, bin_dict):
	import_df = pd.DataFrame(columns=['Category', 'Value'])

	import_df.at[0, 'Category'] = 'Date Range'

	date_start = data['date'].min().date()
	date_end = data['date'].max().date()
	import_df.at[0, 'Value'] = str(date_start) + ' - ' + str(date_end)

	import_df.at[1, 'Category'] = 'Response Metrics'
	import_df.at[1, 'Value'] = ', '.join(bin_dict['Response Metrics'])

	import_df.at[2, 'Category'] = 'Media Variables'
	import_df.at[2, 'Value'] = ', '.join(bin_dict['Media'])

	import_df.at[3, 'Category'] = 'Spend Variables'
	import_df.at[3, 'Value'] = ', '.join(bin_dict['Spends'])

	if bin_dict['Exogenous'] != []:
	import_df.at[4, 'Category'] = 'Exogenous Variables'
	import_df.at[4, 'Value'] = ', '.join(bin_dict['Exogenous'])

	return import_df


	def channel_groups_df(channel_groups_dct={}, bin_dict={}):
	df = pd.DataFrame(columns=['Channel', 'Media Variables', 'Spend Variables'])
	i = 0
	for channel, vars in channel_groups_dct.items():
	media_vars = ", ".join(list(set(vars).intersection(set(bin_dict["Media"]))))
	spend_vars = ", ".join(list(set(vars).intersection(set(bin_dict["Spends"]))))
	df.at[i, "Channel"] = channel
	df.at[i, 'Media Variables'] = media_vars
	df.at[i, 'Spend Variables'] = spend_vars
	i += 1

	return df


	def transformations(transform_dict):
	transform_df = pd.DataFrame(columns=['Category', 'Transformation', 'Value'])
	i = 0

	for category in ['Media', 'Exogenous']:
	transformations = f'transformation_{category}'
	category_dict = transform_dict[category]
	if transformations in category_dict.keys():
	for transformation in category_dict[transformations]:
	transform_df.at[i, 'Category'] = category
	transform_df.at[i, 'Transformation'] = transformation
	transform_df.at[i, 'Value'] = str(category_dict[transformation][0]) + ' - ' + str(
	category_dict[transformation][1])
	i += 1
	return transform_df


	def model_metrics(model_dict, is_panel):
	metrics_df = pd.DataFrame(
	columns=[
	"Response Metric",
	"Model",
	"R2",
	"ADJR2",
	"Train MAPE",
	"Test MAPE"
	]
	)
	i = 0
	for key in model_dict.keys():
	target = key.split("__")[1]
	metrics_df.at[i, "Response Metric"] = format_response_metric(target)
	metrics_df.at[i, "Model"] = key.split("__")[0]

	y = model_dict[key]["X_train_tuned"][target]

	feature_set = model_dict[key]["feature_set"]

	if is_panel:
	random_df = get_random_effects(
	media_data, panel_col, model_dict[key]["Model_object"]
	)
	pred = mdf_predict(
	model_dict[key]["X_train_tuned"],
	model_dict[key]["Model_object"],
	random_df,
	)["pred"]
	else:
	pred = model_dict[key]["Model_object"].predict(model_dict[key]["X_train_tuned"][feature_set])

	ytest = model_dict[key]["X_test_tuned"][target]
	if is_panel:

	predtest = mdf_predict(
	model_dict[key]["X_test_tuned"],
	model_dict[key]["Model_object"],
	random_df,
	)["pred"]

	else:
	predtest = model_dict[key]["Model_object"].predict(model_dict[key]["X_test_tuned"][feature_set])

	metrics_df.at[i, "R2"] = np.round(r2_score(y, pred), 2)
	adjr2 = 1 - (1 - metrics_df.loc[i, "R2"]) * (
	len(y) - 1
	) / (len(y) - len(model_dict[key]["feature_set"]) - 1)
	metrics_df.at[i, "ADJR2"] = np.round(adjr2, 2)
	# y = np.where(np.abs(y) < 0.00001, 0.00001, y)
	metrics_df.at[i, "Train MAPE"] = np.round(smape(y, pred), 2)
	metrics_df.at[i, "Test MAPE"] = np.round(smape(ytest, predtest), 2)
	i += 1
	metrics_df = np.round(metrics_df, 2)

	return metrics_df


	def model_result(slide, model_key, model_dict, model_metrics_df, date_col):
	placeholders = slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = slide.placeholders[ph_idx[0]]
	title_ph.text = model_key.split('__')[0]
	title_ph.text_frame.paragraphs[0].font.size = Pt(TITLE_FONT_SIZE)
	target = model_key.split('__')[1]

	metrics_table_placeholder = slide.placeholders[ph_idx[1]]
	metrics_df = model_metrics_df[model_metrics_df['Model'] == model_key.split('__')[0]].reset_index(drop=True)

	# Accuracy = 1-mape
	metrics_df['Accuracy'] = 100 * (1 - metrics_df['Train MAPE'])
	metrics_df['Accuracy'] = metrics_df['Accuracy'].apply(lambda x: f'{np.round(x, 0)}%')

	## Removing metrics as requested by Ioannis

	metrics_df = metrics_df.drop(columns=['R2', 'ADJR2', 'Train MAPE', 'Test MAPE'])
	fill_table_placeholder(metrics_table_placeholder, slide, metrics_df)

	# coeff_table_placeholder = slide.placeholders[ph_idx[2]]
	# coeff_df = pd.DataFrame(model_dict['Model_object'].params)
	# coeff_df.reset_index(inplace=True)
	# coeff_df.columns = ['Feature', 'Coefficent']
	# fill_table_placeholder(coeff_table_placeholder, slide, coeff_df)

	chart_placeholder = slide.placeholders[ph_idx[2]]
	full_df = pd.concat([model_dict['X_train_tuned'], model_dict['X_test_tuned']])
	full_df['Predicted'] = model_dict['Model_object'].predict(full_df[model_dict['feature_set']])
	pred_df = full_df[[date_col, target, 'Predicted']]
	pred_df.rename(columns={target: 'Actual'}, inplace=True)

	# Create chart data
	chart_data = CategoryChartData()
	chart_data.categories = pred_df[date_col]
	chart_data.add_series('Actual', pred_df['Actual'])
	chart_data.add_series('Predicted', pred_df['Predicted'])

	# Set range for y axis
	min_y = np.floor(min(pred_df['Actual'].min(), pred_df['Predicted'].min()))
	max_y = np.ceil(max(pred_df['Actual'].max(), pred_df['Predicted'].max()))

	# Create the chart
	line_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Actual VS Predicted',
	'x_axis': 'Date',
	'y_axis': target.title().replace('_', ' ')
	},
	min_y=min_y,
	max_y=max_y
	)

	return slide


	def metrics_contributions(slide, contributions_excels_dict, panel_col):
	# Create data for metrics contributions
	all_contribution_df = pd.DataFrame(columns=['Channel'])
	target_sum_dict = {}
	sort_support_dct = {}
	for target in contributions_excels_dict.keys():
	contribution_df = contributions_excels_dict[target]['CONTRIBUTION MMM'].copy()
	if 'Date' in contribution_df.columns:
	contribution_df.drop(columns=['Date'], inplace=True)
	if panel_col in contribution_df.columns:
	contribution_df.drop(columns=[panel_col], inplace=True)

	contribution_df = pd.DataFrame(np.sum(contribution_df, axis=0)).reset_index()
	contribution_df.columns = ['Channel', target]
	target_sum = contribution_df[target].sum()
	target_sum_dict[target] = target_sum
	contribution_df[target] = 100 * contribution_df[target] / target_sum

	all_contribution_df = pd.merge(all_contribution_df, contribution_df, on='Channel', how='outer')

	sorted_target_sum_dict = sorted(target_sum_dict.items(), key=lambda kv: kv[1], reverse=True)
	sorted_target_sum_keys = [kv[0] for kv in sorted_target_sum_dict]
	if len([metric for metric in sorted_target_sum_keys if metric.lower() == 'revenue']) == 1:
	rev_metric = [metric for metric in sorted_target_sum_keys if metric.lower() == 'revenue'][0]
	sorted_target_sum_keys.remove(rev_metric)
	sorted_target_sum_keys.append(rev_metric)
	all_contribution_df = all_contribution_df[['Channel'] + sorted_target_sum_keys]

	# for col in all_contribution_df.columns:
	# all_contribution_df[col]=all_contribution_df[col].apply(lambda x: round_off(x,1))

	# Sort Data by Average contribution of the channels keeping base first <Removed>
	# all_contribution_df['avg'] = np.mean(all_contribution_df[list(contributions_excels_dict.keys())],axis=1)
	# all_contribution_df['rank'] = all_contribution_df['avg'].rank(ascending=False)

	# Sort data by contribution of bottom funnel metric
	bottom_funnel_metric = sorted_target_sum_keys[-1]
	all_contribution_df['rank'] = all_contribution_df[bottom_funnel_metric].rank(ascending=False)
	all_contribution_df.loc[all_contribution_df[all_contribution_df['Channel'] == 'base'].index, 'rank'] = 0
	all_contribution_df = all_contribution_df.sort_values(by='rank')
	all_contribution_df.drop(columns=['rank'], inplace=True)

	# Add title
	placeholders = slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = slide.placeholders[ph_idx[0]]
	title_ph.text = "Response Metrics Contributions"
	title_ph.text_frame.paragraphs[0].font.size = Pt(TITLE_FONT_SIZE)

	for target in contributions_excels_dict.keys():
	all_contribution_df[target] = all_contribution_df[target].astype(float)


	# Create chart data
	chart_data = CategoryChartData()
	chart_data.categories = all_contribution_df['Channel']
	for target in sorted_target_sum_keys:
	chart_data.add_series(format_response_metric(target), all_contribution_df[target])
	chart_placeholder = slide.placeholders[ph_idx[1]]

	if isinstance(np.min(all_contribution_df.select_dtypes(exclude=['object', 'datetime'])), float):

	# Add the chart to the slide
	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Response Metrics Contributions',
	# 'x_axis':'Channels',
	'y_axis': 'Contributions'},
	min_y=np.floor(np.min(all_contribution_df.select_dtypes(exclude=['object', 'datetime']))),
	max_y=np.ceil(np.max(all_contribution_df.select_dtypes(exclude=['object', 'datetime']))),
	type='V',
	label_type='per'
	)
	else:

	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Response Metrics Contributions',
	# 'x_axis':'Channels',
	'y_axis': 'Contributions'},
	min_y=np.floor(np.min(all_contribution_df.select_dtypes(exclude=['object', 'datetime'])).values[0]),
	max_y=np.ceil(np.max(all_contribution_df.select_dtypes(exclude=['object', 'datetime'])).values[0]),
	type='V',
	label_type='per'
	)

	return slide


	def model_media_performance(slide, target, contributions_excels_dict, date_col='Date', is_panel=False,
	panel_col='panel'):
	# Add title
	placeholders = slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = slide.placeholders[ph_idx[0]]
	title_ph.text = "Media Performance - " + target.title().replace("_", " ")
	title_ph.text_frame.paragraphs[0].font.size = Pt(TITLE_FONT_SIZE)

	# CONTRIBUTION CHART
	# Create contribution data
	contribution_df = contributions_excels_dict[target]['CONTRIBUTION MMM']
	if panel_col in contribution_df.columns:
	contribution_df.drop(columns=[panel_col], inplace=True)
	# contribution_df.drop(columns=[date_col], inplace=True)
	contribution_df = pd.DataFrame(np.sum(contribution_df, axis=0)).reset_index()
	contribution_df.columns = ['Channel', format_response_metric(target)]
	contribution_df['Channel'] = contribution_df['Channel'].apply(lambda x: x.title())
	target_sum = contribution_df[format_response_metric(target)].sum()
	contribution_df[format_response_metric(target)] = contribution_df[format_response_metric(target)] / target_sum
	contribution_df.sort_values(by=['Channel'], ascending=False, inplace=True)

	# for col in contribution_df.columns:
	# contribution_df[col] = contribution_df[col].apply(lambda x : round_off(x))

	# Create Chart Data
	chart_data = ChartData()
	chart_data.categories = contribution_df['Channel']
	chart_data.add_series('Contribution', contribution_df[format_response_metric(target)])

	chart_placeholder = slide.placeholders[ph_idx[2]]
	pie_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	title='Contribution')

	# SPENDS CHART

	initialize_data(panel='aggregated', metrics=target)
	scenario = st.session_state["scenario"]
	spends_values = {
	channel_name: round(
	scenario.channels[channel_name].actual_total_spends
	* scenario.channels[channel_name].conversion_rate,
	1,
	)
	for channel_name in st.session_state["channels_list"]
	}
	spends_df = pd.DataFrame(columns=['Channel', 'Media Spend'])
	spends_df['Channel'] = list(spends_values.keys())
	spends_df['Media Spend'] = list(spends_values.values())
	spends_sum = spends_df['Media Spend'].sum()
	spends_df['Media Spend'] = spends_df['Media Spend'] / spends_sum
	spends_df['Channel'] = spends_df['Channel'].apply(lambda x: x.title())
	spends_df.sort_values(by='Channel', ascending=False, inplace=True)
	# for col in spends_df.columns:
	# spends_df[col] = spends_df[col].apply(lambda x : round_off(x))

	# Create Chart Data
	spends_chart_data = ChartData()
	spends_chart_data = ChartData()
	spends_chart_data.categories = spends_df['Channel']
	spends_chart_data.add_series('Media Spend', spends_df['Media Spend'])

	spends_chart_placeholder = slide.placeholders[ph_idx[1]]
	pie_chart(chart_placeholder=spends_chart_placeholder,
	slide=slide,
	chart_data=spends_chart_data,
	title='Media Spend')
	# spends_values.append(0)
	return contribution_df, spends_df


	# def get_saved_scenarios_dict(project_path):
	# # Path to the saved scenarios file
	# saved_scenarios_dict_path = os.path.join(
	# project_path, "saved_scenarios.pkl"
	# )
	#
	# # Load existing scenarios if the file exists
	# if os.path.exists(saved_scenarios_dict_path):
	# with open(saved_scenarios_dict_path, "rb") as f:
	# saved_scenarios_dict = pickle.load(f)
	# else:
	# saved_scenarios_dict = OrderedDict()
	#
	# return saved_scenarios_dict

	def optimization_summary(slide, scenario, scenario_name):
	placeholders = slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = slide.placeholders[ph_idx[0]]
	title_ph.text = 'Optimization Summary' # + ' (Scenario: ' + scenario_name + ')'
	title_ph.text_frame.paragraphs[0].font.size = Pt(TITLE_FONT_SIZE)

	multiplier = 1 / float(scenario['multiplier'])
	# st.write(scenario['multiplier'], multiplier)
	## Multiplier is an indicator of selected time fram
	## Doesn't effect CPA

	opt_on = scenario['optimization']
	if opt_on.lower() == 'spends':
	opt_on = 'Media Spend'

	details_ph = slide.placeholders[ph_idx[3]]
	details_ph.text = 'Scenario Name: ' + scenario_name + \
	'\nResponse Metric: ' + str(scenario['metrics_selected']).replace("_", " ").title() + \
	'\nOptimized on: ' + str(opt_on).replace("_", " ").title()

	scenario_df = pd.DataFrame(columns=['Category', 'Actual', 'Simulated', 'Change'])
	scenario_df.at[0, 'Category'] = 'Media Spend'

	scenario_df.at[0, 'Actual'] = scenario['actual_total_spends'] * multiplier
	scenario_df.at[0, 'Simulated'] = scenario['modified_total_spends'] * multiplier
	scenario_df.at[0, 'Change'] = (scenario['modified_total_spends'] - scenario['actual_total_spends']) * multiplier

	scenario_df.at[1, 'Category'] = scenario['metrics_selected'].replace("_", " ").title()
	scenario_df.at[1, 'Actual'] = scenario['actual_total_sales'] * multiplier
	scenario_df.at[1, 'Simulated'] = (scenario['modified_total_sales']) * multiplier
	scenario_df.at[1, 'Change'] = (scenario['modified_total_sales'] - scenario['actual_total_sales']) * multiplier

	scenario_df.at[2, 'Category'] = 'CPA'
	actual_cpa = scenario['actual_total_spends'] / scenario['actual_total_sales']
	modified_cpa = scenario['modified_total_spends'] / scenario['modified_total_sales']
	scenario_df.at[2, 'Actual'] = actual_cpa
	scenario_df.at[2, 'Simulated'] = modified_cpa
	scenario_df.at[2, 'Change'] = modified_cpa - actual_cpa

	scenario_df.at[3, 'Category'] = 'ROI'
	act_roi = scenario['actual_total_sales'] / scenario['actual_total_spends']
	opt_roi = scenario['modified_total_sales'] / scenario['modified_total_spends']
	scenario_df.at[3, 'Actual'] = act_roi
	scenario_df.at[3, 'Simulated'] = opt_roi
	scenario_df.at[3, 'Change'] = opt_roi - act_roi

	for col in scenario_df.columns:
	scenario_df[col] = scenario_df[col].apply(lambda x: round_off(x, 1))
	scenario_df[col] = scenario_df[col].apply(lambda x: convert_number_to_abbreviation(x))

	table_placeholder = slide.placeholders[ph_idx[1]]
	fill_table_placeholder(table_placeholder, slide, scenario_df)

	channel_spends_df = pd.DataFrame(columns=['Channel', 'Actual Spends', 'Optimized Spends'])
	for i, channel in enumerate(scenario['channels'].values()):
	channel_spends_df.at[i, 'Channel'] = channel['name']
	channel_conversion_rate = channel[
	"conversion_rate"
	]
	channel_spends_df.at[i, 'Actual Spends'] = (
	channel["actual_total_spends"]
	* channel_conversion_rate
	) * multiplier
	channel_spends_df.at[i, 'Optimized Spends'] = (
	channel["modified_total_spends"]
	* channel_conversion_rate
	) * multiplier
	channel_spends_df['Actual Spends'] = channel_spends_df['Actual Spends'].astype('float')
	channel_spends_df['Optimized Spends'] = channel_spends_df['Optimized Spends'].astype('float')

	for col in channel_spends_df.columns:
	channel_spends_df[col] = channel_spends_df[col].apply(lambda x: round_off(x, 0))

	# Sort data on Actual Spends
	channel_spends_df.sort_values(by='Actual Spends', inplace=True, ascending=False)

	# Create chart data
	chart_data = CategoryChartData()
	chart_data.categories = channel_spends_df['Channel']
	for col in ['Actual Spends', 'Optimized Spends']:
	chart_data.add_series(col, channel_spends_df[col])

	chart_placeholder = slide.placeholders[ph_idx[2]]

	# Add the chart to the slide
	if isinstance(np.max(channel_spends_df.select_dtypes(exclude=['object', 'datetime'])),float):
	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Channel Wise Spends',
	# 'x_axis':'Channels',
	'y_axis': 'Spends'},
	# min_y=np.floor(np.min(channel_spends_df.select_dtypes(exclude=['object', 'datetime']))),
	min_y=0,
	max_y=np.ceil(np.max(channel_spends_df.select_dtypes(exclude=['object', 'datetime']))),
	label_type='$'
	)
	else:
	# Add the chart to the slide
	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Channel Wise Spends',
	# 'x_axis':'Channels',
	'y_axis': 'Spends'},
	# min_y=np.floor(np.min(channel_spends_df.select_dtypes(exclude=['object', 'datetime']))),
	min_y=0,
	max_y=np.ceil(np.max(channel_spends_df.select_dtypes(exclude=['object', 'datetime'])).values[0]),
	label_type='$'
	)


	def channel_wise_spends(slide, scenario):
	placeholders = slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = slide.placeholders[ph_idx[0]]
	title_ph.text = 'Channel Spends and Impact'
	title_ph.text_frame.paragraphs[0].font.size = Pt(TITLE_FONT_SIZE)
	# print(scenario.keys())

	multiplier = 1 / float(scenario['multiplier'])
	channel_spends_df = pd.DataFrame(columns=['Channel', 'Actual Spends', 'Optimized Spends'])
	for i, channel in enumerate(scenario['channels'].values()):
	channel_spends_df.at[i, 'Channel'] = channel['name']
	channel_conversion_rate = channel["conversion_rate"]
	channel_spends_df.at[i, 'Actual Spends'] = (channel[
	"actual_total_spends"] * channel_conversion_rate) * multiplier
	channel_spends_df.at[i, 'Optimized Spends'] = (channel[
	"modified_total_spends"] * channel_conversion_rate) * multiplier
	channel_spends_df['Actual Spends'] = channel_spends_df['Actual Spends'].astype('float')
	channel_spends_df['Optimized Spends'] = channel_spends_df['Optimized Spends'].astype('float')

	actual_sum = channel_spends_df['Actual Spends'].sum()
	opt_sum = channel_spends_df['Optimized Spends'].sum()

	for col in channel_spends_df.columns:
	channel_spends_df[col] = channel_spends_df[col].apply(lambda x: round_off(x, 0))

	channel_spends_df['Actual Spends %'] = 100 * (channel_spends_df['Actual Spends'] / actual_sum)
	channel_spends_df['Optimized Spends %'] = 100 * (channel_spends_df['Optimized Spends'] / opt_sum)
	channel_spends_df['Actual Spends %'] = np.round(channel_spends_df['Actual Spends %'])
	channel_spends_df['Optimized Spends %'] = np.round(channel_spends_df['Optimized Spends %'])

	# Sort Data based on Actual Spends %
	channel_spends_df.sort_values(by='Actual Spends %', inplace=True)

	# Create chart data
	chart_data = CategoryChartData()
	chart_data.categories = channel_spends_df['Channel']
	for col in ['Actual Spends %', 'Optimized Spends %']:
	# for col in ['Actual Spends %']:
	chart_data.add_series(col, channel_spends_df[col])
	chart_placeholder = slide.placeholders[ph_idx[1]]

	# Add the chart to the slide
	if isinstance(np.max(channel_spends_df[['Actual Spends %', 'Optimized Spends %']]), float):
	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Spend Split %',
	# 'x_axis':'Channels',
	'y_axis': 'Spend %'},
	min_y=0,
	max_y=np.ceil(np.max(channel_spends_df[['Actual Spends %', 'Optimized Spends %']])),
	type='H',
	legend=True,
	label_type='per',
	xaxis_pos='low'
	)
	else:
	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Spend Split %',
	# 'x_axis':'Channels',
	'y_axis': 'Spend %'},
	min_y=0,
	max_y=np.ceil(np.max(channel_spends_df[['Actual Spends %', 'Optimized Spends %']]).values[0]),
	type='H',
	legend=True,
	label_type='per',
	xaxis_pos='low'
	)
	#
	# # Create chart data
	# chart_data_1 = CategoryChartData()
	# chart_data_1.categories = channel_spends_df['Channel']
	# # for col in ['Actual Spends %', 'Optimized Spends %']:
	# for col in ['Optimized Spends %']:
	# chart_data_1.add_series(col, channel_spends_df[col])
	# chart_placeholder_1 = slide.placeholders[ph_idx[3]]
	#
	# # Add the chart to the slide
	# bar_chart(chart_placeholder=chart_placeholder_1,
	# slide=slide,
	# chart_data=chart_data_1,
	# titles={'chart_title': 'Optimized Spends Split %',
	# # 'x_axis':'Channels',
	# 'y_axis': 'Spends %'},
	# min_y=0,
	# max_y=np.ceil(np.max(channel_spends_df[['Actual Spends %', 'Optimized Spends %']])),
	# type='H',
	# legend=False,
	# label_type='per'
	# )

	channel_spends_df['Delta %'] = 100 * (channel_spends_df['Optimized Spends'] - channel_spends_df['Actual Spends']) / \
	channel_spends_df['Actual Spends']
	channel_spends_df['Delta %'] = channel_spends_df['Delta %'].apply(lambda x: round_off(x, 0))

	# Create chart data
	delta_chart_data = CategoryChartData()
	delta_chart_data.categories = channel_spends_df['Channel']
	col = 'Delta %'
	delta_chart_data.add_series(col, channel_spends_df[col])
	delta_chart_placeholder = slide.placeholders[ph_idx[3]]

	# Add the chart to the slide
	if isinstance(np.min(channel_spends_df['Delta %']), float):
	bar_chart(chart_placeholder=delta_chart_placeholder,
	slide=slide,
	chart_data=delta_chart_data,
	titles={'chart_title': 'Spend Delta %',
	'y_axis': 'Spend Delta %'},
	min_y=np.floor(np.min(channel_spends_df['Delta %'])),
	max_y=np.ceil(np.max(channel_spends_df['Delta %'])),
	type='H',
	legend=False,
	label_type='per',
	xaxis_pos='low'

	)
	else:
	bar_chart(chart_placeholder=delta_chart_placeholder,
	slide=slide,
	chart_data=delta_chart_data,
	titles={'chart_title': 'Spend Delta %',
	'y_axis': 'Spend Delta %'},
	min_y=np.floor(np.min(channel_spends_df['Delta %']).values[0]),
	max_y=np.ceil(np.max(channel_spends_df['Delta %']).values[0]),
	type='H',
	legend=False,
	label_type='per',
	xaxis_pos='low'

	)

	# Incremental Impact
	channel_inc_df = pd.DataFrame(columns=['Channel', 'Increment'])
	for i, channel in enumerate(scenario['channels'].values()):
	channel_inc_df.at[i, 'Channel'] = channel['name']
	act_impact = channel['actual_total_sales']
	opt_impact = channel['modified_total_sales']
	impact = opt_impact - act_impact
	impact = round_off(impact, 0)
	impact = impact if abs(impact) > 0.0001 else 0
	channel_inc_df.at[i, 'Increment'] = impact

	channel_inc_df_1 = pd.merge(channel_spends_df, channel_inc_df, how='left', on='Channel')

	# Create chart data
	delta_chart_data = CategoryChartData()
	delta_chart_data.categories = channel_inc_df_1['Channel']
	col = 'Increment'
	delta_chart_data.add_series(col, channel_inc_df_1[col])
	delta_chart_placeholder = slide.placeholders[ph_idx[2]]

	label_req = True
	if min(np.abs(channel_inc_df_1[col])) > 100000: # 0.1M
	label_type = 'M'
	elif min(np.abs(channel_inc_df_1[col])) > 10000 and max(np.abs(channel_inc_df_1[col])) > 1000000:
	label_type = 'M1'
	elif min(np.abs(channel_inc_df_1[col])) > 100 and max(np.abs(channel_inc_df_1[col])) > 1000:
	label_type = 'K'
	else:
	label_req = False
	# Add the chart to the slide
	if label_req:
	bar_chart(chart_placeholder=delta_chart_placeholder,
	slide=slide,
	chart_data=delta_chart_data,
	titles={'chart_title': 'Incremental Impact',
	'y_axis': format_response_metric(scenario['metrics_selected'])},
	# min_y=np.floor(np.min(channel_inc_df_1['Delta %'])),
	# max_y=np.ceil(np.max(channel_inc_df_1['Delta %'])),
	type='H',
	label_type=label_type,
	legend=False,
	xaxis_pos='low'
	)
	else:
	bar_chart(chart_placeholder=delta_chart_placeholder,
	slide=slide,
	chart_data=delta_chart_data,
	titles={'chart_title': 'Increment',
	'y_axis': scenario['metrics_selected']},
	# min_y=np.floor(np.min(channel_inc_df_1['Delta %'])),
	# max_y=np.ceil(np.max(channel_inc_df_1['Delta %'])),
	type='H',
	legend=False,
	xaxis_pos='low'
	)


	def channel_wise_roi(slide, scenario):
	channel_roi_mroi = scenario['channel_roi_mroi']

	# Add title
	placeholders = slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = slide.placeholders[ph_idx[0]]
	title_ph.text = 'Channel ROIs'
	title_ph.text_frame.paragraphs[0].font.size = Pt(TITLE_FONT_SIZE)

	channel_roi_df = pd.DataFrame(columns=['Channel', 'Actual ROI', 'Optimized ROI'])
	for i, channel in enumerate(channel_roi_mroi.keys()):
	channel_roi_df.at[i, 'Channel'] = channel
	channel_roi_df.at[i, 'Actual ROI'] = channel_roi_mroi[channel]['actual_roi']
	channel_roi_df.at[i, 'Optimized ROI'] = channel_roi_mroi[channel]['optimized_roi']
	channel_roi_df['Actual ROI'] = channel_roi_df['Actual ROI'].astype('float')
	channel_roi_df['Optimized ROI'] = channel_roi_df['Optimized ROI'].astype('float')

	for col in channel_roi_df.columns:
	channel_roi_df[col] = channel_roi_df[col].apply(lambda x: round_off(x, 2))

	# Create chart data
	chart_data = CategoryChartData()
	chart_data.categories = channel_roi_df['Channel']
	for col in ['Actual ROI', 'Optimized ROI']:
	chart_data.add_series(col, channel_roi_df[col])

	chart_placeholder = slide.placeholders[ph_idx[1]]

	# Add the chart to the slide
	if isinstance(channel_roi_df.select_dtypes(exclude=['object', 'datetime']), float):
	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Channel Wise ROI',
	# 'x_axis':'Channels',
	'y_axis': 'ROI'},
	# min_y=np.floor(np.min(channel_spends_df.select_dtypes(exclude=['object', 'datetime']))),
	min_y=0,
	max_y=np.max(channel_roi_df.select_dtypes(exclude=['object', 'datetime']))
	)
	else:
	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Channel Wise ROI',
	# 'x_axis':'Channels',
	'y_axis': 'ROI'},
	# min_y=np.floor(np.min(channel_spends_df.select_dtypes(exclude=['object', 'datetime']))),
	min_y=0,
	max_y=np.max(channel_roi_df.select_dtypes(exclude=['object', 'datetime'])).values[0]
	)
	# act_roi = scenario['actual_total_sales']/scenario['actual_total_spends']
	# opt_roi = scenario['modified_total_sales']/scenario['modified_total_spends']
	#
	# act_roi_ph = slide.placeholders[ph_idx[2]]
	# act_roi_ph.text = 'Actual ROI: ' + str(round_off(act_roi,2))
	# opt_roi_ph = slide.placeholders[ph_idx[3]]
	# opt_roi_ph.text = 'Optimized ROI: ' + str(round_off(opt_roi, 2))

	## Removing mroi chart as per Ioannis' feedback
	# channel_mroi_df = pd.DataFrame(columns=['Channel', 'Actual mROI', 'Optimized mROI'])
	# for i, channel in enumerate(channel_roi_mroi.keys()):
	# channel_mroi_df.at[i, 'Channel'] = channel
	# channel_mroi_df.at[i, 'Actual mROI'] = channel_roi_mroi[channel]['actual_mroi']
	# channel_mroi_df.at[i, 'Optimized mROI'] = channel_roi_mroi[channel]['optimized_mroi']
	# channel_mroi_df['Actual mROI']=channel_mroi_df['Actual mROI'].astype('float')
	# channel_mroi_df['Optimized mROI']=channel_mroi_df['Optimized mROI'].astype('float')
	#
	# for col in channel_mroi_df.columns:
	# channel_mroi_df[col]=channel_mroi_df[col].apply(lambda x: round_off(x))
	#
	# # Create chart data
	# mroi_chart_data = CategoryChartData()
	# mroi_chart_data.categories = channel_mroi_df['Channel']
	# for col in ['Actual mROI', 'Optimized mROI']:
	# mroi_chart_data.add_series(col, channel_mroi_df[col])
	#
	# mroi_chart_placeholder=slide.placeholders[ph_idx[2]]
	#
	# # Add the chart to the slide
	# bar_chart(chart_placeholder=mroi_chart_placeholder,
	# slide=slide,
	# chart_data=mroi_chart_data,
	# titles={'chart_title':'Channel Wise mROI',
	# # 'x_axis':'Channels',
	# 'y_axis':'mROI'},
	# # min_y=np.floor(np.min(channel_mroi_df.select_dtypes(exclude=['object', 'datetime']))),
	# min_y=0,
	# max_y=np.ceil(np.max(channel_mroi_df.select_dtypes(exclude=['object', 'datetime'])))
	# )


	def effictiveness_efficiency(slide, final_data, bin_dct, scenario):
	# Add title
	placeholders = slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = slide.placeholders[ph_idx[0]]
	title_ph.text = 'Effectiveness and Efficiency'
	title_ph.text_frame.paragraphs[0].font.size = Pt(TITLE_FONT_SIZE)

	response_metrics = bin_dct['Response Metrics']

	kpi_df = final_data[response_metrics].sum(axis=0).reset_index()
	kpi_df.columns = ['Response Metric', 'Effectiveness']
	kpi_df['Efficiency'] = kpi_df['Effectiveness'] / scenario['modified_total_spends']
	kpi_df['Efficiency'] = kpi_df['Efficiency'].apply(lambda x: round_off(x, 1))
	kpi_df.sort_values(by='Effectiveness', inplace=True)
	kpi_df['Response Metric'] = kpi_df['Response Metric'].apply(lambda x: format_response_metric(x))

	# Create chart data for effectiveness
	chart_data = CategoryChartData()
	chart_data.categories = kpi_df['Response Metric']
	chart_data.add_series('Effectiveness', kpi_df['Effectiveness'])

	chart_placeholder = slide.placeholders[ph_idx[1]]

	# Add the chart to the slide
	bar_chart(chart_placeholder=chart_placeholder,
	slide=slide,
	chart_data=chart_data,
	titles={'chart_title': 'Effectiveness',
	# 'x_axis':'Channels',
	# 'y_axis': 'ROI'
	},
	# min_y=np.floor(np.min(channel_spends_df.select_dtypes(exclude=['object', 'datetime']))),
	min_y=0,
	# max_y=np.max(channel_roi_df.select_dtypes(exclude=['object', 'datetime'])),
	type='H',
	label_type='M'
	)

	# Create chart data for efficiency
	chart_data_1 = CategoryChartData()
	chart_data_1.categories = kpi_df['Response Metric']
	chart_data_1.add_series('Efficiency', kpi_df['Efficiency'])

	chart_placeholder_1 = slide.placeholders[ph_idx[2]]

	# Add the chart to the slide
	bar_chart(chart_placeholder=chart_placeholder_1,
	slide=slide,
	chart_data=chart_data_1,
	titles={'chart_title': 'Efficiency',
	# 'x_axis':'Channels',
	# 'y_axis': 'ROI'
	},
	# min_y=np.floor(np.min(channel_spends_df.select_dtypes(exclude=['object', 'datetime']))),
	min_y=0,
	# max_y=np.max(channel_roi_df.select_dtypes(exclude=['object', 'datetime'])),
	type='H'
	)

	definition_ph_1 = slide.placeholders[ph_idx[3]]
	definition_ph_1.text = 'Effectiveness is measured as the total sum of the Response Metric'
	definition_ph_2 = slide.placeholders[ph_idx[4]]
	definition_ph_2.text = 'Efficiency is measured as the ratio of sum of the Response Metric and sum of Media Spend'


	def load_pickle(path):
	with open(path, "rb") as f:
	file_data = pickle.load(f)
	return file_data


	def read_all_files():
	files=[]

	# Read data and bin dictionary
	if st.session_state["project_dct"]["data_import"]["imputed_tool_df"] is not None:
	final_df_loaded = st.session_state["project_dct"]["data_import"]["imputed_tool_df"].copy()
	bin_dict_loaded = st.session_state["project_dct"]["data_import"]["category_dict"].copy()

	files.append(final_df_loaded)
	files.append(bin_dict_loaded)

	if "group_dict" in st.session_state["project_dct"]["data_import"].keys():
	channels = st.session_state["project_dct"]["data_import"]["group_dict"]
	files.append(channels)


	if st.session_state["project_dct"]["transformations"]["final_df"] is not None:
	transform_dict = st.session_state["project_dct"]["transformations"]
	files.append(transform_dict)
	if retrieve_pkl_object_without_warning(st.session_state['project_number'], "Model_Tuning", "tuned_model", schema) is not None:
	tuned_model_dict = retrieve_pkl_object_without_warning(st.session_state['project_number'], "Model_Tuning",
	"tuned_model", schema) # db

	files.append(tuned_model_dict)
	else:
	files.append(None)
	else:
	files.append(None)

	if len(list(st.session_state["project_dct"]["current_media_performance"]["model_outputs"].keys()))>0: # check if there are model outputs for at least one metric
	metrics_list = list(st.session_state["project_dct"]["current_media_performance"]["model_outputs"].keys())
	contributions_excels_dict = {}
	for metrics in metrics_list:
	# raw_df = st.session_state["project_dct"]["current_media_performance"]["model_outputs"][metrics]["raw_data"]
	# spend_df = st.session_state["project_dct"]["current_media_performance"]["model_outputs"][metrics]["spends_data"]
	contribution_df = st.session_state["project_dct"]["current_media_performance"]["model_outputs"][metrics]["contribution_data"]
	contributions_excels_dict[metrics] = {'CONTRIBUTION MMM':contribution_df}
	files.append(contributions_excels_dict)

	# Get Saved Scenarios
	if len(list(st.session_state["project_dct"]["saved_scenarios"]["saved_scenarios_dict"].keys()))>0:
	files.append(st.session_state["project_dct"]["saved_scenarios"]["saved_scenarios_dict"])

	# saved_scenarios_loaded = get_saved_scenarios_dict(project_path)


	return files



	'''

	Template Layout

	0 : Title
	1 : Data Details Section {no changes required}
	2 : Data Import
	3 : Data Import - Channel Groups
	4 : Model Results {Duplicate for each model}
	5 : Metrics Contribution
	6 : Media performance {Duplicate for each model}
	7 : Media performance Tabular View {Duplicate for each model}
	8 : Optimization Section {no changes}
	9 : Optimization Summary {Duplicate for each section}
	10 : Channel Spends {Duplicate for each model}
	11 : Channel Wise ROI {Duplicate for each model}
	12 : Efficiency & Efficacy
	13 : Appendix
	14 : Transformations
	15 : Model Summary
	16 : Thank You Slide

	'''


	def create_ppt(project_name, username, panel_col):
	# Read saved files
	files = read_all_files()
	transform_dict, tuned_model_dict, contributions_excels_dict, saved_scenarios_loaded = None, None, None, None

	if len(files)>0:
	# saved_data = files[0]
	data = files[0]
	bin_dict = files[1]

	channel_groups_dct = files[2]
	try:
	transform_dict = files[3]
	tuned_model_dict = files[4]
	contributions_excels_dict = files[5]
	saved_scenarios_loaded = files[6]
	except Exception as e:
	print(e)

	else:
	return False

	is_panel = True if data[panel_col].nunique()>1 else False

	template_path = 'ppt/template.pptx'
	# ppt_path = os.path.join('ProjectSummary.pptx')

	prs = Presentation(template_path)
	num_slides = len(prs.slides)
	slides = prs.slides

	# Title Slide
	title_slide_layout = slides[0].slide_layout
	title_slide = prs.slides.add_slide(title_slide_layout)

	# Add title & project name
	placeholders = title_slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = title_slide.placeholders[ph_idx[0]]
	title_ph.text = 'Media Mix Optimization Summary'
	txt_ph = title_slide.placeholders[ph_idx[1]]
	txt_ph.text = 'Project Name: ' + project_name + '\nCreated By: ' + username

	# Model Details Section
	model_section_slide_layout = slides[1].slide_layout
	model_section_slide = prs.slides.add_slide(model_section_slide_layout)

	## Add title
	placeholders = model_section_slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = model_section_slide.placeholders[ph_idx[0]]
	title_ph.text = 'Model Details'
	section_ph = model_section_slide.placeholders[ph_idx[1]]
	section_ph.text = 'Section 1'

	# Data Import
	data_import_slide_layout = slides[2].slide_layout
	data_import_slide = prs.slides.add_slide(data_import_slide_layout)
	data_import_slide = title_and_table(slide=data_import_slide,
	title='Data Import',
	df=data_import(data, bin_dict),
	column_width={0: 2, 1: 7}
	)

	# Channel Groups
	channel_group_slide_layout = slides[3].slide_layout
	channel_group_slide = prs.slides.add_slide(channel_group_slide_layout)
	channel_group_slide = title_and_table(slide=channel_group_slide,
	title='Channels - Media and Spend',
	df=channel_groups_df(channel_groups_dct, bin_dict),
	column_width={0: 2, 1: 5, 2: 2}
	)

	if tuned_model_dict is not None:
	model_metrics_df = model_metrics(tuned_model_dict, False)

	# Model Results
	for model_key, model_dict in tuned_model_dict.items():
	model_result_slide_layout = slides[4].slide_layout
	model_result_slide = prs.slides.add_slide(model_result_slide_layout)
	model_result_slide = model_result(slide=model_result_slide,
	model_key=model_key,
	model_dict=model_dict,
	model_metrics_df=model_metrics_df,
	date_col='date')

	if contributions_excels_dict is not None:

	# Metrics Contributions
	metrics_contributions_slide_layout = slides[5].slide_layout
	metrics_contributions_slide = prs.slides.add_slide(metrics_contributions_slide_layout)
	metrics_contributions_slide = metrics_contributions(slide=metrics_contributions_slide,
	contributions_excels_dict=contributions_excels_dict,
	panel_col=panel_col
	)

	# Media Performance
	for target in contributions_excels_dict.keys():

	# Chart
	model_media_perf_slide_layout = slides[6].slide_layout
	model_media_perf_slide = prs.slides.add_slide(model_media_perf_slide_layout)
	contribution_df, spends_df = model_media_performance(slide=model_media_perf_slide,
	target=target,
	contributions_excels_dict=contributions_excels_dict
	)

	# Tabular View
	contri_spends_df = pd.merge(spends_df, contribution_df, on='Channel', how='outer')
	contri_spends_df.fillna(0, inplace=True)

	for col in [c for c in contri_spends_df.columns if c != 'Channel']:
	contri_spends_df[col] = contri_spends_df[col].apply(lambda x: safe_num_to_per(x))

	media_performance_table_slide_layout = slides[7].slide_layout
	media_performance_table_slide = prs.slides.add_slide(media_performance_table_slide_layout)
	media_performance_table_slide = title_and_table(slide=media_performance_table_slide,
	title='Media and Spends Channels Tabular View',
	df=contri_spends_df,
	# column_width={0:2, 1:5, 2:2}
	)

	if saved_scenarios_loaded is not None:
	# Optimization Details
	opt_section_slide_layout = slides[8].slide_layout
	opt_section_slide = prs.slides.add_slide(opt_section_slide_layout)

	## Add title
	placeholders = opt_section_slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = opt_section_slide.placeholders[ph_idx[0]]
	title_ph.text = 'Optimizations Details'
	section_ph = opt_section_slide.placeholders[ph_idx[1]]
	section_ph.text = 'Section 2'

	# Optimization
	for scenario_name, scenario in saved_scenarios_loaded.items():
	opt_summary_slide_layout = slides[9].slide_layout
	opt_summary_slide = prs.slides.add_slide(opt_summary_slide_layout)
	optimization_summary(opt_summary_slide, scenario, scenario_name)

	channel_spends_slide_layout = slides[10].slide_layout
	channel_spends_slide = prs.slides.add_slide(channel_spends_slide_layout)
	channel_wise_spends(channel_spends_slide, scenario)

	channel_roi_slide_layout = slides[11].slide_layout
	channel_roi_slide = prs.slides.add_slide(channel_roi_slide_layout)
	channel_wise_roi(channel_roi_slide, scenario)

	effictiveness_efficiency_slide_layout = slides[12].slide_layout
	effictiveness_efficiency_slide = prs.slides.add_slide(effictiveness_efficiency_slide_layout)
	effictiveness_efficiency(effictiveness_efficiency_slide,
	data,
	bin_dict,
	scenario)

	# Appendix Section
	appendix_section_slide_layout = slides[13].slide_layout
	appendix_section_slide = prs.slides.add_slide(appendix_section_slide_layout)

	if tuned_model_dict is not None:

	## Add title
	placeholders = appendix_section_slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = appendix_section_slide.placeholders[ph_idx[0]]
	title_ph.text = 'Appendix'
	section_ph = appendix_section_slide.placeholders[ph_idx[1]]
	section_ph.text = 'Section 3'

	# Add transformations
	# if transform_dict is not None:
	# # Transformations
	# transformation_slide_layout = slides[14].slide_layout
	# transformation_slide = prs.slides.add_slide(transformation_slide_layout)
	# transformation_slide = title_and_table(slide=transformation_slide,
	# title='Transformations',
	# df=transformations(transform_dict),
	# custom_table_height=True
	# )

	# Add model summary
	# Model Summary
	model_metrics_df = model_metrics(tuned_model_dict, False)
	model_summary_slide_layout = slides[15].slide_layout
	model_summary_slide = prs.slides.add_slide(model_summary_slide_layout)
	model_summary_slide = title_and_table(slide=model_summary_slide,
	title='Model Summary',
	df=model_metrics_df,
	custom_table_height=True
	)

	# Last Slide
	last_slide_layout = slides[num_slides - 1].slide_layout
	last_slide = prs.slides.add_slide(last_slide_layout)

	# Add title
	placeholders = last_slide.placeholders
	ph_idx = [ph.placeholder_format.idx for ph in placeholders]
	title_ph = last_slide.placeholders[ph_idx[0]]
	title_ph.text = 'Thank You'

	# Remove template slides
	xml_slides = prs.slides._sldIdLst
	slides = list(xml_slides)
	for index in range(num_slides):
	xml_slides.remove(slides[index])

	# prs.save(ppt_path)

	# save the output into binary form
	binary_output = BytesIO()
	prs.save(binary_output)

	return binary_output