Spaces:

optimum
/

auto-benchmark

Running

App Files Files Community

IlyasMoutawwakil HF staff commited on Sep 14, 2023

Commit

9feeb78

1 Parent(s): e70447d

use reduction for latency instead of speedup

Browse files

Files changed (1) hide show

run.py +12 -12

run.py CHANGED Viewed

@@ -149,10 +149,10 @@ def postprocess_table(table, experiment_name):
     table = table.set_index("experiment_name")
     table.reset_index(inplace=True)
     if "forward.latency(s)" in table.columns:
-        table["forward.latency.speedup(%)"] = (
-            1 - table["forward.latency(s)"] / table["forward.latency(s)"].iloc[0]
         ) * 100
-        table["forward.latency.speedup(%)"] = table["forward.latency.speedup(%)"].round(2)
     if "forward.throughput(samples/s)" in table.columns:
         table["forward.throughput.speedup(%)"] = (
@@ -161,16 +161,16 @@ def postprocess_table(table, experiment_name):
         table["forward.throughput.speedup(%)"] = table["forward.throughput.speedup(%)"].round(2)
     if "forward.peak_memory(MB)" in table.columns:
-        table["forward.peak_memory.savings(%)"] = (
-            1 - table["forward.peak_memory(MB)"] / table["forward.peak_memory(MB)"].iloc[0]
         ) * 100
-        table["forward.peak_memory.savings(%)"] = table["forward.peak_memory.savings(%)"].round(2)
     if "generate.latency(s)" in table.columns:
-        table["generate.latency.speedup(%)"] = (
-            1 - table["generate.latency(s)"] / table["generate.latency(s)"].iloc[0]
         ) * 100
-        table["generate.latency.speedup(%)"] = table["generate.latency.speedup(%)"].round(2)
     if "generate.throughput(tokens/s)" in table.columns:
         table["generate.throughput.speedup(%)"] = (
@@ -179,9 +179,9 @@ def postprocess_table(table, experiment_name):
         table["generate.throughput.speedup(%)"] = table["generate.throughput.speedup(%)"].round(2)
     if "generate.peak_memory(MB)" in table.columns:
-        table["generate.peak_memory.savings(%)"] = (
-            1 - table["generate.peak_memory(MB)"] / table["generate.peak_memory(MB)"].iloc[0]
         ) * 100
-        table["generate.peak_memory.savings(%)"] = table["generate.peak_memory.savings(%)"].round(2)
     return table

     table = table.set_index("experiment_name")
     table.reset_index(inplace=True)
     if "forward.latency(s)" in table.columns:
+        table["forward.latency.reduction(%)"] = (
+            table["forward.latency(s)"] / table["forward.latency(s)"].iloc[0] - 1
         ) * 100
+        table["forward.latency.reduction(%)"] = table["forward.latency.reduction(%)"].round(2)
     if "forward.throughput(samples/s)" in table.columns:
         table["forward.throughput.speedup(%)"] = (
         table["forward.throughput.speedup(%)"] = table["forward.throughput.speedup(%)"].round(2)
     if "forward.peak_memory(MB)" in table.columns:
+        table["forward.peak_memory.reduction(%)"] = (
+            table["forward.peak_memory(MB)"] / table["forward.peak_memory(MB)"].iloc[0] - 1
         ) * 100
+        table["forward.peak_memory.reduction(%)"] = table["forward.peak_memory.savings(%)"].round(2)
     if "generate.latency(s)" in table.columns:
+        table["generate.latency.reduction(%)"] = (
+            table["generate.latency(s)"] / table["generate.latency(s)"].iloc[0] - 1
         ) * 100
+        table["generate.latency.reduction(%)"] = table["generate.latency.reduction(%)"].round(2)
     if "generate.throughput(tokens/s)" in table.columns:
         table["generate.throughput.speedup(%)"] = (
         table["generate.throughput.speedup(%)"] = table["generate.throughput.speedup(%)"].round(2)
     if "generate.peak_memory(MB)" in table.columns:
+        table["generate.peak_memory.reduction(%)"] = (
+            table["generate.peak_memory(MB)"] / table["generate.peak_memory(MB)"].iloc[0] - 1
         ) * 100
+        table["generate.peak_memory.reduction(%)"] = table["generate.peak_memory.reduction(%)"].round(2)
     return table