Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Spaces:

agent-evals
/

leaderboard

Running

App Files Files Community

1 contributor

History: 9 commits

benediktstroebl's picture

benediktstroebl

hide swebench lite and mlagentbench

512799d 21 days ago

agent_monitor
minor tweaks 21 days ago
utils
minor tweaks 21 days ago
.gitattributes

1.58 kB

Upload preprocessed_traces.db 24 days ago
.gitignore

74 Bytes

init v1 24 days ago
README.md

236 Bytes

init v1 24 days ago
about.md

5.39 kB

init v1 24 days ago
agent_performance_analysis.json

5.08 kB

init v1 24 days ago
agent_submission.md

766 Bytes

init v1 24 days ago
agent_submission_core.md

2.77 kB

init v1 24 days ago
app.py

82.2 kB

hide swebench lite and mlagentbench 21 days ago
benchmark_submission.md

496 Bytes

init v1 24 days ago
config.py

2.07 kB

init v1 24 days ago
css.css

936 Bytes

init v1 24 days ago
envs.py

191 Bytes

init v1 24 days ago
hal.ico

15.4 kB

init v1 24 days ago
hal.png

1.03 kB

init v1 24 days ago
header.md

118 Bytes

init v1 24 days ago
preprocessed_traces.db

1.95 GB
LFS

Upload preprocessed_traces.db 22 days ago
requirements.txt

1.84 kB

init v1 24 days ago
scratch.ipynb

0 Bytes

init v1 24 days ago
scratch.py

1.61 kB

init v1 24 days ago
verified_agents.yaml

3.94 kB

minor tweaks 21 days ago