Spaces:

junaid0600
/

sql-db-engineer-agent

Sleeping

junaid0600 commited on 4 days ago

Commit

a1514f8

verified ·

1 Parent(s): 32b93fa

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -26,7 +26,6 @@ An OpenEnv-compliant reinforcement learning environment where AI agents learn to
 ---
-## 🔗 Quick Links
 ## 🔗 Quick Links
@@ -77,7 +76,7 @@ Trained **Qwen2.5-7B-Instruct** with **GRPO** using **Unsloth** (only 0.53% of p
 ### GRPO Training Curves — 200 Steps
-![Demo](assets/loss_curve_demo.png)
 | Metric | Value |
 |---|---|
@@ -93,7 +92,7 @@ Trained **Qwen2.5-7B-Instruct** with **GRPO** using **Unsloth** (only 0.53% of p
 ### Evaluation — Trained vs Random Agent (15 Scenarios)
-![Demo](assets/reward_curve_demo.png)
 | Agent | Avg Improvement | Best Scenario | Worst Scenario |
 |---|---|---|---|

 ---
 ## 🔗 Quick Links
 ### GRPO Training Curves — 200 Steps
+![Demo](assests/loss_curve_demo.png)
 | Metric | Value |
 |---|---|
 ### Evaluation — Trained vs Random Agent (15 Scenarios)
+![Demo](assests/reward_curve_demo.png)
 | Agent | Avg Improvement | Best Scenario | Worst Scenario |
 |---|---|---|---|