August Moharrami

August4293

·

AI & ML interests

None yet

Organizations

models 14

August4293/test-model_v1.0

Feature Extraction • 2.43M • Updated Sep 8, 2025 • 3

August4293/Qwen_0.5B-GSM8K-Agent-iteration-2

Text Generation • 0.5B • Updated May 25, 2025 • 7

August4293/Qwen_0.5B-GSM8K-Agent-iteration-1

Text Generation • 0.5B • Updated May 25, 2025 • 5

August4293/Qwen_0.5B-GSM8K-Agent

Text Generation • 0.5B • Updated May 25, 2025 • 8

August4293/qwen_0.5B-agent_without_tool_output_mask

Text Generation • 0.5B • Updated May 24, 2025 • 2

August4293/qwen_0.5B-agent_with_tool_output_mask

Text Generation • 0.5B • Updated May 24, 2025 • 2

August4293/Qwen2.5-0.5B-Instruct-with-output-tokens

Text Generation • 0.5B • Updated May 13, 2025 • 10

August4293/DeepSeek-R1-Distill-Qwen-1.5B-with-output-tokens

Text Generation • 2B • Updated May 13, 2025 • 4

August4293/Llama3.1-8B-PRM-Deepseek-Data-4bit

Text Generation • 8B • Updated Jan 15, 2025 • 2

August4293/tiny-llama3.1-8B-PRM-Deepseek-Data

Text Generation • 2.05M • Updated Jan 14, 2025 • 6

datasets 15

August4293/gsm8k_dense_rewards_sorted

Viewer • Updated May 19, 2025 • 180 • 10

August4293/gsm8k_dense_rewards_sorted_batch_3

Viewer • Updated May 19, 2025 • 500 • 10

August4293/gsm8k_dense_rewards_filtered_batch_3

Viewer • Updated May 19, 2025 • 57 • 7

August4293/gsm8k_dense_rewards_sorted_batch_2

Viewer • Updated May 19, 2025 • 500 • 7

August4293/gsm8k_dense_rewards_filtered_batch_2

Viewer • Updated May 19, 2025 • 57 • 7

August4293/gsm8k_dense_rewards_sorted_batch_1

Viewer • Updated May 19, 2025 • 500 • 7

August4293/gsm8k_dense_rewards_filtered_batch_1

Viewer • Updated May 19, 2025 • 60 • 7

August4293/agent_math_dataset_extended

Viewer • Updated Feb 21, 2025 • 64 • 5

August4293/agent_math_dataset

Viewer • Updated Feb 21, 2025 • 4 • 8

August4293/tldr-preference-sft-trl-style-sample

Viewer • Updated Jan 1, 2025 • 100 • 11

View 15 datasets