Arjun Krishna

ArjunKrishnaK

1

·

https://arjunkrishnak.github.io/

ArjunKrishnak

AI & ML interests

LLM's and Distributed Training

Recent Activity

updated a model 1 day ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_fp8

updated a model 1 day ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_then_quantized_to_fp8_swift

published a model 1 day ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_fp8

View all activity

Organizations

updated 2 models 1 day ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_fp8

35B • Updated 1 day ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_then_quantized_to_fp8_swift

35B • Updated 1 day ago

published 3 models 1 day ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_fp8

35B • Updated 1 day ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_averaged_quantized_to_fp8

Updated 1 day ago

Writer/qwen3.6-35b-a3b-cigna-palmyra-noreason-sft_lr1e-4_ep3_r16_merged_then_quantized_to_fp8_swift

35B • Updated 1 day ago

upvoted a paper about 1 year ago

Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning

Paper • 2505.24726 • Published May 30, 2025 • 283