26 13 11

Denis Kuznedelev

SpiridonSunRotator

https://github.com/Godofnothing

Godofnothing

AI & ML interests

Model compression, computer vision, NLP

Recent Activity

published a model about 1 hour ago

daslab-testing/DeepSeek-V3-0324-GPTQ-4b-128g-activation_order-mse_scale

updated a model about 8 hours ago

ISTA-DASLab/DeepSeek-R1-GPTQ-4b-128g-experts

updated a model about 8 hours ago

ISTA-DASLab/DeepSeek-R1-GPTQ-4b-128g

View all activity

Organizations

SpiridonSunRotator's activity

published a model about 1 hour ago

daslab-testing/DeepSeek-V3-0324-GPTQ-4b-128g-activation_order-mse_scale

Updated about 1 hour ago

updated 2 models about 8 hours ago

ISTA-DASLab/DeepSeek-R1-GPTQ-4b-128g-experts

Text Generation • Updated about 5 hours ago • 2

ISTA-DASLab/DeepSeek-R1-GPTQ-4b-128g

Text Generation • Updated about 5 hours ago • 153

updated 2 models 2 days ago

ISTA-DASLab/Mistral-Small-3.1-24B-Instruct-2503-GPTQ-4b-128g

Image-Text-to-Text • Updated 2 days ago • 11.9k • 11

SpiridonSunRotator/DeepSeek-V3-0324-GPTQ-4b-128g

Updated 2 days ago

published a model 3 days ago

SpiridonSunRotator/DeepSeek-V3-0324-GPTQ-4b-128g

Updated 2 days ago

updated a model 4 days ago

daslab-testing/DeepSeek-V3-0324-GPTQ-4b-128g-experts

Updated 4 days ago • 2

published a model 4 days ago

daslab-testing/DeepSeek-V3-0324-GPTQ-4b-128g-experts

Updated 4 days ago • 2

New activity in ISTA-DASLab/Mistral-Small-3.1-24B-Instruct-2503-GPTQ-4b-128g 6 days ago

VLLM launch command?

#1 opened 19 days ago by

nfunctor

updated 2 models 11 days ago

daslab-testing/DeepSeek-V3-0324-GPTQ-1_58b-128g-decompressed

Updated 11 days ago • 2

daslab-testing/DeepSeek-V3-0324-GPTQ-1_58b-128g

Updated 11 days ago • 3

published 2 models 11 days ago

daslab-testing/DeepSeek-V3-0324-GPTQ-1_58b-128g-decompressed

Updated 11 days ago • 2

daslab-testing/DeepSeek-V3-0324-GPTQ-1_58b-128g

Updated 11 days ago • 3

updated a model 15 days ago

daslab-testing/DeepSeek-R1-GPTQ-1_58b-128g-experts-decompressed

Updated 15 days ago • 2

published a model 16 days ago

daslab-testing/DeepSeek-R1-GPTQ-1_58b-128g-experts-decompressed

Updated 15 days ago • 2

New activity in quickjkee/swd_pipeline 16 days ago

Argument and dtype fix

#1 opened 16 days ago by

SpiridonSunRotator

updated a model 17 days ago

daslab-testing/DeepSeek-R1-GPTQ-1_58b-128g

Updated 17 days ago • 40

published a model 17 days ago

daslab-testing/DeepSeek-R1-GPTQ-1_58b-128g

Updated 17 days ago • 40

authored a paper 18 days ago

Scale-wise Distillation of Diffusion Models

Paper • 2503.16397 • Published 19 days ago • 38

upvoted a paper 18 days ago

One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation

Paper • 2503.13358 • Published 22 days ago • 93