Burkov's picture

52 8

Burkov

Andriy

·

AI & ML interests

None yet

Organizations

None yet

Andriy's activity

New activity in google/gemma-2-9b 8 months ago

Issues with FSDP and DeepSpeed During Distributed Training for Gemma

#30 opened 8 months ago by

New activity in axolotl-ai-co/gemma-2-9b 8 months ago

Why a separate release?

#1 opened 8 months ago by

New activity in Qwen/Qwen2-0.5B-Instruct 9 months ago

add_special_tokens=True doesn't add eos token at the end of the sequence

#4 opened 9 months ago by

New activity in microsoft/Phi-3-mini-128k-instruct-onnx 11 months ago

Where is the model? 0 downloads means nobody can use it. Please fix.

#1 opened 11 months ago by

New activity in mistralai/Mistral-7B-Instruct-v0.2 11 months ago

How does v0.2 manages to support 32k token context without Sliding Window Attention?

#85 opened 11 months ago by

What is the max. content length of Mistral-7B-Instruct-v0.2?

#43 opened about 1 year ago by

New activity in 1bitLLM/bitnet_b1_58-3B 12 months ago

Longer inference time

#4 opened 12 months ago by

New activity in WizardLMTeam/WizardCoder-Python-34B-V1.0 12 months ago

Finetuning dataset

#35 opened 12 months ago by

New activity in Qwen/Qwen1.5-MoE-A2.7B-Chat 12 months ago

Instruct-finetuning dataset

#4 opened 12 months ago by

New activity in FelixChao/Capricorn-7B 12 months ago

Finetuning dataset

#2 opened 12 months ago by

New activity in cloudyu/Yi-34Bx2-MOE-200K 12 months ago

Instruct-finetuning dataset

#1 opened 12 months ago by

New activity in touqir/Cyrax-7B 12 months ago

Instruct-finetuning dataset

#3 opened 12 months ago by

New activity in Kukedlc/NeuralKrishna-7B-V2-DPO 12 months ago

instruct-finetuning dataset

#2 opened 12 months ago by

New activity in FelixChao/Capricorn-7B-DPO 12 months ago

Instruct-finetuning dataset

#2 opened 12 months ago by

New activity in MaziyarPanahi/Calme-7B-Instruct-v0.5 12 months ago

Instruct-finetuning dataset

#5 opened 12 months ago by

New activity in jan-hq/stealth-v2 12 months ago

Instruct-finetuning dataset

#3 opened 12 months ago by

New activity in chihoonlee10/T3Q-EN-DPO-Mistral-7B 12 months ago

Instruct-finetuning dataset

#1 opened 12 months ago by

New activity in cloudyu/Yi-34Bx2-MoE-60B-DPO 12 months ago

Instruct-finetuning dataset

#2 opened 12 months ago by

New activity in bobofrut/ladybird-base-7B-v8 12 months ago

Instruct-finetuning dataset

#1 opened 12 months ago by

New activity in zhengr/MixTAO-7Bx2-MoE-Instruct-v7.0 12 months ago

Instruct-finetuning dataset

#4 opened 12 months ago by