dkimds (Daeseong Kim)

models 19

dkimds/mt0-large-ia3

Updated Nov 25, 2024

dkimds/peft-vit-base-patch16-224-in21k-lora

Updated Nov 25, 2024

dkimds/bloomz-560-m-peft-method

Updated Nov 25, 2024

dkimds/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Aug 27, 2023

dkimds/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 25, 2023 • 6

dkimds/a2c-PandaReachDense-v3

Reinforcement Learning • Updated Aug 24, 2023

dkimds/ppo-SnowballTarget

Reinforcement Learning • Updated Aug 20, 2023 • 32

dkimds/ppo-Pyramids-Training

Reinforcement Learning • Updated Aug 20, 2023 • 9

dkimds/PixelCopter-PLE-v0

Updated Aug 9, 2023

dkimds/Reinforce-CartPole-v1

Reinforcement Learning • Updated Aug 9, 2023

datasets

None public yet

Daeseong Kim

AI & ML interests

Organizations

Collections 1

Instruction Pre-Training: Language Models are Supervised Multitask Learners

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

Perplexed by Perplexity: Perplexity-Based Data Pruning With Small Reference Models

MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark

spaces 1

Creating Space With Gradio

models 19

dkimds/mt0-large-ia3

dkimds/peft-vit-base-patch16-224-in21k-lora

dkimds/bloomz-560-m-peft-method

dkimds/rl_course_vizdoom_health_gathering_supreme

dkimds/ppo-LunarLander-v2

dkimds/a2c-PandaReachDense-v3

dkimds/ppo-SnowballTarget

dkimds/ppo-Pyramids-Training

dkimds/PixelCopter-PLE-v0

dkimds/Reinforce-CartPole-v1

datasets

Daeseong Kim

AI & ML interests

Organizations

Collections 1

spaces 1

Creating Space With Gradio

models 19 Sort: Recently updated

datasets

models 19