compression - a xieyuquan Collection

xieyuquan 's Collections

rlhf

arch

dpo

compression

updated Jun 19, 2024

A Simple and Effective L_2 Norm-Based Strategy for KV Cache Compression

Paper • 2406.11430 • Published Jun 17, 2024 • 23
VoCo-LLaMA: Towards Vision Compression with Large Language Models

Paper • 2406.12275 • Published Jun 18, 2024 • 30