Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2401.10020

Chain-of-Thought Reasoning Without Prompting

Paper • 2402.10200 • Published Feb 15 • 90
How to Train Data-Efficient LLMs

Paper • 2402.09668 • Published Feb 15 • 33
BitDelta: Your Fine-Tune May Only Be Worth One Bit

Paper • 2402.10193 • Published Feb 15 • 17
A Human-Inspired Reading Agent with Gist Memory of Very Long Contexts

Paper • 2402.09727 • Published Feb 15 • 35

AI Paper of the Day

A collection of papers that I think are interesting, one added each day

about 14 hours ago

Can Large Language Models Understand Context?

Paper • 2402.00858 • Published Feb 1 • 20
OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1 • 74
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 135
SemScore: Automated Evaluation of Instruction-Tuned LLMs based on Semantic Textual Similarity

Paper • 2401.17072 • Published Jan 30 • 22

abacusai/Smaug-72B-v0.1

Text Generation • Updated Feb 23 • 7.15k • 450
Running on A10G

704

📚

ReplaceAnything
miqudev/miqu-1-70b

Updated Feb 4 • 133k • 970
fka/awesome-chatgpt-prompts

Viewer • Updated Mar 7, 2023 • 7.42k • 4.95k

https://huggingface.co/collections/zero-gpu-explorers/zerogp

https://huggingface.co/collections/zero-gpu-explorers/zerogpu-spaces-6564c281393bae9c195140c1

Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 235
GAIA: a benchmark for General AI Assistants

Paper • 2311.12983 • Published Nov 21, 2023 • 171
DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 173
LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 253

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 135
Mixtral of Experts

Paper • 2401.04088 • Published Jan 8 • 152
Understanding LLMs: A Comprehensive Overview from Training to Inference

Paper • 2401.02038 • Published Jan 4 • 59

WARM: On the Benefits of Weight Averaged Reward Models

Paper • 2401.12187 • Published Jan 22 • 17
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 135
Secrets of RLHF in Large Language Models Part II: Reward Modeling

Paper • 2401.06080 • Published Jan 11 • 23

MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24 • 47
Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads

Paper • 2401.10774 • Published Jan 19 • 50
Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 135
Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding

Paper • 2401.12954 • Published Jan 23 • 28

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 135

about 1 month ago

Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models

Paper • 2402.19427 • Published Feb 29 • 49
Simple linear attention language models balance the recall-throughput tradeoff

Paper • 2402.18668 • Published Feb 28 • 17
ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition

Paper • 2402.15220 • Published Feb 23 • 18
Linear Transformers are Versatile In-Context Learners

Paper • 2402.14180 • Published Feb 21 • 5

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18 • 135
Tuning Language Models by Proxy

Paper • 2401.08565 • Published Jan 16 • 19
ReFT: Reasoning with Reinforced Fine-Tuning

Paper • 2401.08967 • Published Jan 17 • 26
Rephrasing the Web: A Recipe for Compute and Data-Efficient Language Modeling

Paper • 2401.16380 • Published Jan 29 • 45

Previous
1
2
3
4
...
7
Next

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs