Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2312.11514

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 259
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27, 2024 • 610

MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases

Paper • 2402.14905 • Published Feb 22, 2024 • 128
Sensor-based Multi-Robot Search and Coverage with Spatial Separation in Unstructured Environments

Paper • 2403.01710 • Published Mar 4, 2024 • 2
EdgeMoE: Fast On-Device Inference of MoE-based Large Language Models

Paper • 2308.14352 • Published Aug 28, 2023
Slimmable Encoders for Flexible Split DNNs in Bandwidth and Resource Constrained IoT Systems

Paper • 2306.12691 • Published Jun 22, 2023 • 2

zhangxunhui/SO-GH-Linker

Updated Oct 23, 2023 • 32 • 1
LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 259

Efficient LLM inference

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 259

mistralai/Mixtral-8x7B-Instruct-v0.1

Text Generation • Updated Aug 19, 2024 • 557k • • 4.35k
HuggingFaceM4/WebSight

Viewer • Updated Mar 26, 2024 • 2.75M • 19.8k • 348
LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 259
Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 244

abacusai/Smaug-72B-v0.1

Text Generation • Updated Feb 23, 2024 • 284 • 468
Running on L4

902

902

ReplaceAnything

📚

Replace objects in images with new content
miqudev/miqu-1-70b

Updated Feb 4, 2024 • 504 • 986
fka/awesome-chatgpt-prompts

Viewer • Updated Jan 6 • 203 • 12.2k • 7.62k

https://huggingface.co/collections/zero-gpu-explorers/zerogp

https://huggingface.co/collections/zero-gpu-explorers/zerogpu-spaces-6564c281393bae9c195140c1

Llama 2: Open Foundation and Fine-Tuned Chat Models

Paper • 2307.09288 • Published Jul 18, 2023 • 244
GAIA: a benchmark for General AI Assistants

Paper • 2311.12983 • Published Nov 21, 2023 • 192
DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 180
LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 259

TheBloke/Wizard-Vicuna-13B-Uncensored-GPTQ

Text Generation • Updated Sep 27, 2023 • 4.23k • 318
Isonium/WhiteRabbitNeo-33B-v1-GGUF

Updated Jan 15, 2024 • 326 • 8
Masterjp123/SnowyRP-FinalV1-L2-13B-GPTQ

Text Generation • Updated Apr 4, 2024 • 21 • 3
GAIA: a benchmark for General AI Assistants

Paper • 2311.12983 • Published Nov 21, 2023 • 192

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 259
Efficient Streaming Language Models with Attention Sinks

Paper • 2309.17453 • Published Sep 29, 2023 • 13

collection name

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 259
01-ai/Yi-34B

Text Generation • Updated Nov 11, 2024 • 6.89k • 1.29k
nyu-mll/glue

Viewer • Updated Jan 30, 2024 • 1.49M • 186k • 398

Previous
1
2
3
4
...
9
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs