Hammer++++'s picture

Hammer++++

HammerW

AI & ML interests

None yet

Organizations

None yet

HammerW's activity

upvoted a paper 11 days ago

Transformers Can Do Arithmetic with the Right Embeddings

Paper • 2405.17399 • Published 12 days ago • 49

upvoted 2 papers about 2 months ago

Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing

Paper • 2404.12253 • Published Apr 18 • 51

LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders

Paper • 2404.05961 • Published Apr 9 • 62

upvoted 2 papers 3 months ago

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27 • 568

MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs

Paper • 2402.15627 • Published Feb 23 • 32

upvoted 5 papers 4 months ago

Generative Representational Instruction Tuning

Paper • 2402.09906 • Published Feb 15 • 50

Speculative Streaming: Fast LLM Inference without Auxiliary Models

Paper • 2402.11131 • Published Feb 16 • 41

Code Representation Learning At Scale

Paper • 2402.01935 • Published Feb 2 • 12

Self-Discover: Large Language Models Self-Compose Reasoning Structures

Paper • 2402.03620 • Published Feb 6 • 103

More Agents Is All You Need

Paper • 2402.05120 • Published Feb 3 • 46

upvoted a paper 12 months ago

Full Parameter Fine-tuning for Large Language Models with Limited Resources

Paper • 2306.09782 • Published Jun 16, 2023 • 28