Generation - a Julius-L Collection

Julius-L 's Collections

Memory Efficient Training

Model Architecture

LLM Technical Reports

Generation

updated 6 days ago

Fast Best-of-N Decoding via Speculative Rejection

Paper • 2410.20290 • Published 11 days ago • 8