Lize Pirenne's picture

229 20

Lize Pirenne

Inversta

·

Pangasius

AI & ML interests

LLMs, RL

Recent Activity

upvoted a paper 8 days ago

DAPO: An Open-Source LLM Reinforcement Learning System at Scale

upvoted a paper 15 days ago

RWKV-7 "Goose" with Expressive Dynamic State Evolution

upvoted a paper 15 days ago

Transformers without Normalization

View all activity

Organizations

None yet

Inversta's activity

upvoted a paper 8 days ago

DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Paper • 2503.14476 • Published 16 days ago • 112

upvoted 3 papers 15 days ago

RWKV-7 "Goose" with Expressive Dynamic State Evolution

Paper • 2503.14456 • Published 16 days ago • 130

Transformers without Normalization

Paper • 2503.10622 • Published 21 days ago • 145

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published 22 days ago • 67

upvoted a paper 23 days ago

EuroBERT: Scaling Multilingual Encoders for European Languages

Paper • 2503.05500 • Published 27 days ago • 74

upvoted 2 papers 24 days ago

Token-Efficient Long Video Understanding for Multimodal LLMs

Paper • 2503.04130 • Published 28 days ago • 88

Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs

Paper • 2503.01743 • Published about 1 month ago • 80

upvoted 8 papers about 1 month ago

Chain of Draft: Thinking Faster by Writing Less

Paper • 2502.18600 • Published Feb 25 • 46

Predictive Data Selection: The Data That Predicts Is the Data That Teaches

Paper • 2503.00808 • Published Mar 2 • 56

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published Feb 20 • 188

SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models

Paper • 2502.09604 • Published Feb 13 • 34

InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU

Paper • 2502.08910 • Published Feb 13 • 147

LM2: Large Memory Models

Paper • 2502.06049 • Published Feb 9 • 30

The Curse of Depth in Large Language Models

Paper • 2502.05795 • Published Feb 9 • 38

Scaling up Test-Time Compute with Latent Reasoning: A Recurrent Depth Approach

Paper • 2502.05171 • Published Feb 7 • 132

upvoted 5 papers about 2 months ago

SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published Feb 4 • 216

s1: Simple test-time scaling

Paper • 2501.19393 • Published Jan 31 • 114

SFT Memorizes, RL Generalizes: A Comparative Study of Foundation Model Post-training

Paper • 2501.17161 • Published Jan 28 • 118

Critique Fine-Tuning: Learning to Critique is More Effective than Learning to Imitate

Paper • 2501.17703 • Published Jan 29 • 57

Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26 • 68