Andrei Alexandru's picture

11 13

Andrei Alexandru

inwaves

·

inwaves

AI & ML interests

None yet

Organizations

inwaves's activity

upvoted 2 papers 2 months ago

Atla Selene Mini: A General Purpose Evaluation Model

Paper • 2501.17195 • Published Jan 27 • 36

Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published Jan 26 • 69

upvoted 2 papers 5 months ago

JudgeBench: A Benchmark for Evaluating LLM-based Judges

Paper • 2410.12784 • Published Oct 16, 2024 • 47

Skywork-Reward: Bag of Tricks for Reward Modeling in LLMs

Paper • 2410.18451 • Published Oct 24, 2024 • 18

upvoted a paper 7 months ago

Training Language Models to Self-Correct via Reinforcement Learning

Paper • 2409.12917 • Published Sep 19, 2024 • 139

upvoted a paper 8 months ago

Fine-tuning Large Language Models with Human-inspired Learning Strategies in Medical Question Answering

Paper • 2408.07888 • Published Aug 15, 2024 • 13