Nikolai Debono's picture

1 25 3

Nikolai Debono

boccu2009

AI & ML interests

None yet

Recent Activity

upvoted a paper 13 days ago

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

upvoted a paper 13 days ago

DDT: Decoupled Diffusion Transformer

upvoted a paper 14 days ago

Scaling Laws of Synthetic Data for Language Models

View all activity

Organizations

None yet

boccu2009's activity

upvoted 2 papers 13 days ago

OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens

Paper • 2504.07096 • Published 14 days ago • 73

DDT: Decoupled Diffusion Transformer

Paper • 2504.05741 • Published 16 days ago • 73

upvoted a paper 14 days ago

Scaling Laws of Synthetic Data for Language Models

Paper • 2503.19551 • Published 30 days ago • 1

upvoted 5 papers 22 days ago

Efficient Model Development through Fine-tuning Transfer

Paper • 2503.20110 • Published 29 days ago • 4

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published 27 days ago • 43

Efficient Inference for Large Reasoning Models: A Survey

Paper • 2503.23077 • Published 25 days ago • 46

What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models

Paper • 2503.24235 • Published 23 days ago • 53

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Paper • 2503.24290 • Published 23 days ago • 62

upvoted a paper 23 days ago

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Paper • 2503.16252 • Published Mar 20 • 27

liked a dataset 27 days ago

nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated 7 days ago • 3.91M • 7.19k • 423

upvoted a paper about 1 month ago

Personalize Anything for Free with Diffusion Transformer

Paper • 2503.12590 • Published Mar 16 • 44

liked a model about 2 months ago

microsoft/Phi-4-multimodal-instruct

Automatic Speech Recognition • Updated 15 days ago • 622k • 1.32k

upvoted a collection 2 months ago

Reasoning Datasets

Distilled synthetic Reasoning datasets • 7 items • Updated Feb 2 • 60

upvoted 2 papers 3 months ago

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published Jan 20 • 105

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published Jan 17 • 114