marinaretikof's picture

704 27

marinaretikof

marinaretik

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

PHYSICS: Benchmarking Foundation Models on University-Level Physics Problem Solving

upvoted a paper 3 days ago

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

upvoted a paper 3 days ago

AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation

View all activity

Organizations

None yet

marinaretik's activity

upvoted 8 papers 3 days ago

PHYSICS: Benchmarking Foundation Models on University-Level Physics Problem Solving

Paper • 2503.21821 • Published 11 days ago • 16

Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback

Paper • 2503.22230 • Published 8 days ago • 43

AdaptiVocab: Enhancing LLM Efficiency in Focused Domains through Lightweight Vocabulary Adaptation

Paper • 2503.19693 • Published 11 days ago • 69

TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization

Paper • 2503.19901 • Published 11 days ago • 30

Recitation over Reasoning: How Cutting-Edge Language Models Can Fail on Elementary School-Level Reasoning Problems?

Paper • 2504.00509 • Published 4 days ago • 16

Command A: An Enterprise-Ready Large Language Model

Paper • 2504.00698 • Published 4 days ago • 20

CodeARC: Benchmarking Reasoning Capabilities of LLM Agents for Inductive Program Synthesis

Paper • 2503.23145 • Published 7 days ago • 30

JudgeLRM: Large Reasoning Models as a Judge

Paper • 2504.00050 • Published 6 days ago • 48

upvoted 12 papers 8 days ago

RecTable: Fast Modeling Tabular Data with Rectified Flow

Paper • 2503.20731 • Published 10 days ago • 2

Gemini Robotics: Bringing AI into the Physical World

Paper • 2503.20020 • Published 11 days ago • 21

Gemma 3 Technical Report

Paper • 2503.19786 • Published 11 days ago • 42

Open Deep Search: Democratizing Search with Open-source Reasoning Agents

Paper • 2503.20201 • Published 11 days ago • 41

LEGO-Puzzles: How Good Are MLLMs at Multi-Step Spatial Reasoning?

Paper • 2503.19990 • Published 11 days ago • 31

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 11 days ago • 118

LLPut: Investigating Large Language Models for Bug Report-Based Input Generation

Paper • 2503.20578 • Published 10 days ago • 4

FinAudio: A Benchmark for Audio Large Language Models in Financial Applications

Paper • 2503.20990 • Published 10 days ago • 18

Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks

Paper • 2503.21696 • Published 9 days ago • 21

ResearchBench: Benchmarking LLMs in Scientific Discovery via Inspiration-Based Task Decomposition

Paper • 2503.21248 • Published 9 days ago • 19

ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation

Paper • 2503.21729 • Published 9 days ago • 26

LeX-Art: Rethinking Text Generation via Scalable High-Quality Data Synthesis

Paper • 2503.21749 • Published 9 days ago • 25