new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Oct 14

Submitted by

AaronHuangWei

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

nvidia

Submitted by

tsbpp

Diffusion Transformers with Representation Autoencoders

·
4 authors

Submitted by

Lingaaaaaaa

Demystifying Reinforcement Learning in Agentic Reasoning

·
5 authors

Submitted by

DogNeverSleep

AVoCaDO: An Audiovisual Video Captioner Driven by Temporal Orchestration

·
12 authors

Submitted by

lyabc

AdaViewPlanner: Adapting Video Diffusion Models for Viewpoint Planning in 4D Scenes

KwaiVGI

Kuaishou Visual Generation and Interaction Center

Submitted by

CheeryLJH

OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs

·
42 authors

Submitted by

YanAdjeNole

FinAuditing: A Financial Taxonomy-Structured Multi-Document Benchmark for Evaluating LLMs

TheFinAI

Submitted by

fenghora

DiT360: High-Fidelity Panoramic Image Generation via Hybrid Training

·
5 authors

Submitted by

ganlinyang

Vlaser: Vision-Language-Action Model with Synergistic Embodied Reasoning

·
18 authors

Submitted by

DreamW1ngs

Making Mathematical Reasoning Adaptive

·
10 authors

Submitted by

wangchy

SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models

metaresearch

Submitted by

taesiri

GIR-Bench: Versatile Benchmark for Generating Images with Reasoning

Submitted by

LucasFang

CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images

hkuhk

The University of Hong Kong

Submitted by

Agorium

On Epistemic Uncertainty of Visual Tokens for Object Hallucinations in Large Vision-Language Models

SeoulNatlUniv

Seoul National University

Submitted by

Albus-Chen

PEAR: Phase Entropy Aware Reward for Efficient Reasoning

iNLP-Lab

iNLP Lab @ SUTD

Submitted by

emrecanacikgoz

Self-Improving LLM Agents at Test-Time

·
5 authors

Submitted by

xxzcc

ReLook: Vision-Grounded RL with a Multimodal LLM Critic for Agentic Web Coding

tencent

Submitted by

JingHaoZ

RLFR: Extending Reinforcement Learning for LLMs with Flow Environment

·
7 authors

Submitted by

yinghuihe

Skill-Targeted Adaptive Training

PrincetonUniversity

Princeton University

Submitted by

xwjzds

The Personalization Trap: How User Memory Alters Emotional Reasoning in LLMs

amazon

Submitted by

jeepliu

DocReward: A Document Reward Model for Structuring and Stylizing

·
19 authors

Submitted by

SoroushMehraban

FastHMR: Accelerating Human Mesh Recovery via Token and Layer Merging with Diffusion Decoding

vector-institute

Vector Institute

Submitted by

taesiri

InfiniHuman: Infinite 3D Human Creation with Precise Control

·
4 authors

Submitted by

taesiri

IVEBench: Modern Benchmark Suite for Instruction-Guided Video Editing Assessment

·
10 authors

Submitted by

taesiri

LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Models via Likelihood Preference

·
8 authors

Submitted by

yuzc19

RePro: Training Language Models to Faithfully Recycle the Web for Pretraining

Chenyan Xiong Research Group at CMU

Submitted by

FeYuan

LLaMAX2: Your Translation-Enhanced Model also Performs Well in Reasoning

·
6 authors

Submitted by

liuganghuggingface

Graph Diffusion Transformers are In-Context Molecular Designers

·
7 authors

Submitted by

taesiri

Are Large Reasoning Models Interruptible?

·
6 authors

Submitted by

zhihuang

Pathology-CoT: Learning Visual Chain-of-Thought Agent from Expert Whole Slide Image Diagnosis Behavior

zhihuanglab