siyeng feng's picture

446 197

siyeng feng

siyengfeng

·

AI & ML interests

None yet

Recent Activity

liked a model about 15 hours ago

CohereForAI/c4ai-command-a-03-2025

liked a model about 16 hours ago

NousResearch/DeepHermes-3-Llama-3-8B-Preview

liked a model about 16 hours ago

NousResearch/DeepHermes-3-Mistral-24B-Preview

View all activity

Organizations

None yet

siyengfeng's activity

upvoted 3 papers about 16 hours ago

Quantizing Large Language Models for Code Generation: A Differentiated Replication

Paper • 2503.07103 • Published 4 days ago • 5

More Documents, Same Length: Isolating the Challenge of Multiple Documents in RAG

Paper • 2503.04388 • Published 8 days ago • 13

GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-based VLM Agent Training

Paper • 2503.08525 • Published 3 days ago • 13

upvoted 5 papers 2 days ago

Benchmarking AI Models in Software Engineering: A Review, Search Tool, and Enhancement Protocol

Paper • 2503.05860 • Published 7 days ago • 7

Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning

Paper • 2503.07572 • Published 4 days ago • 31

Implicit Reasoning in Transformers is Reasoning through Shortcuts

Paper • 2503.07604 • Published 4 days ago • 17

Gemini Embedding: Generalizable Embeddings from Gemini

Paper • 2503.07891 • Published 4 days ago • 24

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

Paper • 2503.07536 • Published 4 days ago • 73

upvoted 4 papers 3 days ago

State-offset Tuning: State-based Parameter-Efficient Fine-Tuning for State Space Models

Paper • 2503.03499 • Published 9 days ago • 5

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

Paper • 2503.06749 • Published 5 days ago • 21

FEA-Bench: A Benchmark for Evaluating Repository-Level Code Generation for Feature Implementation

Paper • 2503.06680 • Published 5 days ago • 17

Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning

Paper • 2503.07002 • Published 4 days ago • 36

upvoted 6 papers 4 days ago

An Empirical Study on Eliciting and Improving R1-like Reasoning Models

Paper • 2503.04548 • Published 8 days ago • 8

TinyR1-32B-Preview: Boosting Accuracy with Branch-Merge Distillation

Paper • 2503.04872 • Published 8 days ago • 14

Learning from Failures in Multi-Attempt Reinforcement Learning

Paper • 2503.04808 • Published 10 days ago • 17

R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning

Paper • 2503.05592 • Published 7 days ago • 25

R1-Zero's "Aha Moment" in Visual Reasoning on a 2B Non-SFT Model

Paper • 2503.05132 • Published 7 days ago • 47

Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching

Paper • 2503.05179 • Published 7 days ago • 42

upvoted a paper 6 days ago

Token-Efficient Long Video Understanding for Multimodal LLMs

Paper • 2503.04130 • Published 8 days ago • 79

upvoted a paper 7 days ago

Dedicated Feedback and Edit Models Empower Inference-Time Scaling for Open-Ended General-Domain Tasks

Paper • 2503.04378 • Published 8 days ago • 6