Sergei Averkiev's picture

Sergei Averkiev

averoo

·

https://lingtra.in

averkij

AI & ML interests

None yet

Recent Activity

liked a Space 9 days ago

multimodalart/LLaDA

upvoted a paper 15 days ago

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

upvoted a paper 16 days ago

SurveyX: Academic Survey Automation via Large Language Models

View all activity

Organizations

averoo's activity

upvoted a paper 15 days ago

LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers

Paper • 2502.15007 • Published 19 days ago • 161

upvoted a paper 16 days ago

SurveyX: Academic Survey Automation via Large Language Models

Paper • 2502.14776 • Published 19 days ago • 92

upvoted 2 papers 19 days ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 20 days ago • 177

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published 19 days ago • 95

upvoted a paper 26 days ago

CoSER: Coordinating LLM-Based Persona Simulation of Established Roles

Paper • 2502.09082 • Published 27 days ago • 27

upvoted 5 papers about 1 month ago

Improving Transformer World Models for Data-Efficient RL

Paper • 2502.01591 • Published Feb 3 • 9

o3-mini vs DeepSeek-R1: Which One is Safer?

Paper • 2501.18438 • Published Jan 30 • 22

Virus: Harmful Fine-tuning Attack for Large Language Models Bypassing Guardrail Moderation

Paper • 2501.17433 • Published Jan 29 • 9

Over-Tokenized Transformer: Vocabulary is Generally Worth Scaling

Paper • 2501.16975 • Published Jan 28 • 26

Baichuan-Omni-1.5 Technical Report

Paper • 2501.15368 • Published Jan 26 • 61

upvoted 5 papers about 2 months ago

Evolution and The Knightian Blindspot of Machine Learning

Paper • 2501.13075 • Published Jan 22 • 6

FilmAgent: A Multi-Agent Framework for End-to-End Film Automation in Virtual 3D Spaces

Paper • 2501.12909 • Published Jan 22 • 68

3DIS-FLUX: simple and efficient multi-instance generation with DiT rendering

Paper • 2501.05131 • Published Jan 9 • 34

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 275

MangaNinja: Line Art Colorization with Precise Reference Following

Paper • 2501.08332 • Published Jan 14 • 57

upvoted 3 papers 2 months ago

YuLan-Mini: An Open Data-efficient Language Model

Paper • 2412.17743 • Published Dec 23, 2024 • 65

MMFactory: A Universal Solution Search Engine for Vision-Language Tasks

Paper • 2412.18072 • Published Dec 24, 2024 • 18

Molar: Multimodal LLMs with Collaborative Filtering Alignment for Enhanced Sequential Recommendation

Paper • 2412.18176 • Published Dec 24, 2024 • 15

upvoted 2 papers 3 months ago

Deliberation in Latent Space via Differentiable Cache Augmentation

Paper • 2412.17747 • Published Dec 23, 2024 • 30

Fietje: An open, efficient LLM for Dutch

Paper • 2412.15450 • Published Dec 19, 2024 • 4