2 12 1

Fares Obeid

Fareso

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Learning from Failures in Multi-Attempt Reinforcement Learning

upvoted a collection 3 days ago

🧠 Reasoning datasets

upvoted a paper about 2 months ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

View all activity

Organizations

None yet

Fareso's activity

upvoted a paper 1 day ago

Learning from Failures in Multi-Attempt Reinforcement Learning

Paper • 2503.04808 • Published 8 days ago • 14

upvoted a collection 3 days ago

🧠 Reasoning datasets

Collection

Datasets with reasoning traces for math and code released by the community • 14 items • Updated about 8 hours ago • 97

upvoted a paper about 2 months ago

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published Jan 14 • 275

upvoted a paper 2 months ago

YuLan-Mini: An Open Data-efficient Language Model

Paper • 2412.17743 • Published Dec 23, 2024 • 65

upvoted 3 papers 3 months ago

liked a Space 3 months ago

Hymba Chat

👀

Chatting with Hymba

upvoted a paper 4 months ago

Language Models are Hidden Reasoners: Unlocking Latent Reasoning Capabilities via Self-Rewarding

Paper • 2411.04282 • Published Nov 6, 2024 • 34

authored a paper 8 months ago

GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression

Paper • 2407.12077 • Published Jul 16, 2024 • 56

commented 2 papers 8 months ago

GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression

Paper • 2407.12077 • Published Jul 16, 2024 • 56 •

GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression

Paper • 2407.12077 • Published Jul 16, 2024 • 56 •

upvoted a paper 8 months ago

GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression

Paper • 2407.12077 • Published Jul 16, 2024 • 56

commented a paper 8 months ago

GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression

Paper • 2407.12077 • Published Jul 16, 2024 • 56 •

upvoted a paper 8 months ago

In-Context Pretraining: Language Modeling Beyond Document Boundaries

Paper • 2310.10638 • Published Oct 16, 2023 • 30

upvoted a paper 9 months ago

Sparser is Faster and Less is More: Efficient Sparse Attention for Long-Range Transformers

Paper • 2406.16747 • Published Jun 24, 2024 • 19

authored a paper 11 months ago

Eagle and Finch: RWKV with Matrix-Valued States and Dynamic Recurrence

Paper • 2404.05892 • Published Apr 8, 2024 • 36

upvoted a paper 11 months ago

Eagle and Finch: RWKV with Matrix-Valued States and Dynamic Recurrence

Paper • 2404.05892 • Published Apr 8, 2024 • 36

New activity in vikp/textbook_quality_programming 11 months ago

KeyError: 'length'

#4 opened over 1 year ago by

Fareso

New activity in vikp/textbook_quality_programming over 1 year ago

KeyError: 'length'

#4 opened over 1 year ago by

Fareso