TED Vortex

0-vortex

AI & ML interests

None yet

Recent Activity

liked a dataset 7 days ago

Rapidata/OpenAI-4o_t2i_human_preference

liked a model 14 days ago

OnomaAIResearch/Illustrious-XL-v1.1

liked a model 19 days ago

briaai/RMBG-2.0

View all activity

Organizations

None yet

0-vortex's activity

upvoted a paper 30 days ago

Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers

Paper • 2503.00865 • Published Mar 2 • 61

upvoted a paper 2 months ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 373

upvoted a paper 3 months ago

Xmodel-2 Technical Report

Paper • 2412.19638 • Published Dec 27, 2024 • 26

upvoted a paper 5 months ago

GPT-4o System Card

Paper • 2410.21276 • Published Oct 25, 2024 • 85

upvoted a paper 8 months ago

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search

Paper • 2408.08152 • Published Aug 15, 2024 • 57

upvoted a collection 8 months ago

Hermes 3

Collection

The Hermes 3 Series of Models • 12 items • Updated Feb 13 • 113

upvoted 2 papers 8 months ago

Your Context Is Not an Array: Unveiling Random Access Limitations in Transformers

Paper • 2408.05506 • Published Aug 10, 2024 • 10

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery

Paper • 2408.06292 • Published Aug 12, 2024 • 122

upvoted an article 8 months ago

Article

Introduction to ggml

Aug 13, 2024

• 176

upvoted 9 papers 9 months ago

Case2Code: Learning Inductive Reasoning with Synthetic Data

Paper • 2407.12504 • Published Jul 17, 2024 • 8

LMMs-Eval: Reality Check on the Evaluation of Large Multimodal Models

Paper • 2407.12772 • Published Jul 17, 2024 • 35

GoldFinch: High Performance RWKV/Transformer Hybrid with Linear Pre-Fill and Extreme KV-Cache Compression

Paper • 2407.12077 • Published Jul 16, 2024 • 56

AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases

Paper • 2407.12784 • Published Jul 17, 2024 • 51

Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models

Paper • 2407.12327 • Published Jul 17, 2024 • 79

Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion

Paper • 2407.10973 • Published Jul 15, 2024 • 11

GTA: A Benchmark for General Tool Agents

Paper • 2407.08713 • Published Jul 11, 2024 • 17

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 162

MJ-Bench: Is Your Multimodal Reward Model Really a Good Judge for Text-to-Image Generation?

Paper • 2407.04842 • Published Jul 5, 2024 • 56