papers - a trenkert Collection

trenkert 's Collections

papers

papers

updated Apr 11, 2024

Chain-of-Thought Reasoning Without Prompting

Paper • 2402.10200 • Published Feb 15, 2024 • 107
Self-Discover: Large Language Models Self-Compose Reasoning Structures

Paper • 2402.03620 • Published Feb 6, 2024 • 115
Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences

Paper • 2404.03715 • Published Apr 4, 2024 • 61
Do language models plan ahead for future tokens?

Paper • 2404.00859 • Published Apr 1, 2024 • 2