OpenPipe
/

Deductive-Reasoning-Qwen-32B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

bradhiltonendercorp commited on 5 days ago

Commit

7755dcc

·

verified ·

1 Parent(s): ea3ccdd

Update README.md

Files changed (1) hide show

README.md +26 -3

README.md CHANGED Viewed

@@ -1,3 +1,26 @@
----
-license: mit
----

+---
+license: mit
+license_link: https://huggingface.co/OpenPipe/Deductive-Reasoning-Qwen-14B/blob/main/LICENSE
+language:
+- en
+pipeline_tag: text-generation
+base_model:
+- Qwen/Qwen2.5-1.5B-Instruct
+tags:
+- chat
+library_name: transformers
+---
+# Deductive-Reasoning-Qwen-14B
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/674a1d102c0f27a385772cfe/JauBmEQM0FpOdShBMSfst.png)
+Deductive Reasoning Qwen 14B is a reinforcement fine-tune of [Qwen 2.5 14B Instruct](https://huggingface.co/Qwen/Qwen2.5-14B-Instruct) to solve challenging deduction problems from the [Temporal Clue](https://github.com/bradhilton/temporal-clue) dataset, trained by [OpenPipe](https://openpipe.ai)!
+Here are some additional resources to check out:
+- Blog Post
+- [Training Recipe](https://github.com/openpipe/deductive-reasoning)
+- [RL Experiments](https://github.com/openpipe/rl-experiments)
+- [Deductive Reasoning Qwen 32B](https://huggingface.co/OpenPipe/Deductive-Reasoning-Qwen-32B)