titan087
/

LHK_DPO_v1-GPTQ-4bit

Text Generation

Inference Endpoints

text-generation-inference

4-bit precision

Model card Files Files and versions Community

Edit model card

LHK_DPO_v1

LHK_DPO_v1 is trained via Direct Preference Optimization(DPO) from TomGrc/FusionNet_7Bx2_MoE_14B.

Details

coming sooon.

Evaluation Results

coming soon.

Contamination Results

coming soon.

Downloads last month: 1