WaveCut's picture
Update README.md
91e7e08 verified
metadata
library_name: llamacpp
language:
  - ru
  - en
license: apache-2.0
tags:
  - instruct

Релиз вихря 0.5*

Долили сильно больше данных в sft, теперь стабильнее работает json и multiturn, слегка подточили параметры претрена модели, добавили RoPE на 32к контекста

Added a lot more data to sft, now json and multiturn work more stable on long context and hard prompts

Известные проблемы

  • В конце ответа модель добавляет мусор, внешне напоминающий ml chat разметку.