File size: 3,734 Bytes
4fb5f56 1204181 60e179c 1204181 60e179c 1204181 4fb5f56 1204181 ac89f35 b54dfb4 1204181 fe0a8b2 1204181 86c09f6 dd7a459 1204181 dd7a459 1204181 6a02920 1204181 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 |
---
license: cc-by-nc-sa-4.0
language:
- ru
library_name: transformers
tags:
- chat
- porn
- sex
- erotic
- roleplay
widget:
- text: "Офигеть"
- text: "Ой, что это"
- text: "Ложись"
- text: "Отвали"
- text: "Мяу!"
- text: "В душев"
- text: "Тентакли"
pipeline_tag: text-generation
---
Альтернативная модель для эротического ролеплея. Ретрейн l_erotic_kink_chat с изменённым датасетом.
Рекомендую сравнить с m_erotic_chat (https://huggingface.co/zlsl/m_erotic_chat), часто m_erotic_chat работает _лучше_ с контекстом!
Неплохо держит контекст, параметры для старта:
do_sample: true<br>
top_p: 0.9<br>
top_k: 20<br>
temperature: 0.7 # При высоких значениях также работает неплохо<br>
repetition_penalty: 1.15<br>
encoder_repetition_penalty: 1.0-1.15<br>
typical_p: 1.0<br>
Оптимизированный фронтенд для данных моделей в режиме чата под Android - https://github.com/zlsl/pocketai
Для чата желательно количество новых токенов > 350, тогда диалоги будут интереснее.
Очень хорошие результаты при следующем вводе: 1 строка - ваша реплика, 2 строка - ваши действия.
Можно в контексте и во время диалога указывать действия и мысли в скобках. Например: Привет (вхожу в комнату, закрываю дверь)
Важно! В модели добавлен токен `<char>`, он указывает начало строки диалога, прямой речи:
>Абзац ... контекста<br>
>Я: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
>Собеседник: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
Также хорошие результаты в другом формате диалогов:
>Абзац ... контекста<br>
>Я: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
>Еще действия, описание окружения.<br>
>Собеседник: `<char>` (мысли, действия и прочее) Реплика персонажа (еще мысли, контекст)<br>
>Еще действия, описание окружения.<br>
Новый токен желательно использовать, но не обязательно. Также указывать имена персонажей - опционально.
Модель с удовольствием может "в мультичар", количество собеседников может быть более двух.
## Для пользователей text-generation-webui
В инструменте поломана работа с GPT-2, GPTJ, GPT-NEO и аналогичными модлями, неверно загружается токенизер.
Ошибка такая:<br>
>eos_token_id = eos_token_id[0]
>IndexError: list index out of range
Исправляется легко, в файл modules/models.py в функцию load_tokenizer() надо добавить строчку<br>
<code>tokenizer.eos_token_id = 2</code><br>
перед<br>
<code>return tokenizer</code>
|