File size: 2,117 Bytes
638dde7
 
f37b1e4
 
 
 
 
 
 
 
 
4cef881
f188a63
b5c6dc3
de3ac75
638dde7
f37b1e4
d14b732
 
00959f0
 
d14b732
 
 
 
 
 
 
 
 
 
 
 
 
 
 
f37b1e4
8e5212e
024c1c4
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
---
license: cc-by-nc-sa-4.0
language:
- ru
library_name: transformers
tags:
- chat
- porn
- sex
- erotic
- roleplay
widget:
- text: "Я: (улыбаюсь)"
- text: "Аня: Ох!"
pipeline_tag: text-generation
---

Модель для эротического ролеплея. Неплохо держит конекст, параметры для старта:

Также доступна следующая версия - [https://huggingface.co/zlsl/l_erotic_kink_chat](https://huggingface.co/zlsl/l_erotic_kink_chat)

do_sample: true<br>
top_p: 0.96 # Выше 1.2 - будет сильно уходить от контекста<br>
top_k: 14<br>
temperature: 0.88<br>
repetition_penalty: 1.16<br>
encoder_repetition_penalty: 1.09-1.15<br>
typical_p: 1.0<br>


Для чата желательно останавливать после '\n', также ставьте более 5 попыток генерации и ожидаемое количество новых токенов > 150, тогда диалоги будут интереснее.

Очень желательно в контексте и во время диалога указывать действия и мысли в скобках. Например: Привет (вхожу в комнату, закрываю дверь)


Датасет подготовлен по технологии TiMe

Оптимизированный фронтенд для данных моделей в режиме чата под Android - https://github.com/zlsl/pocketai


## Для пользователей text-generation-webui
В инструменте поломана работа с GPT-2, GPTJ, GPT-NEO и аналогичными модлями, неверно загружается токенизер.
Ошибка такая:<br>
>eos_token_id = eos_token_id[0]
>IndexError: list index out of range

Исправляется легко, в файл modules/models.py в функцию load_tokenizer() надо добавить строчку<br>
<code>tokenizer.eos_token_id = 2</code><br>
перед<br>
<code>return tokenizer</code>