inkoziev
/

paraphraser

@@ -11,6 +11,7 @@ tags:
 Это генеративная модель на основе ```sberbank-ai/rugpt3large_based_on_gpt2```, дообученной
 на датасете перефразировок [inkoziev/paraphrases](https://huggingface.co/datasets/inkoziev/paraphrases).
 Она разработана для использования в проекте [генеративной поэзии](https://github.com/Koziev/verslibre).
 ### Особенности перефразировки
@@ -24,14 +25,14 @@ tags:
 В обучающем датасете есть негативные примеры перефразировок, и я использую их вместе с правильными примерами в ходе файнтюна,
 подавая на классификационную голову в [GPT2DoubleHeadsModel](https://huggingface.co/docs/transformers/model_doc/gpt2#transformers.GPT2DoubleHeadsModel).
-Код, выполняющий файнтюн, доступен [тут](https://gist.github.com/Koziev/791febec6613a2ae744da52d2a3ec067).
 Такой подход к файнтюну оказался лучше, чем два других подхода:
 1) дефолтный способ файнтюна, когда GPT дообучается просто на текстах, состоящих из исходного текста и перефразировки,
 разделенных специальным токеном. В этом подходе модель обучается также на токенах затравки, что может быть нежелательным.
 2) вариация первого способа, в котором токены затравки (исходного текста) исключаются из обратного распространения с помощью
-задания labels=-100.
 В качестве метрики для сравнения подходов и для подбора числа неверных вариантов перефразировки в GPT2DoubleHeadsModel
 использована комбинация из:

 Это генеративная модель на основе ```sberbank-ai/rugpt3large_based_on_gpt2```, дообученной
 на датасете перефразировок [inkoziev/paraphrases](https://huggingface.co/datasets/inkoziev/paraphrases).
 Она разработана для использования в проекте [генеративной поэзии](https://github.com/Koziev/verslibre).
+Код для тренировки и использования перефразировщика доступен в репозитрии [https://github.com/Koziev/paraphraser](https://github.com/Koziev/paraphraser).
 ### Особенности перефразировки
 В обучающем датасете есть негативные примеры перефразировок, и я использую их вместе с правильными примерами в ходе файнтюна,
 подавая на классификационную голову в [GPT2DoubleHeadsModel](https://huggingface.co/docs/transformers/model_doc/gpt2#transformers.GPT2DoubleHeadsModel).
+Код, выполняющий файнтюн, доступен [тут](https://github.com/Koziev/paraphraser/blob/main/train_paraphraser_with_gpt2doublehead.py).
 Такой подход к файнтюну оказался лучше, чем два других подхода:
 1) дефолтный способ файнтюна, когда GPT дообучается просто на текстах, состоящих из исходного текста и перефразировки,
 разделенных специальным токеном. В этом подходе модель обучается также на токенах затравки, что может быть нежелательным.
 2) вариация первого способа, в котором токены затравки (исходного текста) исключаются из обратного распространения с помощью
+задания labels=-100 ([код](https://github.com/Koziev/paraphraser/blob/main/finetune_paraphraser_with_prompt_masking.py)).
 В качестве метрики для сравнения подходов и для подбора числа неверных вариантов перефразировки в GPT2DoubleHeadsModel
 использована комбинация из: