Initial commit

Files changed (11) hide show

.gitignore +1 -0
README.md +9 -0
adapter_config.json +28 -0
adapter_model.bin +3 -0
chat.json +10 -0
config.json +36 -0
generation_config.json +13 -0
special_tokens_map.json +37 -0
test_lora.py +141 -0
tokenizer.model +3 -0
tokenizer_config.json +43 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ /.idea/

README.md CHANGED Viewed

@@ -1,3 +1,12 @@
 ---
 license: mit
 ---

 ---
 license: mit
+datasets:
+- d0rj/gsm8k-ru
+- d0rj/alpaca-cleaned-ru
+- IlyaGusev/ru_turbo_alpaca
+- IlyaGusev/ru_turbo_alpaca_evol_instruct
+language:
+- ru
+library_name: peft
+pipeline_tag: text-generation
 ---

adapter_config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": null,
+  "base_model_name_or_path": "/home/pasha/Documents/Repository/gpt/saiga-custom/Yarn-Mistral-7b-128k",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 16,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "o_proj",
+    "k_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:972e34d18e05e346f738031a80b365cb82c29c0b9d6e0674ee4899ff5541d2fe
+size 54618762

chat.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "system_prompt": "Ты — PavelGPT, русскоязычный автоматический ассистент. Ты разговариваешь с людьми и помогаешь им.",
+    "system_message_template": "<s>{role}\n{content}</s>\n",
+    "user_message_template": "<s>{role}\n{content}</s>\n",
+    "bot_message_template": "<s>{role}\n{content}</s>\n",
+    "user_role": "user",
+    "bot_role": "bot",
+    "system_role": "system",
+    "suffix": ""
+}

config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_name_or_path": "NousResearch/Yarn-Mistral-7b-128k",
+  "architectures": [
+    "MistralForCausalLM"
+  ],
+  "auto_map": {
+    "AutoConfig": "configuration_mistral.MistralConfig",
+    "AutoModelForCausalLM": "modeling_mistral_yarn.MistralForCausalLM"
+  },
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 32768,
+  "max_sequence_length": 131072,
+  "model_type": "mistral",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 16.0,
+    "finetuned": true,
+    "original_max_position_embeddings": 8192,
+    "type": "yarn"
+  },
+  "rope_theta": 10000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": false,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.35.0.dev0",
+  "use_cache": true,
+  "vocab_size": 32000
+}

generation_config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "pad_token_id": 0,
+    "unk_token_id": 0,
+    "bos_token_id": 1,
+    "eos_token_id": 2,
+    "temperature": 0.2,
+    "top_p": 0.2,
+    "top_k": 20,
+    "do_sample": true,
+    "max_new_tokens": 4096,
+    "repetition_penalty": 1.2,
+    "no_repeat_ngram_size": 15
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

test_lora.py ADDED Viewed

	@@ -0,0 +1,141 @@

+import torch
+import logging
+from peft import PeftModel, PeftConfig
+from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig
+# MODEL_NAME = "IlyaGusev/gigasaiga_lora"
+# MODEL_NAME = "evilfreelancer/ruGPT-3.5-13B-lora"
+# MODEL_NAME = "evilfreelancer/saiga_mistral_7b_128k_lora"
+# MODEL_NAME = "./yarn_mistral_7b_128k"
+MODEL_NAME = "./yarn_mistral_7b_128k_yakovlev"
+DEFAULT_MESSAGE_TEMPLATE = "<s>{role}\n{content}</s>\n"
+# DEFAULT_SYSTEM_PROMPT = """
+# Ты — Saiga 2, русскоязычный автоматический ассистент. Ты разговариваешь с людьми и помогаешь им.
+# """
+DEFAULT_SYSTEM_PROMPT = """
+Ты - Иван Яковлевич Яковлев. Ты был просветителем, православным миссионером, российский педагогом, организатором народных школ, инспектором (руководителем) чувашских школ Казанского учебного округа (1875-1903) и созданной им Симбирской чувашской учительской школы (1868-1919). Я создал современный чувашский алфавит (1870-е годы) и учебники чувашского и русского языков для чувашей, был писателем, переводчиком, фольклористом. Действительный статский советник (1904).
+"""
+class Conversation:
+    def __init__(
+            self,
+            message_template=DEFAULT_MESSAGE_TEMPLATE,
+            system_prompt=DEFAULT_SYSTEM_PROMPT,
+            start_token_id=2,
+            # Bot token may be a list or single int
+            bot_token_id=10093,  # yarn_mistral_7b_128k
+            # bot_token_id=46787,  # rugpt35_13b
+            # int (amount of questions and answers) or None (unlimited)
+            history_limit=None,
+    ):
+        self.logger = logging.getLogger('Conversation')
+        self.message_template = message_template
+        self.start_token_id = start_token_id
+        self.bot_token_id = bot_token_id
+        self.history_limit = history_limit
+        self.messages = [{
+            "role": "system",
+            "content": system_prompt
+        }]
+    def get_start_token_id(self):
+        return self.start_token_id
+    def get_bot_token_id(self):
+        return self.bot_token_id
+    def add_message(self, role, message):
+        self.messages.append({
+            "role": role,
+            "content": message
+        })
+        self.trim_history()
+    def add_user_message(self, message):
+        self.add_message("user", message)
+    def add_bot_message(self, message):
+        self.add_message("assistant", message)
+    def trim_history(self):
+        if self.history_limit is not None and len(self.messages) > self.history_limit + 1:
+            overflow = len(self.messages) - (self.history_limit + 1)
+            self.messages = [self.messages[0]] + self.messages[overflow + 1:]  # remove old messages except system
+    def get_prompt(self, tokenizer):
+        final_text = ""
+        # print(self.messages)
+        for message in self.messages:
+            message_text = self.message_template.format(**message)
+            final_text += message_text
+        # Bot token id may be an array
+        if isinstance(self.bot_token_id, (list, tuple)):
+            final_text += tokenizer.decode([self.start_token_id] + self.bot_token_id)
+        else:
+            final_text += tokenizer.decode([self.start_token_id, self.bot_token_id])
+        return final_text.strip()
+def generate(model, tokenizer, prompt, generation_config):
+    data = tokenizer(prompt, return_tensors="pt")
+    data = {k: v.to(model.device) for k, v in data.items()}
+    output_ids = model.generate(
+        **data,
+        max_length=10240,
+        generation_config=generation_config
+    )[0]
+    output_ids = output_ids[len(data["input_ids"][0]):]
+    output = tokenizer.decode(output_ids, skip_special_tokens=True)
+    return output.strip()
+config = PeftConfig.from_pretrained(MODEL_NAME)
+model = AutoModelForCausalLM.from_pretrained(
+    config.base_model_name_or_path,
+    load_in_8bit=True,
+    torch_dtype=torch.float16,
+    device_map="auto",
+    use_flash_attention_2=True,
+)
+model = PeftModel.from_pretrained(
+    model,
+    MODEL_NAME,
+    torch_dtype=torch.float16
+)
+model.eval()
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=False)
+generation_config = GenerationConfig.from_pretrained(MODEL_NAME)
+print(generation_config)
+conversation = Conversation()
+while True:
+    user_message = input("User: ")
+    # Reset chat command
+    if user_message.strip() == "/reset":
+        conversation = Conversation()
+        print("History reset completed!")
+        continue
+    # Skip empty messages from user
+    if user_message.strip() == "":
+        continue
+    conversation.add_user_message(user_message)
+    prompt = conversation.get_prompt(tokenizer)
+    output = generate(
+        model=model,
+        tokenizer=tokenizer,
+        prompt=prompt,
+        generation_config=generation_config
+    )
+    conversation.add_bot_message(output)
+    print("Bot:", output)
+    print()
+    print("==============================")
+    print()

tokenizer.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dadfd56d766715c61d2ef780a525ab43b8e6da4de6865bda3d95fdef5e134055
+size 493443

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "add_bos_token": false,
+  "add_eos_token": false,
+  "added_tokens_decoder": {
+    "0": {
+      "content": "<unk>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "</s>",
+  "legacy": true,
+  "model_max_length": 32768,
+  "pad_token": "<unk>",
+  "padding_side": "left",
+  "sep_token": "<s>",
+  "sp_model_kwargs": {},
+  "spaces_between_special_tokens": false,
+  "tokenizer_class": "LlamaTokenizer",
+  "unk_token": "<unk>",
+  "use_default_system_prompt": false
+}