Spaces:

xl2533
/

MakeInstruction

Runtime error

DSXiangLi commited on Apr 9, 2023

Commit

1cabc1d

•

1 Parent(s): 15fc122

a

Files changed (4) hide show

main.py CHANGED Viewed

@@ -30,5 +30,11 @@ if __name__ == '__main__':
     openai_key ='a'
     n_human=2
     n_machine=1
-    n_instruct=5
     instance = SELF(seed_file, openai_key, n_human, n_machine, n_instruct, None)

     openai_key ='a'
     n_human=2
     n_machine=1
+    n_instruct=4
     instance = SELF(seed_file, openai_key, n_human, n_machine, n_instruct, None)
+    scorer = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=False, tokenizer=ChineseTokenizer())
+    inst_tokens = scorer._tokenizer.tokenize('诊断患者')
+    with Pool(os.cpu_count()) as p:
+        rouge_scores = p.map(partial(rouge_scorer._score_lcs,inst_tokens), instance.all_instruction_tokens)
+    rouge_l = [score.fmeasure for score in rouge_scores]

self/__pycache__/generate.cpython-38.pyc CHANGED Viewed

Binary files a/self/__pycache__/generate.cpython-38.pyc and b/self/__pycache__/generate.cpython-38.pyc differ

self/__pycache__/prompt.cpython-38.pyc CHANGED Viewed

Binary files a/self/__pycache__/prompt.cpython-38.pyc and b/self/__pycache__/prompt.cpython-38.pyc differ

self/generate.py CHANGED Viewed

@@ -1,4 +1,6 @@
 # -*-coding:utf-8 -*-
 import re
 import numpy as np
 import os
@@ -65,8 +67,8 @@ class SELF(object):
             prompt = self_prompt
         self.chain = LLMChain(llm=self.llm, prompt=PromptTemplate.from_template(prompt))
         self.scorer = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=False, tokenizer=ChineseTokenizer())
-        self.all_instruction = self.human_instruction_data + self.machine_instruction_data
-        self.all_instruction_tokens = [self.scorer._tokenizer.tokenize(i['instruction']) for i in
                                        self.all_instruction]
     @property
@@ -138,7 +140,7 @@ class SELF(object):
         for inst in instruction_data:
             inst_tokens = self.scorer._tokenizer.tokenize(inst['instruction'])
             with Pool(os.cpu_count()) as p:
-                rouge_scores = p.map(partial(rouge_scorer._score_lcs, self.all_instruction_tokens), inst_tokens)
             rouge_l = [score.fmeasure for score in rouge_scores]
             print(rouge_scores)
             print(rouge_l)

 # -*-coding:utf-8 -*-
+import os
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
 import re
 import numpy as np
 import os
             prompt = self_prompt
         self.chain = LLMChain(llm=self.llm, prompt=PromptTemplate.from_template(prompt))
         self.scorer = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=False, tokenizer=ChineseTokenizer())
+        self.all_instruction = [i['instruction'] for i in self.human_instruction_data + self.machine_instruction_data]
+        self.all_instruction_tokens = [self.scorer._tokenizer.tokenize(i) for i in
                                        self.all_instruction]
     @property
         for inst in instruction_data:
             inst_tokens = self.scorer._tokenizer.tokenize(inst['instruction'])
             with Pool(os.cpu_count()) as p:
+                rouge_scores = p.map(partial(rouge_scorer._score_lcs, inst_tokens), self.all_instruction_tokens)
             rouge_l = [score.fmeasure for score in rouge_scores]
             print(rouge_scores)
             print(rouge_l)