Spaces:

kevineen
/

tanuki_annotation_phase2

Sleeping

App Files Files Community

kevineen commited on Jun 10

Commit

c6abd78

•

1 Parent(s): 29faabc

class 使用使用

Browse files

Files changed (3) hide show

target_dataset.txt → huggingface_dataset.txt +3 -3
run.py +32 -32
type/dataset_type.py +6 -6

target_dataset.txt → huggingface_dataset.txt RENAMED Viewed

@@ -67,7 +67,7 @@ fileSize 116MB
 - good bool
 - bad bool
 - score int64
-- is_proofreading boolean
-- answer_text string
-- is_proofreadin_2 boolean
 - answer_text_2 string

 - good bool
 - bad bool
 - score int64
+- is_proofreading_1 bool
+- answer_text_1 string
+- is_proofreading_2 bool
 - answer_text_2 string

run.py CHANGED Viewed

@@ -1,8 +1,34 @@
 import gradio as gr
-from huggingface_hub import list_models
 from datasets import load_dataset
 from type.dataset_type import TanukiPhase2AnnotationDataset
 # HF保存先
 output_dataset = [
     "kevineen/Phase2_dataset_annotation"
@@ -20,35 +46,11 @@ annotation_dataset_list = [
     "kanhatakeyama/LogicalDatasetsByMixtral8x22b",
     ]
-# アノテーションクラス
-class AnnotationState:
-    def __init__(self, gr):
-        # 選択中のデータセット 初期値は"hatakeyama-llm-team/AutoGeneratedJapaneseQA"
-        self.dropdown_dataset = gr.State(value=annotation_dataset_list[1])
-        self.current_dataset = gr.State(None) # 現在のデータ
-        self.current_idx = gr.State(0) # 現在のインデックス
-        self.target_dataset = gr.State(None) # 出力先データセット
-        self.initial_answer_text = gr.State("") # 文を整形したかチェック用
-        self.initial_answer_text_2 = gr.State("") # 文を整形したかチェック用
-        # 出力用
-        self.id = gr.State(0) # 出力先のデータセットをチェックし、末尾IDを追加
-        self.dataset = gr.State("") # 編集に使用したデータセット
-        self.dataset_id = gr.State(0) # 加工元データセットのidx
-        self.who = gr.State("") # アノテーション者
-        self.good = gr.State(False) # 良
-        self.bad = gr.State(False) # 悪
-        self.score = gr.State(3) # スコア 初期値は3
-        self.is_proofreading = gr.State(False) # 文を整形したか_1
-        self.answer_text = gr.State("") # answer_1 回答
-        self.is_proofreading_2 = gr.State(False) # 文を整形したか_2
-        self.answer_text_2 = gr.State("") # answer_2 回答
-state = AnnotationState(gr)
 # 選択中のデータセット 初期値は"hatakeyama-llm-team/AutoGeneratedJapaneseQA",
-dropdown_dataset = gr.State(value = annotation_dataset_list[1])
 current_dataset = gr.State(None) # 現在のデータ
 target_dataset = gr.State(None) # データセット
 current_idx = gr.State(0) # 現在のインデックス
@@ -135,8 +137,6 @@ with gr.Blocks(theme=theme_, css=load_css()) as demo:
             profile_name = gr.Markdown()
-            # theme_button = gr.Button("Switch Theme")
-            # theme_button.click(fn=update_theme, outputs=None)
             # お名前表示 出力データセット用
             demo.load(hello, inputs=None, outputs=profile_name)
@@ -162,7 +162,7 @@ with gr.Blocks(theme=theme_, css=load_css()) as demo:
         question_text = gr.Textbox(label="質問: ", interactive=False)
-        with gr.Tab("シンプルモード"):
             with gr.Column():
@@ -203,7 +203,7 @@ with gr.Blocks(theme=theme_, css=load_css()) as demo:
                     outputs=None
                 )
-        with gr.Tab("丁寧モード"):
             score_slider = gr.Slider(1, 5, label="スコア: 1-5　(1:大変悪い、2:悪い、3:普通、4:良い、5:大変良い)", step=1, value=score.value, interactive=True)

+from typing import Optional, List
 import gradio as gr
 from datasets import load_dataset
 from type.dataset_type import TanukiPhase2AnnotationDataset
+class CurrentData:
+    def __init__(self, gr, annotation_dataset_list: List[str]):
+        # 選択中のデータセット 初期値は"hatakeyama-llm-team/AutoGeneratedJapaneseQA"
+        self.dropdown_dataset = gr.State(value=annotation_dataset_list[0])
+        self.current_dataset = gr.State(None) # 現在のデータ
+        self.current_idx = gr.State(0) # 現在のインデックス
+        self.target_dataset = gr.State(None) # 出力先データセット
+        self.initial_answer_text = gr.State("") # 回答1を整形したかチェック用
+        self.initial_answer_text_2 = gr.State("") # 回答2を整形したかチェック用
+# アノテーション中のデータセット
+class AnnotationState (TanukiPhase2AnnotationDataset):
+    def __init__(self, gr):
+        self.id = gr.State(0) # 出力先のデータセットをチェックし、末尾IDを追加
+        self.dataset = gr.State("") # 編集に使用したデータセット
+        self.dataset_id = gr.State(0) # 加工元データセットのidx
+        self.who = gr.State("") # アノテーション者
+        self.good = gr.State(False) # 良
+        self.bad = gr.State(False) # 悪
+        self.score = gr.State(3) # スコア 初期値は3
+        self.is_proofreading_1 = gr.State(False) # 回答1を整形したか_1
+        self.answer_text = gr.State("") # answer_1 回答
+        self.is_proofreading_2 = gr.State(False) # 回答2を整形したか_2
+        self.answer_text_2 = gr.State("") # answer_2 回答
 # HF保存先
 output_dataset = [
     "kevineen/Phase2_dataset_annotation"
     "kanhatakeyama/LogicalDatasetsByMixtral8x22b",
     ]
+current_data = CurrentData(gr, annotation_dataset_list)
+annotation_state = AnnotationState(gr)
 # 選択中のデータセット 初期値は"hatakeyama-llm-team/AutoGeneratedJapaneseQA",
+dropdown_dataset = gr.State(value = annotation_dataset_list[0])
 current_dataset = gr.State(None) # 現在のデータ
 target_dataset = gr.State(None) # データセット
 current_idx = gr.State(0) # 現在のインデックス
             profile_name = gr.Markdown()
             # お名前表示 出力データセット用
             demo.load(hello, inputs=None, outputs=profile_name)
         question_text = gr.Textbox(label="質問: ", interactive=False)
+        with gr.Tab("シンプルモード(良い・悪いのみ選択)"):
             with gr.Column():
                     outputs=None
                 )
+        with gr.Tab("丁寧モード（5段階評価・文章校正）"):
             score_slider = gr.Slider(1, 5, label="スコア: 1-5　(1:大変悪い、2:悪い、3:普通、4:良い、5:大変良い)", step=1, value=score.value, interactive=True)

type/dataset_type.py CHANGED Viewed

@@ -54,16 +54,16 @@ class LogicalDatasetsByMixtral8x22b:
   question: str
   answer: str
 class TanukiPhase2AnnotationDataset:
   id: int
   dataset: str
-  database_id: int
   who: str
   good: bool
   bad: bool
   score: float
-  is_proofreading: bool
-  answer_text : str
-  is_proofreading_2: str
-  answer_text2 : str

   question: str
   answer: str
+# 加工後提出用
 class TanukiPhase2AnnotationDataset:
   id: int
   dataset: str
+  dataset_id: int
   who: str
   good: bool
   bad: bool
   score: float
+  is_proofreading_1: bool
+  answer_text_1 : str
+  is_proofreading_2: bool
+  answer_text_2 : str