Spaces:

yosuke-i
/

risdom

Sleeping

App Files Files Community

yosuke-i commited on Apr 16

Commit

e54ce3e

•

1 Parent(s): 2819a54

Update app.py

Browse files

Files changed (1) hide show

app.py +82 -0

app.py CHANGED Viewed

@@ -57,7 +57,77 @@ def create_choice_question(csv_file,input_text):
     os.rename(output_path, new_path)
     return new_path
 title = "英語生成ツール"
@@ -96,4 +166,16 @@ with gr.Blocks(theme=gr.themes.Soft()) as demo:
                 inputs=[inputs],
                 outputs=[outputs]
             )
 demo.launch(share=True)

     os.rename(output_path, new_path)
     return new_path
+def kousei(csv_file,input_text):
+    # CSVファイルを読み込む
+    df = pd.read_csv(csv_file.name)
+    # DataFrameを5行ごとに処理するためのグループ化
+    df['group_id'] = df.index // 5
+    grouped = df.groupby('group_id')
+    # 各グループに対してフォーマットされたプロンプトを作成
+    def create_prompt(group, base_prompt):
+        prompt = base_prompt
+        for _, row in group.iterrows():
+            prompt += f"\n[{row['id']}]\n{row['原稿']}"
+        return prompt
+    # 各グループごとのプロンプトを生成
+    prompts = grouped.apply(lambda g: create_prompt(g, prompt_text))
+    prompts = prompts.reset_index(name='prompt_after')
+    # 各プロンプトをAPIに送信
+    prompts['response'] = prompts['prompt_after'].apply(get_chatgpt_response)
+    # 応答を分割して元のDataFrameにマッピングする関数
+    def split_responses(grouped_df):
+        rows = []  # 結果を格納するための一時リスト
+        for _, row in grouped_df.iterrows():
+            response = row['response']
+            # 正規表現でIDとテキストを抽出
+            split_response = re.split(r'\[([A-Z0-9]+)\]\s*', response)
+            ids_texts = list(zip(split_response[1::2], split_response[2::2]))
+            for id_text in ids_texts:
+                problem_id = id_text[0]
+                correction_result = id_text[1].strip()
+                original_content = df.loc[df['id'] == problem_id, '原稿'].iloc[0]  # 問題IDに対応する原稿を取得
+                # 辞書をリストに追加
+                rows.append({
+                    'id': problem_id,
+                    'contents': original_content,
+                    '校正結果': correction_result
+                })
+        # 一時リストからDataFrameを生成
+        result_df = pd.DataFrame(rows)
+        return result_df
+    final_results = split_responses(prompts)
+     # ファイル出力
+    with tempfile.NamedTemporaryFile(delete=False, suffix='.csv') as tmp:
+        # cp932で保存、エラーは無視（置換しても良い）
+        final_results.to_csv(tmp.name, index=False, encoding='cp932', errors='ignore')
+        output_path = tmp.name
+    # ファイル名を変更
+    new_path = os.path.join(os.path.dirname(output_path), "output.csv")
+    os.rename(output_path, new_path)
+    return new_path
+# 結果をCSVに保存
+final_results.to_csv('output.csv', index=False)
 title = "英語生成ツール"
                 inputs=[inputs],
                 outputs=[outputs]
             )
+    with gr.Tab("校正"):
+        with gr.Column():
+            input_text_kousei = gr.Textbox(label="校正観点を入力してください。",value="'英単語習得を目的として、以下2種類の問題を用意しています。\n１．英語の正しい日本語訳を選択する4択問題\n２．日本語の正しい英語訳を選択する4択問題\n「#リスト」の誤答選択肢の中に、正解選択肢の別解になってしまっているもの、または別解とは言えないが紛らわしすぎるものがないか、探して指摘してください。")
+            input_text_kousei = input_text_kousei + "指摘は、全ての問題において問題がない場合も含めて、必ず全問題、[問題ID]に続けて結果を書くフォーマットで返してください。[問題ID]の後は改行しないで。（必ず[問題ID]が５つ表示されるはずです）指摘方法は、問題ない場合は「問題なし」、指摘がある場合は「問題あり」\n「問題あり」の場合、問題のある箇所を具体的に指摘してください。\n#リスト"
+            with gr.Row():
+                inputs=gr.File(label="CSVファイルをアップロード")
+                outputs=gr.File(label="ダウンロード", file_count="singular")
+            gr.Button("問題生成").click(
+                kousei,
+                inputs=[inputs,input_text_kousei],
+                outputs=[outputs]
+            )
 demo.launch(share=True)