Spaces:

Risdom
/

english2

Sleeping

App Files Files Community

english2 / app.py

yosuke-i

Update app.py

639b66c verified about 1 year ago

raw

history blame contribute delete

10.9 kB

	import gradio as gr
	import pandas as pd
	import tempfile
	import os
	import re
	from chatgpt_api import get_chatgpt_response
	from voice_create import text_to_speech
	from select_question import create_choice_question
	from manuscript_conversion import manuscript_conversion
	from category import check
	from kousei import kousei2
	from convert_chukan_fmt_1 import convert_chukan_fmt_1
	from convert_chukan_fmt_2 import convert_chukan_fmt_2
	from convert_last_fmt import convert_last_fmt_question
	from convert_last_fmt import convert_last_fmt_selection
	from convert_last_fmt import convert_last_fmt_correct

	def kousei(csv_file, input_text):
	prompt_text = input_text + "指摘は、全ての問題において問題がない場合も含めて、必ず全問題、[id]に続けて結果を書くフォーマットで返してください。[id]の後は改行しないで。[id]はリクエストと完全一致の形式で。（必ず[問題ID]が５つ表示されるはずです）指摘方法は、問題ない場合は「問題なし」、指摘がある場合は「問題あり」\n「問題あり」の場合、問題のある箇所を具体的に指摘してください。\n#リスト"

	# CSVファイルを読み込む
	df = pd.read_csv(csv_file)
	# 'id'列のデータ型を文字列に変換
	df['id'] = df['id'].astype(str)
	# DataFrameを5行ごとに処理するためのグループ化
	df['group_id'] = df.index // 5
	grouped = df.groupby('group_id')

	# 各グループに対してフォーマットされたプロンプトを作成
	def create_prompt(group, base_prompt):
	prompt = base_prompt
	for _, row in group.iterrows():
	prompt += f"\n[{row['id']}]\n{row['原稿']}"
	print(prompt)
	return prompt

	# 各グループごとのプロンプトを生成
	prompts = grouped.apply(lambda g: create_prompt(g, prompt_text))
	prompts = prompts.reset_index(name='prompt_after')

	# 各プロンプトをAPIに送信（この部分は実装に応じて修正が必要です）
	prompts['response'] = prompts['prompt_after'].apply(get_chatgpt_response)
	print(prompts['response'])

	# 各グループに対してフォーマットされたプロンプトを作成
	def create_prompt(group, base_prompt):
	prompt = base_prompt
	for _, row in group.iterrows():
	prompt += f"\n[{row['id']}]\n{row['原稿']}"
	print(prompt)
	return prompt

	# 各グループごとのプロンプトを生成
	prompts = grouped.apply(lambda g: create_prompt(g, prompt_text))
	prompts = prompts.reset_index(name='prompt_after')

	# 各プロンプトをAPIに送信（この部分は実装に応じて修正が必要です）
	prompts['response'] = prompts['prompt_after'].apply(get_chatgpt_response)
	print(prompts['response'])



	# 応答を分割して元のDataFrameにマッピングする関数
	def split_responses(grouped_df):
	rows = []
	for _, row in grouped_df.iterrows():
	response = row['response']
	split_response = re.split(r'\[([^\]]+)\]\s*', response)
	ids_texts = list(zip(split_response[1::2], split_response[2::2]))

	for id_text in ids_texts:
	problem_id, correction_result = id_text
	# フィルタリングされたDataFrameを安全に取得
	filtered_df = df[df['id'] == problem_id]
	original_content = filtered_df['原稿'].iloc[0] if not filtered_df.empty else "原稿が見つかりません"
	rows.append({
	'id': problem_id,
	'contents': original_content,
	'校正結果': correction_result.strip()
	})

	return pd.DataFrame(rows)

	final_results = split_responses(prompts)

	# ファイル出力
	with tempfile.NamedTemporaryFile(delete=False, suffix='.csv') as tmp:
	final_results.to_csv(tmp.name, index=False, encoding='cp932', errors='ignore')
	output_path = tmp.name

	# ファイル名を変更
	new_path = os.path.join(os.path.dirname(output_path), "output.csv")
	os.rename(output_path, new_path)
	return new_path

	title = "英語生成ツール"

	with gr.Blocks(theme=gr.themes.Soft()) as demo:
	gr.Markdown(
	f"""
	# {title}
	"""
	)
	with gr.Tab("問題生成（選択肢）"):
	with gr.Column():
	gr.Markdown("""
	## 利用手順
	1. こちらの[マスタ](https://drive.google.com/uc?export=download&id=1VyDBtVrnDUlddmITiXg7ybqyB0CTCPeu)を手元に置く
	2. シート「input」に、生成したい問題パターンを書いてください（赤字の要素は固定。選択肢は可変。適宜行追加OK）
	3. 完成したら、「ファイル＞名前を付けて保存」から「CSV UTF-8（コンマ区切り）(*.csv)」形式で保存
	4. 3のCSVを本サイトにアップロード
	""")

	with gr.Row():
	inputs=gr.File(label="CSVファイルをアップロード")
	outputs=gr.File(label="ダウンロード", file_count="singular")
	gr.Button("問題生成").click(
	create_choice_question,
	inputs=[inputs],
	outputs=[outputs]
	)
	with gr.Tab("原稿変換"):
	with gr.Column():
	with gr.Row():
	inputs=gr.File(label="CSVファイルをアップロード")
	outputs=gr.File(label="ダウンロード", file_count="singular")
	gr.Button("変換").click(
	manuscript_conversion,
	inputs=[inputs],
	outputs=[outputs]
	)
	with gr.Tab("校正"):
	with gr.Column():
	input_text_kousei = gr.Textbox(label="校正観点を入力してください。",value="英単語習得を目的として、以下2種類の問題を用意しています。\n１．英語の正しい日本語訳を選択する4択問題\n２．日本語の正しい英語訳を選択する4択問題\n「#リスト」の誤答選択肢の中に、正解選択肢の別解になってしまっているもの、または別解とは言えないが紛らわしすぎるものがないか、探して指摘してください。")
	with gr.Row():
	inputs=gr.File(label="CSVファイルをアップロード")
	outputs=gr.File(label="ダウンロード", file_count="singular")
	gr.Button("校正スタート").click(
	kousei,
	inputs=[inputs,input_text_kousei],
	outputs=[outputs]
	)
	with gr.Tab("校正2"):
	with gr.Column():
	radio_options = ["英語", "日本語"]
	radio_button = gr.Radio(choices=radio_options, label="選択してください",value="英語")
	input_text_kousei = gr.Textbox(label="校正観点を入力してください。",value="If there are any typographical errors, omissions, missing or extra spaces and periods, or grammatical mistakes in the English text, please point them out.")
	with gr.Row():
	inputs=gr.File(label="CSVファイルをアップロード")
	outputs=gr.File(label="ダウンロード", file_count="singular")
	gr.Button("校正スタート").click(
	kousei2,
	inputs=[inputs,input_text_kousei,radio_button],
	outputs=[outputs]
	)
	with gr.Tab("音声生成"):
	with gr.Column():
	# GradioのUIコンポーネントを定義
	radio_options = ["ブレイクタイム有", "ブレイクタイム無"]
	radio_button = gr.Radio(choices=radio_options, label="選択してください",value="ブレイクタイム有")
	with gr.Row():
	file_input = gr.File(label="CSVファイルをアップロード")
	submit_button = gr.Button("音声ファイルを生成")
	file_output = gr.File(label="ダウンロード")
	submit_button.click(fn=text_to_speech, inputs=[file_input,radio_button], outputs=[file_output])
	with gr.Tab("中間マスタ生成（意味理解）"):
	with gr.Column():
	with gr.Row():
	file_input = gr.File(label="CSVアップロード")
	submit_button = gr.Button("ファイルコンバート")
	file_output = gr.File(label="ファイルをダウンロード")
	submit_button.click(fn=convert_chukan_fmt_1, inputs=[file_input], outputs=[file_output])
	with gr.Tab("中間マスタ生成（音声知覚）"):
	with gr.Column():
	with gr.Row():
	file_input = gr.File(label="CSVアップロード")
	submit_button = gr.Button("ファイルコンバート")
	file_output = gr.File(label="ファイルをダウンロード")
	submit_button.click(fn=convert_chukan_fmt_2, inputs=[file_input], outputs=[file_output])
	with gr.Tab("最終マスタ生成"):
	with gr.Column():
	file_input = gr.File(label="CSVアップロード")
	with gr.Row():
	submit_button_1 = gr.Button("問題マスタ生成")
	file_output_1 = gr.File(label="ファイルをダウンロード")
	submit_button_1.click(fn=convert_last_fmt_question, inputs=[file_input], outputs=[file_output_1])
	with gr.Row():
	submit_button_2 = gr.Button("選択肢マスタ生成")
	file_output_2 = gr.File(label="ファイルをダウンロード")
	submit_button_2.click(fn=convert_last_fmt_selection, inputs=[file_input], outputs=[file_output_2])
	with gr.Row():
	submit_button_3 = gr.Button("正解選択肢マスタ生成")
	file_output_3 = gr.File(label="ファイルをダウンロード")
	submit_button_3.click(fn=convert_last_fmt_correct, inputs=[file_input], outputs=[file_output_3])
	with gr.Tab("カテゴリ分類"):
	with gr.Column():
	input_text_kousei = gr.Textbox(label="分類観点を入力してください。",value="xxxxxxxに関する内容の場合は「該当あり」と書いてください。")
	with gr.Row():
	inputs=gr.File(label="CSVファイルをアップロード")
	outputs=gr.File(label="ダウンロード", file_count="singular")
	gr.Button("分類スタート").click(
	check,
	inputs=[inputs,input_text_kousei],
	outputs=[outputs]
	)

	demo.launch(share=True)