Turing-test-web-en

Sleeping

App Files Files Community

intersteller2887 commited on Jul 8

Commit

0fdadfb

verified ·

1 Parent(s): 78a0ab9

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -47

app.py CHANGED Viewed

@@ -38,77 +38,49 @@ DIMENSIONS_DATA = [
     {
         "title": "语义和语用特征",
         "audio": sample1_audio_path,
-        "desc": "这是“语义和语用特征”维度的文本描述示例。",
         "sub_dims": [
             "记忆一致性：回应者是否能够正确并正确并延续并记忆并延续对话信息？是否存在对上下文的误解或不自洽？", "逻辑连贯性：回应者在语义与对话结构上保持前后一致、合乎逻辑？是否存在前后矛盾的情况？",
             "常见多音字处理：是否能再上下文中正确使用常见多音字？", "多语言混杂：是否存在自然的语言切换现象？如中英混杂、文化化表达。",
             "语言不精确性：是否出现打断、自纠正等人类似语言行为？是否存在如“差不多”、“可能吧”这类表达不确定性的用法？", "填充词使用：如“呃”、“嗯”等自然语流中的停顿或过渡词，使用是否得体且自然？",
             "隐喻与语用用意：是否展现出复杂的语用功能（如讽刺、劝阻、暗示等），以及对活在含义层次的理解能力？"
         ],
-        "reference":"""
-                        <p>🔴 <strong>记忆一致性：</strong> 在说话人明确提出自己已经中年后，回应者仍做出了他是青少年的错误假定</p>
-                        <p>🔴 <strong>逻辑连贯性：</strong> 回应者在第一轮对话中说他说的话并不重要，但在第二轮对话中说他说的话“能够改变你的一生”</p>
-                        <p>🔴 <strong>常见多音字处理：</strong> 该条对话中未出现多音字</p>
-                        <p>🟢 <strong>多语言混杂：</strong> 回应者在回复中夹杂了"I see"，回复中存在多语言混杂</p>
-                        <p>🔴 <strong>语言不精确性：</strong> 回应者使用的语言中未夹杂任何的不确定性</p>
-                        <p>🟢 <strong>填充词使用：</strong> 回应者在回复中使用了“嗯”这个填充词</p>
-                        <p>🔴 <strong>隐喻与语用用意：</strong> 回应者误将说话人的挖苦当成了真心的赞扬</p>
-                        """
     },
     {
         "title": "非生理性副语言特征",
         "audio": sample1_audio_path,
-        "desc": "这是“非生理性副语言特征”维度的文本描述示例。",
         "sub_dims": [
             "节奏：回应者是否存在自然的停顿？语速是否存在自然、流畅的变化？", "语调：在表达疑问、惊讶、强调时，回应者的音调是否会自然上扬或下降？是否表现出符合语境的变化？",
             "重读：是否存在句中关键词上有意识地加重语气？", "辅助性发声：是否存在叹气、短哼、笑声等辅助情绪的非语言性发声？这些发声是否在语境中正确表达了情绪或意图？"
         ],
-        "reference": """
-                        <p>🟢 <strong>节奏：</strong> 回应者的语速变化、停顿都较为自然</p>
-                        <p>🔴 <strong>语调：</strong> 回应者的音调不存在显著变化</p>
-                        <p>🔴 <strong>重读：</strong> 回应者语气不存在显著变化</p>
-                        <p>🔴 <strong>辅助性发声：</strong> 尽管回应者发出了叹气的声音，但是该发声并未传递出语境下应有的失落情堵</p>
-                        """
     },
     {
         "title": "生理性副语言特征",
         "audio": sample1_audio_path,
-        "desc": "这是“生理性副语言特征”维度的文本描述示例。",
         "sub_dims": [
             "微生理杂音：回应中是否出现如呼吸声、口水音、气泡音等无意识发声？这些发声是否自然地穿插在恰当的语流节奏当中？",
             "发音不稳定性：回应者是否出现连读、颤音、鼻音等不稳定发音？", "口音：（如果存在的话）回应者的口音是否自然？是否存在机械式的元辅音发音风格？"
         ],
-        "reference": """
-                        <p>🔴 <strong>微生理杂音：</strong> 回应中不存在任何无意识发声</p>
-                        <p>🔴 <strong>发音不稳定性：</strong> 回应者的咬字清晰、发音标准</p>
-                        <p>🟢 <strong>口音：</strong> 回应者的口音自然</p>
-                        """
     },
     {
         "title": "机械人格",
         "audio": sample1_audio_path,
-        "desc": "这是“机械人格”维度的文本描述示例。",
         "sub_dims": [
             "谄媚现象：回应者是否频繁地赞同用户、重复用户的说法、不断表示感谢或道歉？是否存在“无论用户说什么都肯定或支持”的语气模式？",
             "书面化表达：回应的内容是否缺乏口���化特征？句式是否整齐划一、结构完整却缺乏真实交流中的松散感或灵活性？是否使用抽象或泛泛的措辞来回避具体问题？"
         ],
-        "reference": """
-                        <p>🟢 <strong>谄媚现象：</strong> 回应者并未明显表现出谄媚现象的特征</p>
-                        <p>🔴 <strong>书面化表达：</strong> 回应的内容结构过于缜密，符合书面用语特征</p>
-                        """
     },
     {
         "title": "情感表达",
         "audio": sample1_audio_path,
-        "desc": "这是“情感表达”维度的文本描述示例。",
         "sub_dims": [
             "语义层面：回应者的语言内容是否体现出符合上下文的情绪反应？是否表达了人类对某些情境应有的情感态度？",
             "声学层面：回应者的声音情绪是否与语义一致？语调是否有自然的高低起伏来表达情绪变化？是否出现回应内容与声音传达出的情绪不吻合的现象？"
         ],
-        "reference": """
-                        <p>🔴 <strong>语义层面：</strong> 说话者阐述了一件伤心的事情，而回应者的语言内容中体现出了恰当的悲伤情绪</p>
-                        <p>🟢 <strong>声学层面：</strong> 回应者的语音特征与情感表达不匹配。语言内容中表达出了悲伤的情感，但语音特征平淡、缺少变化</p>
-                        """
     }
 ]
@@ -202,16 +174,27 @@ def show_sample_page_and_init(age, gender, education, education_other, user_data
 def update_sample_view(dimension_title):
     dim_data = next((d for d in DIMENSIONS_DATA if d["title"] == dimension_title), None)
     if dim_data:
-        audio_update = gr.update(value=dim_data["audio"])
-        slider_updates = []
         for i in range(MAX_SUB_DIMS):
             if i < len(dim_data['sub_dims']):
-                slider_updates.append(gr.update(visible=True, label=dim_data['sub_dims'][i], value=0))
             else:
-                slider_updates.append(gr.update(visible=False, value=0))
-        return [audio_update] + slider_updates
-    return [gr.update()] + [gr.update()] * MAX_SUB_DIMS
 def update_test_dimension_view(d_idx, selections):
     dimension = DIMENSIONS_DATA[d_idx]
@@ -465,16 +448,21 @@ with gr.Blocks(theme=gr.themes.Soft(), css=".gradio-container {max-width: 960px
         education_other_input = gr.Textbox(label="请填写你的学历", visible=False, interactive=False)
         submit_info_btn = gr.Button("提交并开始学习样例", variant="primary", interactive=False)
-    with sample_page:
-        gr.Markdown("## 样例分析\n请选择一个维度进行学习和打分练习。所有维度共用同一个样例音频。")
         sample_dimension_selector = gr.Radio(DIMENSION_TITLES, label="选择学习维度", value=DIMENSION_TITLES[0])
         with gr.Row():
             with gr.Column(scale=1):
                 sample_audio = gr.Audio(label="样例音频", value=DIMENSIONS_DATA[0]["audio"])
             with gr.Column(scale=2):
-                gr.Markdown("#### 请为以下特征打分 (0-5分。0对应机器，5对应人类)")
-                sample_sliders = [gr.Slider(minimum=0, maximum=5, step=1, label=f"Sub-dim {i+1}", visible=False, interactive=True) for i in range(MAX_SUB_DIMS)]
-        go_to_pretest_btn = gr.Button("我明白了，开始测试", variant="primary")
     with pretest_page:
         gr.Markdown("## 测试说明\n"
@@ -509,7 +497,10 @@ with gr.Blocks(theme=gr.themes.Soft(), css=".gradio-container {max-width: 960px
     # ==============================================================================
     # 事件绑定 (Event Binding) & IO 列表定义
     # ==============================================================================
-    sample_init_outputs = [info_page, sample_page, user_data_state, sample_dimension_selector, sample_audio] + sample_sliders
     test_init_outputs = [
         pretest_page, test_page, final_judgment_page, result_page,
@@ -546,7 +537,13 @@ with gr.Blocks(theme=gr.themes.Soft(), css=".gradio-container {max-width: 960px
     sample_dimension_selector.change(
         fn=update_sample_view,
         inputs=sample_dimension_selector,
-        outputs=[sample_audio] + sample_sliders
     )
     go_to_pretest_btn.click(lambda: (gr.update(visible=False), gr.update(visible=True)), outputs=[sample_page, pretest_page])

     {
         "title": "语义和语用特征",
         "audio": sample1_audio_path,
         "sub_dims": [
             "记忆一致性：回应者是否能够正确并正确并延续并记忆并延续对话信息？是否存在对上下文的误解或不自洽？", "逻辑连贯性：回应者在语义与对话结构上保持前后一致、合乎逻辑？是否存在前后矛盾的情况？",
             "常见多音字处理：是否能再上下文中正确使用常见多音字？", "多语言混杂：是否存在自然的语言切换现象？如中英混杂、文化化表达。",
             "语言不精确性：是否出现打断、自纠正等人类似语言行为？是否存在如“差不多”、“可能吧”这类表达不确定性的用法？", "填充词使用：如“呃”、“嗯”等自然语流中的停顿或过渡词，使用是否得体且自然？",
             "隐喻与语用用意：是否展现出复杂的语用功能（如讽刺、劝阻、暗示等），以及对活在含义层次的理解能力？"
         ],
+        "reference_scores": [1, 1, 1, 5, 1, 5, 1]
     },
     {
         "title": "非生理性副语言特征",
         "audio": sample1_audio_path,
         "sub_dims": [
             "节奏：回应者是否存在自然的停顿？语速是否存在自然、流畅的变化？", "语调：在表达疑问、惊讶、强调时，回应者的音调是否会自然上扬或下降？是否表现出符合语境的变化？",
             "重读：是否存在句中关键词上有意识地加重语气？", "辅助性发声：是否存在叹气、短哼、笑声等辅助情绪的非语言性发声？这些发声是否在语境中正确表达了情绪或意图？"
         ],
+        "reference_scores": [5, 1, 5, 1]
     },
     {
         "title": "生理性副语言特征",
         "audio": sample1_audio_path,
         "sub_dims": [
             "微生理杂音：回应中是否出现如呼吸声、口水音、气泡音等无意识发声？这些发声是否自然地穿插在恰当的语流节奏当中？",
             "发音不稳定性：回应者是否出现连读、颤音、鼻音等不稳定发音？", "口音：（如果存在的话）回应者的口音是否自然？是否存在机械式的元辅音发音风格？"
         ],
+        "reference_scores": [1, 1, 5]
     },
     {
         "title": "机械人格",
         "audio": sample1_audio_path,
         "sub_dims": [
             "谄媚现象：回应者是否频繁地赞同用户、重复用户的说法、不断表示感谢或道歉？是否存在“无论用户说什么都肯定或支持”的语气模式？",
             "书面化表达：回应的内容是否缺乏口���化特征？句式是否整齐划一、结构完整却缺乏真实交流中的松散感或灵活性？是否使用抽象或泛泛的措辞来回避具体问题？"
         ],
+        "reference_scores": [1, 5]
     },
     {
         "title": "情感表达",
         "audio": sample1_audio_path,
         "sub_dims": [
             "语义层面：回应者的语言内容是否体现出符合上下文的情绪反应？是否表达了人类对某些情境应有的情感态度？",
             "声学层面：回应者的声音情绪是否与语义一致？语调是否有自然的高低起伏来表达情绪变化？是否出现回应内容与声音传达出的情绪不吻合的现象？"
         ],
+        "reference_scores": [5, 1]
     }
 ]
 def update_sample_view(dimension_title):
     dim_data = next((d for d in DIMENSIONS_DATA if d["title"] == dimension_title), None)
     if dim_data:
+        audio_up = gr.update(value=dim_data["audio"])
+        interactive_view_up = gr.update(visible=True)
+        reference_view_up = gr.update(visible=False)
+        reference_btn_up = gr.update(value="参考")
+        sample_slider_ups = []
+        ref_slider_ups = []
+        scores = dim_data.get("reference_scores", [])
         for i in range(MAX_SUB_DIMS):
             if i < len(dim_data['sub_dims']):
+                label = dim_data['sub_dims'][i]
+                score = scores[i] if i < len(scores) else 0
+                sample_slider_ups.append(gr.update(visible=True, label=label, value=0))
+                ref_slider_ups.append(gr.update(visible=True, label=label, value=score))
             else:
+                sample_slider_ups.append(gr.update(visible=False, value=0))
+                ref_slider_ups.append(gr.update(visible=False, value=0))
+        return [audio_up, interactive_view_up, reference_view_up, reference_btn_up] + sample_slider_ups + ref_slider_ups
+    empty_updates = [gr.update()] * 4
+    slider_empty_updates = [gr.update()] * (MAX_SUB_DIMS * 2)
+    return empty_updates + slider_empty_updates
 def update_test_dimension_view(d_idx, selections):
     dimension = DIMENSIONS_DATA[d_idx]
         education_other_input = gr.Textbox(label="请填写你的学历", visible=False, interactive=False)
         submit_info_btn = gr.Button("提交并开始学习样例", variant="primary", interactive=False)
+    gr.Markdown("## 样例分析\n请选择一个维度进行学习和打分练习。所有维度共用同一个样例音频。")
         sample_dimension_selector = gr.Radio(DIMENSION_TITLES, label="选择学习维度", value=DIMENSION_TITLES[0])
         with gr.Row():
             with gr.Column(scale=1):
                 sample_audio = gr.Audio(label="样例音频", value=DIMENSIONS_DATA[0]["audio"])
             with gr.Column(scale=2):
+                with gr.Column(visible=True) as interactive_view:
+                    gr.Markdown("#### 请为以下特征打分 (0-5分。0对应机器，5对应人类)")
+                    sample_sliders = [gr.Slider(minimum=0, maximum=5, step=1, label=f"Sub-dim {i+1}", visible=False, interactive=True) for i in range(MAX_SUB_DIMS)]
+                with gr.Column(visible=False) as reference_view:
+                    gr.Markdown("### 参考答案解析 (0-5分。0对应机器，5对应人类)")
+                    reference_sliders = [gr.Slider(minimum=0, maximum=5, step=1, label=f"Sub-dim {i+1}", visible=False, interactive=False) for i in range(MAX_SUB_DIMS)]
+        with gr.Row():
+            reference_btn = gr.Button("参考")
+            go_to_pretest_btn = gr.Button("我明白了，开始测试", variant="primary")
     with pretest_page:
         gr.Markdown("## 测试说明\n"
     # ==============================================================================
     # 事件绑定 (Event Binding) & IO 列表定义
     # ==============================================================================
+    sample_init_outputs = [
+        info_page, sample_page, user_data_state, sample_dimension_selector,
+        sample_audio, interactive_view, reference_view, reference_btn
+    ] + sample_sliders + reference_sliders
     test_init_outputs = [
         pretest_page, test_page, final_judgment_page, result_page,
     sample_dimension_selector.change(
         fn=update_sample_view,
         inputs=sample_dimension_selector,
+        outputs=[sample_audio, interactive_view, reference_view, reference_btn] + sample_sliders + reference_sliders
+    )
+    reference_btn.click(
+        fn=toggle_reference_view,
+        inputs=reference_btn,
+        outputs=[interactive_view, reference_view, reference_btn]
     )
     go_to_pretest_btn.click(lambda: (gr.update(visible=False), gr.update(visible=True)), outputs=[sample_page, pretest_page])