qiuhuachuan
/

MeChat

@@ -1,24 +1,48 @@
 # 中文心理健康支持对话数据集(SmileChat)与大模型(MeChat)
-## 体验地址：http://47.97.220.53:8080/
-<img src="https://img.shields.io/badge/Version-1.0-brightgreen" /> <img src="https://img.shields.io/badge/python-3.8+-blue.svg" /> <a href='https://github.com/qiuhuachuan/smile/blob/main/paper/SMILE_Single_turn_to_Multi_turn_Inclusive_Language_Expansion_via_ChatGPT_for_Mental_Health_Support.pdf'><img src='https://img.shields.io/badge/ArXiv-2305.00450-red'></a>
 ## 项目简介
-**For more details, see our paper:** [smile paper](https://github.com/qiuhuachuan/smile/blob/main/paper/SMILE_Single_turn_to_Multi_turn_Inclusive_Language_Expansion_via_ChatGPT_for_Mental_Health_Support.pdf 'smile paper')
-🎉🎉🎉 **Here, we present an enhanced (high-quality) version of our SmileChat dataset.**
-**MeChat** (**Me**ntal Health Support **Chat**bot)
-我们的愿景是为让所有人在遇到心理健康问题时能够获得及时、有效的倾听和支持。我们相信，心理健康是每个人的权利，而不是奢侈品。我们的使命是**为人们提供平等、全面、易于访问的心理健康服务**，无论他们身在何处、面临何种挑战。我们的愿景还包括推动社会对心理健康问题的认识和理解，**打破心理健康问题带来的污名和歧视**，为创建一个更加健康、包容和平等的社会做出贡献。
-**数据集说明**：数据集通过 ChatGPT 改写真实的心理互助 QA 为多轮的心理健康支持多轮对话（single-turn to multi-turn inclusive language expansion via ChatGPT），该数据集**SmileChat**含有 **55,165k** 个多轮对话，其对话主题、词汇和篇章语义更加丰富多样，更加符合在长程多轮对话的应用场景。数据目录说明如下：
-本项目开源的**中文心理健康支持模型**由 ChatGLM2-6B LoRA 指令微调得到。数据集通过扩展**真实的心理互助 QA**为多轮的心理健康支持多轮对话，提高了通用语言大模型**在心理健康支持领域的表现**，更加符合在长程多轮对话的应用场景。
-> 作为一款心理健康支持对话陪伴机器人，我能够和你聊天，提供情感支持和心理疏导。
 ## SMILE 方法
@@ -178,4 +202,4 @@ convert_to_training_set.py
 6. 平台收集的数据用于学术研究。
-最后，我们保留随时修改、更新、暂停或终止机器人服务的权利，同时也保留对本免责声明进行修改、更新或补充的权利。如果用户继续使用机器人服务，即视为同意本免责声明的全部内容和条款。

+---
+license: mit
+language:
+- zh
+metrics:
+- bleu
+- rouge
+- meteor
+- perplexity
+pipeline_tag: text-generation
+tags:
+- mental health
+---
 # 中文心理健康支持对话数据集(SmileChat)与大模型(MeChat)
+<div style='display: flex; flex-direction: row'>
+  <img src="https://img.shields.io/badge/Version-1.0-brightgreen" style='margin-left: 10px;' />
+  <img src="https://img.shields.io/badge/python-3.8+-blue.svg" style='margin-left: 10px;' />
+  <a href='https://arxiv.org/pdf/2305.00450.pdf' style='margin-left: 10px;'><img src='https://img.shields.io/badge/ArXiv-2305.00450-red'></a>
+</div>
 ## 项目简介
+**For more details, see our paper:** [smile paper](https://arxiv.org/pdf/2305.00450.pdf 'smile paper')
+🎉🎉🎉 **MeChat** (**Me**ntal Health Support **Chat**bot)
+**背景**：我们都知道心理健康的重要性以及心理健康问题一直是我们关注的焦点。开发用于心理健康支持的专业化对话系统引起了学术界的巨大关注。
+**动机**：事实上，建立一个实用、安全、有效的心理健康对话智能体是许多研究人员一直追求的目标。然而，创建这样一个系统的第一步就是要有训练数据。
+**挑战**：收集并发布这一类高质量的、真实的大规模数据来促进这一领域的发展面对诸多挑战。首先是数据隐私保护的问题、其次是收集数据所耗费的大量时间与各种成本（平台搭建、真实的受试者与专业的支持者的招聘、筛选、管理等）。
+**研究意义**：由大语言模型驱动的虚拟咨询师，作为一种用于心理健康的创新解决思路，可以有效地解决获得性障碍，如高昂的治疗费用、训练有素的专业人员的短缺。此外，该对话系统可以为有需要的人提供有效且实用的在线咨询，能够保护用户隐私，减轻在求助过程中的耻感。
+**方法**：我们提出了SMILE  (Single-turn to Multi-turn Inclusive Language Expansion)，一种单轮对话到多轮对话的包容性语言扩展技术。具体来说，利用ChatGPT将单轮长对话转换为多轮对话，更好地模拟了真实世界中求助者与支持者之间的多轮对话交流。
+**结果**：我们首先对语言转换进行分析，相比其他基线方法，验证了我们提出方法的可行性。其次，我们完成了对话多样性的研究，包括词汇特征、语义特征和对话主题，阐明我们所提方法的有效性。再者，我们通过专家评估，证明了所提方法生成数据的质量高于其他基线方法。因此，我们利用此方法进行大规模数据生成，构建了一个约55k的多轮对话数据集。最后，为了更好的评估该数据集的质量，我们利用此数据集训练了一个用于心理健康支持的聊天机器人。在真实数据集的自动化评估和人类与对话系统的交互评估，结果均表明对话系统在心理健康支持能力得到显著提升，进一步证实所生成的数据集具备高质量和实用性的特性。
+**未来展望**：利用生成的数据来训练模型，并用于心理健康支持是一个不错的选择。但我们注意到，现有生成数据的对话轮数较短，与真实咨询数据的策略分布上存在一定的差距。因此，秉持让用户受益的原则，需要重点关注模��安全性能，包括自杀干预、敏感信息应对和避免错误信息等，我们任重道远。
+本项目开源的**中文心理健康支持模型**由 ChatGLM2-6B LoRA 指令微调得到。数据集通过扩展真实的心理互助 QA为多轮的心理健康支持多轮对话，提高了通用语言大模型**在心理健康支持领域能力的表现**，更加符合在长程多轮对话的应用场景。
 ## SMILE 方法
 6. 平台收集的数据用于学术研究。
+最后，我们保留随时修改、更新、暂停或终止机器人服务的权利，同时也保留对本免责声明进行修改、更新或补充的权利。如果用户继续使用机器人服务，即视为同意本免责声明的全部内容和条款。