张 SoulChat2.0:心理咨询师优化:提示词优化;构建数据集微调LLM
张 SoulChat2.0:心理咨询师优化:提示词优化;构建数据集微调LLM
是一个关于心理咨询师数字孪生大语言模型的项目,旨在解决过往心理健康大语言模型未充分考虑心理咨询师个人风格以及多轮对话数据混合微调导致回复不稳定的问题。
项目概述
自2023年5月发布 SoulChat
后,团队深入探索真实世界心理咨询语言风格和疗法技术,显著提升了心理咨询师数字孪生建模能力。针对现有工作的不足,华南理工大学未来技术学院 - 广东省数字孪生人重点实验室在灵心大模型(SoulChat1.0
)基础上推出了 SoulChat2.0
。
数据构造与模型建立 PsyDTCorpus
- 心理咨询师数字孪生数据生成
- 由于获取心理咨询师大量咨询案例难度大,团队建立了仅需少量咨询案例的数据生成框架。
- 借助先进LLMs的语言总结能力提取咨询师语言风格和咨询技术,以大五人格为参考对来访者进行分析,综合生成多轮对话数据。
- 设定单轮对话咨询数据库规模为5000个,特定心理咨询师咨询案例数目为12个(一般不多于2