| Name | Modified | Size | Downloads / Week |
|---|---|---|---|
| Parent folder | |||
| README.md | 2024-08-02 | 1.6 kB | |
| v2.2.0 source code.tar.gz | 2024-08-02 | 9.0 MB | |
| v2.2.0 source code.zip | 2024-08-02 | 9.0 MB | |
| Totals: 3 Items | 18.0 MB | 0 | |
v2.2.0
- 支持了角色扮演模型训练
- 新增了医患对话SFT数据生成脚本role_play_data
造角色扮演对话
本数据集使用OpenAI API接口生成,流程:
- 种子特征集和基础设定:
- 手工编写的种子集包含基本角色特征。
- LLM从这个种子集生成角色的基础设定。
- 角色设定的进化:
- 第二个种子集包含指导角色设定进化的指令Prompt。
- 这些进化角色的指令Prompt被放到一个指令池中。基于这些进化Prompt,LLM对基础设定实施进化。
- 反馈循环:
- 由人类评估者和GPT-4组成的混合评价系统。此系统对进化后的设定给出反馈。
- 反馈用于迭代更新种子集。如此迭代,我们最终得到一个细致的角色设定数据集。
- 角色扮演和对话生成:
-
使用self-instruction框架基于角色设定生成角色的对话数据。
-
生成角色设定,分别生成护士角色和患者角色
:::bash cd role_play_data
python role_generate.py
-
生成医患之间的多轮对话 LLM选择:分别用gpt-4o的api和豆包的doubao-character-pro-32k的api生成对话
:::bash python roleplay_data_generate_gpt4.py
What's Changed
- add full_train.py and run_full_train.sh by @ZhuangXialie in https://github.com/shibing624/MedicalGPT/pull/394
Full Changelog: https://github.com/shibing624/MedicalGPT/compare/2.1.0...2.2.0