| Name | Modified | Size | Downloads / Week |
|---|---|---|---|
| Parent folder | |||
| README.md | 2025-02-16 | 276 Bytes | |
| v2.4.0 source code.tar.gz | 2025-02-16 | 9.0 MB | |
| v2.4.0 source code.zip | 2025-02-16 | 9.0 MB | |
| Totals: 3 Items | 18.0 MB | 2 | |
v2.4.0
- 新增GRPO训练方法,GRPO通过纯RL方法可以体验
aha moment,https://github.com/shibing624/MedicalGPT/blob/main/run_grpo.sh - 支持了 DeepSeek-V3, DeepSeek-R1 模型, template_name=deepseek3