|
|
|
线上微调大模型不想折腾环境配置、参数选型、代码编写?推荐大家试试 unsloth-buddy 这个零门槛的 LLM 微调技能工具。
它支持 NVIDIA CUDA GPU 上的 Unsloth 和苹果 Apple Silicon 上的 mlx-tune,本地一站式自动完成环境搭建、LoRA微调(SFT、DPO、GRPO、视觉模型均支持)、效果评测和模型导出。
主要特点:
- 7步自动化工作流,包含任务调研、数据处理、环境检测、训练、评测、导出;
- 智能访谈定制方案,帮你选对模型、训练方法和部署平台;
- 支持 Qwen、Llama、Gemma 等主流模型,适配 Ollama、vLLM、HF Hub 等部署;
- 苹果 M1~M4 机型友好,甚至能通过 Google Colab 免费云GPU扩展能力;
- 可视化实时培训仪表盘,训练曲线一目了然;
- 完整开源,MIT协议。
不管你是有500条客服问答想做摘要微调,还是复杂多维度调参探索,unsloth-buddy都能带来极致顺滑体验。
GitHub:github.com/TYH-labs/unsloth-buddy
# |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|