LLaMA-Factory:百余种大语言模型与视觉语言模型的统一微调
LLaMA-Factory:统一微调百余种大型语言模型和视觉语言模型
大型语言模型 (LLM) 和视觉语言模型 (VLM) 的格局正以史无前例的速度发展。随着这些模型在复杂性和能力上的不断提升,对高效、易用的微调解决方案的需求变得至关重要。正是在此背景下,LLaMA-Factory 应运而生,这个备受赞誉的开源项目正在重新定义开发者和研究人员进行模型定制的方式。
LLaMA-Factory 是什么?
LLaMA-Factory 是一个全面、统一的微调框架,旨在简化对100余种不同 LLM 和 VLM 的适配过程。作为一篇 ACL 2024 论文发布,并在 GitHub 上获得了超过53,000颗星,它提供了一个强大的工具集,可高效地针对特定任务或数据集对预训练模型进行塑形。其核心优势在于抽象了底层大部分复杂性,提供了零代码命令行界面 (CLI) 和由 Gradio 驱动的直观 Web 用户界面 (Web UI) LlamaBoard。
核心特性与优势
LLaMA-Factory 凭借其为多样化 AI 开发需求量身定制的丰富特性而脱颖而出:
-
广泛的模型支持:该平台支持各种流行的模型,包括 LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Gemma、ChatGLM、Phi 等等。这种广泛的兼容性确保用户可以使用他们首选或最适合的模型。
-
统一的训练方法:从持续预训练和监督微调 (SFT),到 PPO、DPO、KTO 和 ORPO 等先进的人类反馈强化学习 (RLHF) 方法,LLaMA-Factory 集成了多种训练范式。这种灵活性实现了深度定制和性能优化。
-
高效的资源扩展:通过16位全量微调、冻结微调以及 LoRA 和通过 AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ 等实现的各种2/3/4/5/6/8位 QLoRA 优化等参数高效微调 (PEFT) 方法,解决内存和计算限制。这使得即使在配置相对较低的硬件上也能对大型模型进行微调。
-
先进算法与实用技巧:该框架集成了 GaLore、BAdam、APOLLO、DoRA、LongLoRA 和 PiSSA 等前沿算法,以及 FlashAttention-2、Unsloth、Liger Kernel 和 NEFTune 等实用优化技术,确保一流的性能和效率。
-
多功能任务处理:LLaMA-Factory 不仅仅局限于简单的文本生成。它支持广泛的任务类型,包括多轮对话、工具调用、图像理解、视觉定位和音频识别,是多模态 AI 应用的理想选择。
-
用户友好的界面:无论您偏爱脚本操作还是图形界面,LLaMA-Factory 都能满足您的需求。
llamafactory-cli
提供了强大的终端命令,而由 Gradio 驱动的 Web UI 则为训练、评估和推理提供了直观、交互式的体验。 -
加速推理:通过集成 vLLM 或 SGLang 推理引擎,您可以轻松部署微调模型,并通过 OpenAI 风格的 API 和 Gradio 界面实现更快、并发性更高的推理。
-
全面的实验监控:通过对 LlamaBoard、TensorBoard、Wandb、MLflow 和 SwanLab 等流行监控工具的支持,您可以密切跟踪您的实验。
-
行业验证:亚马逊、英伟达和阿里云等主要参与者的采用,充分证明了 LLaMA-Factory 在实际应用中的可靠性和实用价值。
LLaMA-Factory 入门
LLaMA-Factory 的安装和配置非常简单。用户可以直接从源代码安装,利用预构建的 Docker 镜像进行快速部署,甚至可以在 Google Colab 和 PAI-DSW 等免费云环境中运行。该项目提供了清晰的文档和快速入门指南,演示了如何通过几条命令进行 LoRA 微调、推理和模型合并。
llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml
llamafactory-cli chat examples/inference/llama3_lora_sft.yaml
llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml
对于偏好图形界面 (GUI) 的用户,只需运行 llamafactory-cli webui
即可启动直观的 LLaMA Board。
总结
LLaMA-Factory 通过普及对复杂大型模型微调的访问权限,赋能了整个 AI 社区。其融合了全面的功能、用户友好的设计和强大的性能,使其成为任何希望释放 LLM 和 VLM 全部潜力的用户不可或缺的工具。无论您是经验丰富的 AI 从业者还是初学者,LLaMA-Factory 都提供了一条强大、高效且易于掌握的途径,助您构建定制化的高性能 AI 模型。