标记为: LLM Fine-tuning

Content related to LLM Fine-tuning

LLaMA-Factory:百余种大语言模型与视觉语言模型的统一微调

June 27, 2025

大型语言模型的微调可能是一项复杂且资源密集型的工作。LLaMA-Factory的出现颠覆了现状,它提供了一个统一且高效的平台,用于微调超过100种大型语言模型(LLMs)和视觉语言模型(VLMs)。这个在ACL 2024大会上获得认可的开源项目,凭借其零代码命令行界面和直观的Web UI,简化了复杂的AI开发工作流程。LLaMA-Factory受到亚马逊和NVIDIA等行业巨头的信赖,它助力开发者和研究人员运用QLoRA和FlashAttention-2等先进技术,提升模型在从多轮对话到多模态理解等各种任务中的性能。探索这个强大的工具如何加速您的AI项目。

Unsloth:大幅加速大语言模型微调并节省显存

June 27, 2025

隆重推出 Unsloth,这一开源库正在彻底革新大语言模型(LLM)的微调方式。相比传统方法,Unsloth 能让训练速度提升高达2倍,并将 GPU 显存消耗最高减少80%。Unsloth 支持 Llama、Qwen、Gemma、Mistral 等多种模型,同时还支持文本到语音和视觉模型。凭借其用户友好的设计,Unsloth 允许使用者通过对初学者友好的 Jupyter Notebooks 进行免费微调,即使在有限的硬件条件下也能实现高效训练。立即体验 Unsloth 的强大特性与卓越性能,开启高效的大语言模型开发之旅吧!