标记为的帖子: LLM Fine-tuning

Content related to LLM Fine-tuning

LLaMA-Factory：百余种大语言模型与视觉语言模型的统一微调

June 27, 2025

标签:

AI Tools Open Source AI Machine Learning LLM Fine-tuning Large Language Models

大型语言模型的微调可能是一项复杂且资源密集型的工作。LLaMA-Factory的出现颠覆了现状，它提供了一个统一且高效的平台，用于微调超过100种大型语言模型（LLMs）和视觉语言模型（VLMs）。这个在ACL 2024大会上获得认可的开源项目，凭借其零代码命令行界面和直观的Web UI，简化了复杂的AI开发工作流程。LLaMA-Factory受到亚马逊和NVIDIA等行业巨头的信赖，它助力开发者和研究人员运用QLoRA和FlashAttention-2等先进技术，提升模型在从多轮对话到多模态理解等各种任务中的性能。探索这个强大的工具如何加速您的AI项目。

阅读更多原始

实用开源项目

Unsloth：大幅加速大语言模型微调并节省显存

June 27, 2025

标签:

Open Source AI Machine Learning LLM Fine-tuning GPU Optimization Large Language Models

隆重推出 Unsloth，这一开源库正在彻底革新大语言模型（LLM）的微调方式。相比传统方法，Unsloth 能让训练速度提升高达2倍，并将 GPU 显存消耗最高减少80%。Unsloth 支持 Llama、Qwen、Gemma、Mistral 等多种模型，同时还支持文本到语音和视觉模型。凭借其用户友好的设计，Unsloth 允许使用者通过对初学者友好的 Jupyter Notebooks 进行免费微调，即使在有限的硬件条件下也能实现高效训练。立即体验 Unsloth 的强大特性与卓越性能，开启高效的大语言模型开发之旅吧！

阅读更多原始

分类

标记为的帖子: LLM Fine-tuning

LLaMA-Factory：百余种大语言模型与视觉语言模型的统一微调

Unsloth：大幅加速大语言模型微调并节省显存