标记为: Andrej Karpathy
Content related to Andrej Karpathy
自己动手打造你的专属ChatGPT:Nanochat—百元级LLM
October 21, 2025
探索Andre_j Karpathy的开源项目Nanochat,这是一个ChatGPT类大型语言模型的全栈实现。了解如何在预算有限的情况下训练、微调并运行您自己的大型语言模型,计算成本低至100美元。这个精简、易于修改的代码库旨在提高可访问性,让爱好者能够从零开始体验大型语言模型开发。深入微模型的世界,了解从词元化到网络服务的所有过程,所有这些都包含在一个统一的项目中。通过实用的脚本亲身体验,深入了解训练您自己的人工智能助手的成本和复杂性。
安德烈·卡帕西的《神经网络:新手到专家》
July 23, 2025
想深入了解神经网络的基础原理吗?强烈推荐 Andrej Karpathy 的“Neural Networks: Zero to Hero” GitHub 仓库。这个内容详实的开源项目,将带您从基础概念一步步探索到 Transformer 等先进架构。通过一系列 YouTube 视频讲解和配套的 Jupyter Notebook,您将学会构建 micrograd、makemore 和 GPT 等核心组件。无论您是初学者,还是想加深理解,这个资源都能提供宝贵的实践编码经验,并清晰解释反向传播、语言模型等概念。这是任何希望从零开始掌握深度学习的人的宝贵指南。