标记为: Andrej Karpathy

Content related to Andrej Karpathy

Karpathy 的 LLM 编码规则:思考、简化与迭代

January 29, 2026

发现安德烈·卡尔帕提(Andrej Karpathy)为使用 Claude LLM 编码而设的四原则指南。了解如何在编码前先思考、避免过度工程、实施精准修改、执行目标驱动循环。文章深入阐述每项原则,提供实用安装说明,并展示如何将规则添加到自己的项目中,以实现更干净、更可靠的代码。适合想在保持可维护性与清晰度的同时,充分利用 LLM 的开发者。

自己动手打造你的专属ChatGPT:Nanochat—百元级LLM

October 21, 2025

探索Andre_j Karpathy的开源项目Nanochat,这是一个ChatGPT类大型语言模型的全栈实现。了解如何在预算有限的情况下训练、微调并运行您自己的大型语言模型,计算成本低至100美元。这个精简、易于修改的代码库旨在提高可访问性,让爱好者能够从零开始体验大型语言模型开发。深入微模型的世界,了解从词元化到网络服务的所有过程,所有这些都包含在一个统一的项目中。通过实用的脚本亲身体验,深入了解训练您自己的人工智能助手的成本和复杂性。

安德烈·卡帕西的《神经网络:新手到专家》

July 23, 2025

想深入了解神经网络的基础原理吗?强烈推荐 Andrej Karpathy 的“Neural Networks: Zero to Hero” GitHub 仓库。这个内容详实的开源项目,将带您从基础概念一步步探索到 Transformer 等先进架构。通过一系列 YouTube 视频讲解和配套的 Jupyter Notebook,您将学会构建 micrograd、makemore 和 GPT 等核心组件。无论您是初学者,还是想加深理解,这个资源都能提供宝贵的实践编码经验,并清晰解释反向传播、语言模型等概念。这是任何希望从零开始掌握深度学习的人的宝贵指南。