标记为: ML Optimization
Content related to ML Optimization
在 Apple Neural Engine 上训练 Transformer - ANE GitHub
March 03, 2026
发现 ANE Training:一个开创性的开源项目,通过逆向工程 Apple Neural Engine,直接在 M4 硬件上运行完整 Transformer 训练(前向 + 反向传播)。实现 9.3ms/步和 1.78 TFLOPS 持续性能,使用纯 ANE 计算——无 Metal,无 GPU。包含详细基准测试、MIL 程序生成、IOSurface 优化和通道优先布局。完美适用于推动硬件边界的 Apple Silicon ML 研究人员。