info
这是Andrej Karpathy讲授的一门课程,内容是从头开始用代码构建神经网络。
我们将从反向传播的基础知识开始,逐步构建现代深度神经网络,如GPT。在我看来,即使你的目标是最终进入其他领域(如计算机视觉),语言模型也是学习深度学习的绝佳起点,因为你学到的大部分知识都是可以直接转移的。这就是为什么我们深入研究并专注于语言模型。
这是Andrej Karpathy讲授的一门课程,内容是从头开始用代码构建神经网络。
我们将从反向传播的基础知识开始,逐步构建现代深度神经网络,如GPT。在我看来,即使你的目标是最终进入其他领域(如计算机视觉),语言模型也是学习深度学习的绝佳起点,因为你学到的大部分知识都是可以直接转移的。这就是为什么我们深入研究并专注于语言模型。