Jeremy Kun的《A Programmer's Introduction to Mathematics》成了我的主力教材。这本书最大的特点是用代码重构数学公式——对于看到公式就头疼的工程师来说,这种方式简直是救星。我会重点学习多项式、集合、图论、微积分、线性代数、特征值与特征向量、多元微积分与优化,以及群论等章节。
在书籍方面,CTO送了我Goodfellow等人的《Deep Learning》实体书。这本经典教材更像工具书,需要时翻阅。另一本是Marvin Minsky的《Society of Mind》,虽然与当前学习不直接相关,但在这个AI Agent时代,重温先驱的思想或许能带来意外启发。
视频课程我选择了几条经典路线:3Blue1Brown的神经网络系列用可视化打通直觉;Andrej Karpathy的《Neural Networks: Zero to Hero》从零开始构建;Michael Nielsen的《Neural Networks and Deep Learning》教授不会过时的基础原理;Fast.ai的《Practical Deep Learning》注重实战;MIT的《Robotic Manipulation》和Hugging Face的机器人课程则直指应用场景。
论文阅读是重中之重。从改变一切的《Attention Is All You Need》,到将Transformer应用于视觉的ViT,再到扩散模型背后的数学原理DDPM。在面试Yaak时,我精读的第一篇论文是Physical Intelligence的π₀论文——一个视觉-语言-行动流模型。这是我人生中读的第一篇学术论文,写得异常清晰。