Day 03 · GPU 硬件与体系结构拆解 GPU 微架构:从 SM、Warp 调度到 Tensor Core,理解 HBM-L2-SMEM 存储层级与算术强度,对比 A100/H100/H20 代际演进。