Day 04 · CUDA 编程入门 (1)从 Host 到 Device:理解 kernel 启动、Grid/Block/Thread 线程层级与 Global/Shared Memory 存储模型,动手实现 vector add 与 naive GEMM。