2026-05-20 【AI面试八股文 Vol.3.1:Transformer 核... AI 面试八股文Attention 计算流程KV Cache 显存MHA MQA GQA 对比RoPE 位置编码TransformerTransformer 核心结构Vol.3.1 AI工程 面试八股 摘要:这篇是 AI 应用工程师八股文系列的合并深讲稿,目标约 12000 字。它围绕 Transformer、Self-Attentio...