2026-05-20 【AI面试八股文 Vol.3.2:LLM 工作流程】从 BP... BPE 分词EmbeddingKV CacheLLMLLM 推理链路TemperatureToken 采样Vol.3.2 AI工程 面试八股 摘要:LLM 推理不是把文本扔进去等结果出来就结束了。从输入文本到 token 输出,中间经历了 BPE 分词、embedding 投影...