2026-05-31 【AI面试八股文 Vol.3.6:长上下文】为什么大模型还停... CacheInKVLostTokenVol.3.6bagurational_depth AI工程 面试八股 面试官问“既然模型已经能塞 100 万 Token,为什么不直接做到 1000 万?”如果你只回答“算力不够”,后面很快会被追问到 KV...