面试官问“既然模型已经能塞 100 万 Token,为什么不直接做到 1000 万?”如果你只回答“算力不够”,后面很快会被追问到 KV...