摘要:用一条工程主线讲清 LLM 从预训练、SFT、RLHF/DPO/KTO 对齐,到 LoRA/Adapter/P-tuning/IA...