类型:
通用指令跟随(聊天、问答、总结):首选 Qwen2.5(中文强、综合能力均衡)、Llama 3(英文强、推理好)或 DeepSeek-V2(性价比高)。
代码生成与理解:首选 DeepSeek-Coder 系列(在代码数据上预训练过,填空和补全能力很强),或 CodeLlama。
数学与逻辑推理:首选 DeepSeek-Math(基座已强化推理能力,微调后效果更好)或 Qwen2.5-Math。
用途:
个人开发者、单卡RTX 4090、做中文助手:Qwen2.5-7B/14B + LLaMA-Factory + QLoRA。
企业应用、高精度代码生成:DeepSeek-Coder-33B(用LoRA微调)或 Qwen2.5-Coder-32B。
学术研究、英文通用任务、资源有限:Mistral 7B(Apache 2.0,非常自由)或 Llama 3 8B。
边缘设备、实时翻译:Qwen2.5-1.5B/3B(直接用QLoRA微调后 int4 量化)