声明:本站文章均为作者个人原创,图片均为实际截图。如有需要请收藏网站,禁止转载,谢谢配合!!!

类型:

通用指令跟随(聊天、问答、总结):首选 Qwen2.5(中文强、综合能力均衡)、Llama 3(英文强、推理好)或 DeepSeek-V2(性价比高)。

代码生成与理解:首选 DeepSeek-Coder 系列(在代码数据上预训练过,填空和补全能力很强),或 CodeLlama。

数学与逻辑推理:首选 DeepSeek-Math(基座已强化推理能力,微调后效果更好)或 Qwen2.5-Math。

用途:
个人开发者、单卡RTX 4090、做中文助手:Qwen2.5-7B/14B + LLaMA-Factory + QLoRA。

企业应用、高精度代码生成:DeepSeek-Coder-33B(用LoRA微调)或 Qwen2.5-Coder-32B。

学术研究、英文通用任务、资源有限:Mistral 7B(Apache 2.0,非常自由)或 Llama 3 8B。

边缘设备、实时翻译:Qwen2.5-1.5B/3B(直接用QLoRA微调后 int4 量化)