如何把deepseek-R1微调/蒸馏为某领域的一个专家?


如何把deepseek-R1微调/蒸馏为某领域的一个专家?

一方面要求模型被微调/蒸馏的足够小,可以部署在个人工作站中(或者不太贵的服务器)。
另一方面要求模型吸收/学习/理解某领域的相关知识、文献、数据,成为该领域知识和推理的专家。
也就是放弃或弱化不要的功能,强化人们需求的功能。

9300举报0匿名用户1年前
点击获取 ^_^
被收录:

暂无评论