maoku66 - 博客园

2026年1月23日

摘要：大家好，我是maoku！本期聚焦PEFT微调的**科学评估体系**——不只看准确率，更从性能、效率、资源、适应性四大维度量化效果。手把手教你对比LoRA等方法，用数据回答“值不值得做”，助你从炼丹师进阶为靠谱AI工程师！阅读全文

posted @ 2026-01-23 12:38 maoku66 阅读(11) 评论(0) 推荐(0)

2026年1月19日

摘要：大家好，我是maoku。今天，我们要做一件特别有价值的事——系统梳理大模型领域的所有关键术语。如果你曾经在技术讨论中感到困惑：同事说“用LoRA做个SFT，再用RAG增强一下”，你只能点头微笑读技术文章看到“DPO、KTO、ORPO”，感觉像在看天书听到“MoE架构”、“GQA注意力”、“F 阅读全文

posted @ 2026-01-19 11:28 maoku66 阅读(20) 评论(0) 推荐(0)

2026年1月17日

上线只是开始：揭秘大模型为何需要持续“保养”与迭代

摘要：大家好，我是maoku。今天我们来聊聊大模型部署后一个让人又爱又恨的话题——为什么大模型总是需要反复微调？如果你已经成功把一个开源大模型部署到了自己的业务中，先恭喜你！但你很快会发现一个“残酷”的现实：这个费尽心思调好的模型，上线不是终点，而是持续维护的起点。它可能隔几周就要“保养”一次，比手机系阅读全文

posted @ 2026-01-17 17:57 maoku66 阅读(17) 评论(0) 推荐(0)

# 大模型部署算力账本：手把手教你算清GPU显存这笔账

摘要：本系列构建了从大模型理解、微调优化、资源计算到实际部署的完整知识体系，辅以实用工具推荐，旨在帮助开发者系统掌握大模型落地核心技能，从理论到实践全面赋能。阅读全文

posted @ 2026-01-17 01:34 maoku66 阅读(32) 评论(0) 推荐(0)

2026年1月15日

《微调“新手村”完全攻略：避开所有坑，用可复现的方法赢得第一次成功》

摘要：告别“瞎调参”：一份为大模型微调“新手村”画好的地图你好，我是猫库（maoku）。如果你看过一些大模型微调的教程，可能会觉得它像一门“玄学”——充满了晦涩的术语、神秘的参数和“炼丹”般的运气。你照着做，但结果总像开盲盒。这不对。微调本质上是一个工程问题，它应该有清晰的逻辑、可重复的路径和可预阅读全文

posted @ 2026-01-15 19:59 maoku66 阅读(6) 评论(0) 推荐(0)

2026年1月13日

全参、LoRA、RAG：大模型微调三大技术，你的项目该如何选择？

摘要：当通用大模型遇上专业领域任务，往往显得"泛而不精"。本文将用最直白的语言，为你拆解为模型"开小灶"的三大核心技术，通过原理对比和清晰的决策树，帮你找到最适合自己项目的技术路径。阅读全文

posted @ 2026-01-13 21:08 maoku66 阅读(27) 评论(0) 推荐(0)

2026年1月11日

全参、LoRA、RAG：3张图看懂你的AI项目该选哪种方案

摘要：

引言：你的大模型，为什么需要“开小灶”？想象一下，你招了一位顶尖大学的通才毕业生（比如ChatGPT），他博古通今，能说会道。但现在，你需要他立刻上岗成为你公司的资深法律顾问或芯片设计专家。直接让他看合同、画电路图，他大概率会表现得像个“懂王”——说得多，但对得少。这就是通用大模型的现状：广度惊阅读全文

posted @ 2026-01-11 22:56 maoku66 阅读(11) 评论(0) 推荐(0)

Yjx1244596300

公告