摘要: 我是一名大模型算法工程师,在学习大模型的过程中踩过很多坑。为了帮程序员少走弯路,我把自己的经验写成了 阅读全文
posted @ 2026-03-31 08:29 吾辈亦有感 阅读(7) 评论(0) 推荐(0)
摘要: 我是一名大模型算法工程师,在学习大模型的过程中踩过很多坑。为了帮程序员少走弯路,我把自己的经验写成了 阅读全文
posted @ 2026-03-31 06:38 吾辈亦有感 阅读(8) 评论(0) 推荐(0)
摘要: 【NLP高频面题 - LLM架构篇】大模型为何使用RMSNorm代替LayerNorm? 重要性:★ 阅读全文
posted @ 2024-11-29 15:23 吾辈亦有感 阅读(675) 评论(0) 推荐(0)
摘要: 【人人都能学得会的NLP - 文本分类篇 02】使用DL方法做文本分类任务 NLP Github 项 阅读全文
posted @ 2024-11-29 08:37 吾辈亦有感 阅读(88) 评论(0) 推荐(0)
摘要: 【NLP高频面题 - LLM架构篇】LLM对Transformer都有哪些优化? ⚠︎ 重要性:★★ 阅读全文
posted @ 2024-11-28 13:51 吾辈亦有感 阅读(149) 评论(0) 推荐(0)
摘要: 【NLP高频面题 - LLM架构篇】LLM为何使用GQA代替MHA? 重要性:★★ 💯 NLP G 阅读全文
posted @ 2024-11-28 13:48 吾辈亦有感 阅读(167) 评论(0) 推荐(0)
摘要: 【人人都能学得会的NLP - 文本分类篇 01】使用ML方法做文本分类任务 NLP Github 项 阅读全文
posted @ 2024-11-28 10:58 吾辈亦有感 阅读(135) 评论(0) 推荐(0)
摘要: 【RAG 项目实战 08】为 RAG 添加历史对话能力 NLP Github 项目: NLP 项目实 阅读全文
posted @ 2024-11-27 09:09 吾辈亦有感 阅读(1050) 评论(0) 推荐(0)
摘要: 【RAG 项目实战 07】替换 ConversationalRetrievalChain(单轮问答) 阅读全文
posted @ 2024-11-26 19:59 吾辈亦有感 阅读(95) 评论(0) 推荐(0)
摘要: 【NLP高频面题 - 分布式训练】ZeRO1、ZeRO2、ZeRO3分别做了哪些优化? 重要性:★★ 阅读全文
posted @ 2024-11-26 13:11 吾辈亦有感 阅读(423) 评论(0) 推荐(0)