零基础认识大语言模型(LLM)工作原理(3.大模型绕不开的架构--Transformer到底是怎么工作的?)
最近正好有空,打算抽时间复盘总结一下这些年零零散散学习的AI知识. 下面是目录 零基础认识大语言模型(LLM)工作原理目录 - GuZhenYin - 博客园 如果说上一章介绍的是: 模型吃进去什么。 那么这一章介绍的就是: 模型的大脑到底是如何工作的。 第三章 Transformer 到底是怎么工 ...