摘要: 核心摘要 (TL;DR) 工具:Ollama (最流行的本地大模型运行工具)。 目标:在本地电脑运行大模型,并提供 API 给 Python 调用。 痛点解决:教咱们如何用国内 ModelScope 替代 HuggingFace 实现极速下载。 干货:包含修改端口、显存计算公式、以及 Embeddi 阅读全文