2026年4月2日
摘要:
GPU驱动升级安装 驱动 # 更新软件源列表 sudo apt update # 查看可用的 NVIDIA 驱动版本 ubuntu-drivers devices # 安装推荐版本 sudo ubuntu-drivers autoinstall # 或者选择安装指定版本 sudo apt insta
阅读全文
posted @ 2026-04-02 14:05
uestc001
阅读(9)
推荐(0)
2026年2月25日
摘要:
参考文献 vllm官方prefix缓存设计文档:https://github.com/vllm-project/vllm/blob/main/docs/design/prefix_caching.md 数据表现 原始计算轮数据: FlashAttentionMetadata: (num_actual
阅读全文
posted @ 2026-02-25 20:07
uestc001
阅读(117)
推荐(0)
2026年2月6日
摘要:
docker打包 文件组织 -maker_docker --dockerfile --requirement.txt dockerfile # 使用指定的 CUDA 基础镜像 FROM nvcr.io/nvidia/cuda:12.8.1-cudnn-devel-ubuntu22.04 # 设置环境
阅读全文
posted @ 2026-02-06 13:49
uestc001
阅读(9)
推荐(0)
2026年1月21日
摘要:
vllm代码框架 框架整体调度流程 用户代码 │ │ 1. 同步/异步调用 ▼ ┌──────────────────────────┐ │ LLM / AsyncLLMEngine │◀─ yield / return ───┐ │ ·tokenize&pre-process │ │ │ ·生成
阅读全文
posted @ 2026-01-21 15:49
uestc001
阅读(117)
推荐(0)
2025年3月13日
摘要:
https://ai-bot.cn/#term-2
阅读全文
posted @ 2025-03-13 14:39
uestc001
阅读(68)
推荐(0)
2024年11月29日
摘要:
1.pycharm配置 1)pycharm git 配置: https://blog.csdn.net/u012856866/article/details/132688006 开发时,只需要在空白文件夹中git clone, 再使用pycharm以项目方式打开,即可同步 2)pycharm 自建项
阅读全文
posted @ 2024-11-29 17:37
uestc001
阅读(26)
推荐(0)
2024年11月27日
摘要:
AI框架 https://chenzomi12.github.io/01Introduction/README.html https://openmlsys.github.io/chapter_introduction/design.html 23种设计模式 https://blog.csdn.ne
阅读全文
posted @ 2024-11-27 14:38
uestc001
阅读(10)
推荐(0)
摘要:
1.修改网络配置 vim /etc/resolv.conf 2.bashrc配置 vim ~/.bashrc 历史指令补全 bind -f ~/.inputrc vim ~/.inputrc # inputrc文件中设置快捷键 3.docker指令: (需要在容器外宿主机上执行) 容器创建:dock
阅读全文
posted @ 2024-11-27 11:17
uestc001
阅读(23)
推荐(0)