摘要: 参考 https://github.com/linzm1007/nano-vllm-ascend Nano-vLLM-Ascend nano-vllm是开源的一个gpu推理项目,基于开源版本弄的一个ascend npu版本推理小demo,旨在帮助初学者了解推理的整体流程,区别于vllm,nano-v 阅读全文
posted @ 2025-12-07 21:09 linzm14 阅读(92) 评论(0) 推荐(0)