会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
linzm14
博客园
首页
新随笔
联系
订阅
管理
2025年12月10日
sglang v0.5.5.post3 框架图
摘要: 参考 https://github.com/zhaochenyang20/Awesome-ML-SYS-Tutorial/blob/main/sglang/code-walk-through/readme-CN.md https://github.com/sgl-project/sglang/tre
阅读全文
posted @ 2025-12-10 14:38 linzm14
阅读(23)
评论(0)
推荐(0)
2025年12月8日
omniinfer vllm v0.9.0整体框架图和pangu7b模型图
摘要: 参考 https://shen-shanshan.github.io/articles/vllm-v1-整体流程从请求到算子执行/ https://gitee.com/omniai/omniinfer/tree/release_v0.6.0/ https://github.com/vllm-proj
阅读全文
posted @ 2025-12-08 22:16 linzm14
阅读(110)
评论(0)
推荐(0)
2025年12月7日
Nano-vLLM-Ascend
摘要: 参考 https://github.com/linzm1007/nano-vllm-ascend Nano-vLLM-Ascend nano-vllm是开源的一个gpu推理项目,基于开源版本弄的一个ascend npu版本推理小demo,旨在帮助初学者了解推理的整体流程,区别于vllm,nano-v
阅读全文
posted @ 2025-12-07 21:09 linzm14
阅读(92)
评论(0)
推荐(0)
2025年8月19日
failed to bind port 0.0.0.0:6667/tcp: fork/exec /usr/bin/docker-proxy: exec format error.
摘要: 1 报错内容 docker: Error response from daemon: driver failed programming external connectivity on endpoint xx_ssh (429495664dec9d44f6958a4380124df6381a789
阅读全文
posted @ 2025-08-19 09:55 linzm14
阅读(18)
评论(0)
推荐(0)
2025年4月15日
gcc : Depends: cpp (= 4:9.3.0-1ubuntu2) but it is not going to be installed g++ : Depends: cpp (= 4:9.3.0-1ubuntu2) but it is not going to be installed
摘要: 问题 apt install build-essential Reading package lists... Done Building dependency tree... Done Reading state information... Done Some packages could no
阅读全文
posted @ 2025-04-15 21:36 linzm14
阅读(124)
评论(0)
推荐(0)
2024年8月6日
javax.validation包校验嵌套属性(List对象)的写法
摘要: 1 maven依赖 <!-- Hibernate Validator 用于数据验证 --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-validation</art
阅读全文
posted @ 2024-08-06 11:14 linzm14
阅读(456)
评论(0)
推荐(0)
2024年6月19日
java 大模型代理 chat completions
摘要: 1 controller @SneakyThrows @PostMapping(value = "/v1/chat/completions", produces = {TEXT_EVENT_STREAM_VALUE, APPLICATION_JSON_VALUE}) @Operation(summa
阅读全文
posted @ 2024-06-19 11:09 linzm14
阅读(162)
评论(0)
推荐(0)
2024年5月9日
text-generation-webui 推理模型Qwen1.5-7B-Chat相关报错问题解决
摘要: 推理代码 text-generation-webui 推理模型 Qwen1.5-7B-Chat sys infogpu: Tesla V100-PCIE-32GBpython: 3.10model:Qwen1.5-7B-Chatdocker docker run -it --rm --gpus='"
阅读全文
posted @ 2024-05-09 11:23 linzm14
阅读(2232)
评论(0)
推荐(0)
LLaMA-Factory 训练 Llama3-Chinese-8B-Instruct 相关报错问题解决
摘要: 模型路径 up主为 llama中文社区 模型地址 https://www.modelscope.cn/models/FlagAlpha/Llama3-Chinese-8B-Instruct/summary sys info gpu: Tesla V100-PCIE-32GB python: 3.10
阅读全文
posted @ 2024-05-09 11:19 linzm14
阅读(2076)
评论(0)
推荐(0)
2024年4月26日
vllm 通过不同的chat_template推理部署常见qwen、chatglm、llama3等开源大模型
摘要: vllm 版本 4.0.0 镜像 vllm github 官方镜像 gpu v100 32g a800 80g openai api 方式 出现的问题通过 chat-template 聊天模板解决 1 推理部署qwen系列模型 测试 我是谁 问题:回答内容含有分词符,回答有杂论冗余内容 模型文件没有
阅读全文
posted @ 2024-04-26 15:52 linzm14
阅读(6136)
评论(3)
推荐(0)
下一页
公告