摘要:
1、输入长度 理论上,大模型是可以从工程总体角度去分析多线程问题,但现实是现在的大模型,对输入长度是有限制的,尤其开源大模型,其最大长度一般<=128K个token,换算为字符数,大约是512K个字符,而商用的软件系统,随便一个工程,甚至其一个功能模块都可能远超512K个字符,因此,需要寻找一个能够 阅读全文
posted @ 2026-03-27 09:20
tgltt
阅读(11)
评论(0)
推荐(0)
摘要:
由于大模型自身固有的制约因素,大模型方案核心在于解决如何筛选工程中的多线程代码,然后让大模型扫描这些筛选出来的代码,分析其中的多线程问题。 初期尝试是采用RAG,尝试筛出工程中的多线程代码。 一、RAG概述 RAG是Retrieval Augmented Generation的英文缩写,中文名为检索 阅读全文
posted @ 2026-03-27 09:17
tgltt
阅读(23)
评论(0)
推荐(0)
摘要:
以优化大模型检测多线程问题为例,可按四阶段走的策略进行。 第一阶段:代码段扫描 这个阶段的目标,是让大模型每次检查一个代码片段,输出该代码段的多线程问题,并保证足够的准确率。由于本阶段扫描的是代码段,缺少非常多的上下文信息,自然会有比较高的误报率,对此有2种优化方法: l 优化Prompt 利用提示 阅读全文
posted @ 2026-03-27 09:16
tgltt
阅读(42)
评论(0)
推荐(0)
浙公网安备 33010602011771号