团队作业5——测试与发布(Alpha版本)
一、作业基本信息
| 这个作业属于哪个课程 | https://edu.cnblogs.com/campus/gdgy/Class34Grade23ComputerScience/ |
|---|---|
| 这个作业要求在哪里 | https://edu.cnblogs.com/campus/gdgy/Class34Grade23ComputerScience/homework/13484 |
| 这个作业的目标 | 测试与发布(Alpha版本) |
| github仓库链接 | https://github.com/Have-you-slept/LLM |
二、团队展示
| 团队名 | 睡了吗 |
|---|---|
| 成员1:肖俊(组长) | 3123004804 |
| 成员2:陈俊彦 | 3123004782 |
| 成员3:蓝毅 | 3123004789 |
| 成员4:杨腾竣 | 3123004809 |
| 成员5:曾梓垚 | 3123004764 |
| 成员6:王坤平 | 3123004758 |
| 成员7:何睿欣 | 3223003267 |
| 成员8:余嘉祺 | 3123004811 |
三、智能知识问答系统 Alpha 版本测试报告
1、Bug清单与处理情况
Bug分类统计
| 类型 | 数量(个) |
|---|---|
| 修复的bug | 6 |
| 不能重现的bug | 2 |
| 这个产品就是这样设计的,不是bug | 1 |
| 没有能力修复,将来也不打算修复 | 1 |
| 这个bug的确应该修复,但是没有时间在这个版本修复,延迟到下一个版本修复 | 6 |
| 总bug数 | 16 |
详细Bug描述
1.1. 修复的bug (6个)
- 核心服务集成与启动
- LangChain依赖冲突:项目初始依赖(langchain==0.1.0)与后续引入的langchain-community等包存在API不兼容,导致服务启动时ImportError。
- Neo4j数据库连接失败:Docker Compose配置中后端服务无法通过主机名访问独立的Neo4j容器,导致知识图谱功能完全失效。
- 前端界面与交互
- Gradio主题配置失效:自定义的深色主题参数未正确传入,界面始终显示为默认亮色样式。
- 移动端基础布局错位:在手机屏幕宽度下,问答输入框与按钮出现严重重叠,影响基本使用。
- 核心功能逻辑
- 学科资源推荐误触发:当用户输入中包含“学习”一词但非学科问题时(如“学习是一种乐趣”),系统错误地推荐了通用学习资料。
- 空输入导致前端控制台报错:用户未输入任何内容点击“发送”按钮,前端未做校验直接发起请求,导致控制台出现TypeError。
1.2. 不能重现的bug (2个)
- 交互与性能问题
- 知识图谱渲染偶发性空白:一名测试人员报告,在特定滚动页面后,知识图谱区域有时会变为空白,但开发团队无法在测试环境中稳定复现此现象。
- 回答生成偶发延迟:个别测试反馈在网络良好的情况下,出现过一次回答生成时间超过10秒的情况,但后续无法复现,日志也未发现异常。
1.3. 这个产品就是这样设计的,不是bug (1个)
- 该产品暂无登录功能。
1.4. 没有能力修复,将来也不打算修复 (1个)
- 第三方服务与深度兼容性
- 特定API服务的全局限流:我们所依赖的某个核心大模型API服务,在其免费层有明确的、不可绕过的每分钟调用次数限制。我们无法修复此限制,这是由服务提供商制定的策略。
1.5. 延迟到下一个版本修复的bug (6个)
- 功能增强与优化
- 知识图谱性能优化:当单一图谱中的节点数量超过50个时,渲染和交互会出现明显卡顿。优化需要重构前端渲染逻辑,工作量较大。
- 复杂问题答案分页/分段显示:对于生成的极长答案(超过1000字),当前界面会显示一个很长的文本框,体验不佳。计划在Beta版本中实现分页或折叠展开。
- 用户体验细化
- 回答实时流式输出:当前需等待答案完全生成后才能显示。实现类似ChatGPT的逐字输出效果需要改造前后端通信逻辑。
- 更精细的学科分类:当前学科识别仅基于有限关键词匹配,对于“卷积神经网络在图像识别中的作用”这类问题,可能仅识别为“计算机”而无法细分为“深度学习”。优化需要构建更复杂的分类模型。
- 系统 robustness
- 会话上下文长度限制与提醒:在多轮对话中,当累计上下文超过模型Token限制时,系统会直接报错。需要增加自动清理早期历史或给用户明确提醒的功能。
- 资源链接的自动化有效性检测:当前需要手动维护资源链接库。计划在Beta版本增加定期自动检测链接是否失效的功能。
2、场景测试
2.1. 预期不同的用户会怎样使用你的软件?
- 考前突击的学生:针对某一具体、琐碎的知识点(如“进程与线程的区别”)进行快速查询,希望获得直击要害的解释、看到相关概念的对比图,并能立刻找到包含该知识点的章节习题。
- 进行文献调研或入门新领域的研究者:输入一个领域核心术语(如“注意力机制”),希望获得其核心思想、发展脉络的清晰阐述,通过图谱了解其相关技术,并获取关键的综述文献或经典教材链接。
2.2. 他们有什么需求和目标?
- 快速澄清疑惑:用最少的步骤和时间,获得对一个陌生概念或问题的权威、易懂的解释。
- 建立知识联系:不只得到“点”的答案,还能直观看到这个“点”在整个知识网络中的位置。
- 获得可信的学习延伸材料:在理解概念后,能便捷地获取到与之强相关的、高质量的下游学习资源。
2.3. 你的软件提供的功能怎么组合起来满足他们的需要?
- 用户提出一个具体的知识点问题。
- 系统在1-3秒内生成结构化的文字解释(智能问答),这是满足其核心解惑需求的第一步。
- 同步地,系统在右侧生成该知识点的交互式图谱(知识图谱),将解释中提到的其他相关概念(如对比对象、组成部分、应用场景)可视化,帮助用户自主探索,建立系统性认知。
- 根据识别出的问题所属学科或技术领域,系统在回答下方推送1-3个精选资源链接(资源推荐)。这些链接直接指向包含该知识点详解的PDF、视频或代码仓库,用户可一键转存,实现从“理解”到“深化”的无缝衔接。
3、测试矩阵
| 功能模块 | 用例描述 | 输入 | 预期结果 | Google Chrome | Microsoft Edge |
|---|---|---|---|---|---|
| 智能问答 | 成功回答专业问题 | 输入“请解释TCP三次握手过程” | 返回清晰、正确的技术解释。 | √ | √ |
| 处理包含特殊字符的输入 | 输入“C++中->操作符是什么意思?” | 正常解析问题并给出关于指针成员访问的正确回答。 | √ | √ | |
| 知识图谱 | 自动生成并展示图谱 | 询问“思政课”后。 | 知识图谱包含“马原”、“习概”、“毛概”等节点的图谱。 | √ | √ |
| 图谱节点交互查询 | 点击图谱中的“计算机网络”节点。 | 页面下方显示“计算机网络”的简要说明文本。 | √ | √ | |
| 资源推荐 | 触发学科资源推荐 | 输入“学习计算机组成原理的数据流”。 | 回答下方显示与“计算机组成原理”相关的网盘资源卡片。 | √ | √ |
| 不触发无关推荐 | 输入“你好,今天心情不错”。 | 仅返回对话式响应,不显示资源推荐模块。 | √ | √ |
4、出口条件
我们设定以下条件作为判定Alpha版本质量达标、可以对外发布的依据,目前均已满足:
- 核心功能流程验证通过:智能问答、知识图谱可视化、学科资源推荐这三大核心功能的所有基础测试用例(Test Matrix中所列)100%执行通过,实现了需求文档中规定的基本能力。
- 阻塞性缺陷已清零:所有被标记为“严重”(Critical)和“高”(High)优先级的Bug均已被修复并验证关闭,主流程不存在导致操作中断的缺陷。
- 最小可行用户体验达成:系统响应时间处于可接受范围(P95 < 3秒),主要交互界面布局清晰、功能可发现,两名目标用户代表能够在不阅读详细说明书的情况下独立完成核心场景任务。
- 部署与运行文档就绪:
- 项目拥有完整的代码仓库和版本标签。
- README.md 文件提供了从环境准备、一键启动到访问系统的完整指南。
- 遗留问题状态透明化:所有未在Alpha阶段修复的Bug(包括“延期修复”和“不修复”类别)均已记录在案,并明确了原因、影响和后续计划,项目状态清晰。
四、Alpha版本发布说明
1、欢迎使用
我们很高兴地发布 智能知识问答系统 v0.1.0 (Alpha)。这是一个旨在帮助你高效学习和探索知识的辅助工具。经过初期的开发和测试,它现在已经具备了最核心的能力,并通过 Gradio 社区平台上线,您可以立即在线体验,无需复杂配置。
2、版本功能亮点
- 一键智能问答:接入可靠的大语言模型API,为你清晰解答各学科的基础概念和原理性问题。
![image]()
- 可视化知识关联:不仅仅是文字答案。系统会自动提取回答中的关键概念,并生成一张交互式的知识图谱,帮助你直观建立知识间的联系。
![ba2fb127f09b77b40ffaf35fcac63845]()
- 精准学习资源直达:我们预先整理了一个学科资源库。当你的问题涉及特定领域(如“计算机组成原理”、“高等数学”)时,系统会智能推荐对应的精选百度网盘学习资料,并提供有效提取码。
![7be1764cf91821a5758a2b03f9cc7793]()
![dc3f0049b84e10fc8ee4acf6caa40f9c]()
![image]()
- 零配置在线体验:本项目已通过 Gradio 平台部署上线。无需安装任何环境或依赖,只需一个浏览器即可立即开始使用,享受无缝的问答体验。
![c7a79e00ea91afb666960ba0ecaadd72]()
3、在线访问与本地运行指南
方式一:在线立即体验(推荐)
这是最快捷的方式。您可以直接访问我们通过 Gradio 部署的公开链接,无需任何安装。
- 访问链接:https://3d56b4dd1f3c.ngrok-free.app
- 等待加载:页面加载后,您将看到简洁的问答界面。
- 开始使用:在输入框直接提问,例如“解释牛顿第一定律”,即可体验全部功能。
方式二:在您的电脑上本地运行
如果您是开发者,或希望进行二次开发,可以在https://github.com/Have-you-slept/LLM 找到源码
4、已知问题与注意事项
为了让你有更好的了解,我们诚实地列出当前版本的已知局限:
- 功能范围:当前版本专注于概念解释和知识关联,不适合进行复杂的数学计算、编程调试或需要最新实时信息的查询。
- 资源库覆盖:我们手工维护的学科资源链接库,目前主要覆盖了计算机科学、数学、物理学等部分基础课程。其他学科的资料正在逐步收集中。
- 网络与性能:
- 系统的智能问答能力需调用外部API,请确保网络畅通。
- Gradio 免费版限制:在线体验版受 Gradio 免费套餐限制,可能存在排队等待时间和单次会话时长限制。高峰时段请耐心等待。
- 知识图谱在处理非常复杂的概念关系时,生成和渲染可能需要数秒时间。
- 数据与隐私:
- 您的所有对话记录仅在本次浏览器会话中临时保存,页面刷新或关闭后即失效。
- 我们不会收集、存储或上传您的任何个人数据和对话历史。
- 浏览器建议:为获得最佳显示与交互效果,建议使用 Chrome 或 Edge 浏览器的较新版本。
5、发布信息
- 版本号:v0.1.0 (Alpha)
- 在线体验地址:https://3d56b4dd1f3c.ngrok-free.app
- 项目代码仓库:https://github.com/Have-you-slept/LLM
- 维护团队:睡了吗小组
- 发布日期:2025年12月15日







浙公网安备 33010602011771号