AI相关的概念（1）

标题：AI相关的概念（1）

演讲人：肖sir（金牌高级AI 软件培训师）

1、什么是AI？AI（Artificial Intelligence）即人工智能，是计算机科学的一个分支，通过模拟、延伸和扩展人类智能的理论、方法和技术，使机器能够执行通常需要人类才能完成的任务，如学习、推理、决策、语言理解等，AI分支很多比如计算机视觉（CV），自然语言处理（NLP）等等

2、什么是AGI？AGI（Artificial General Intelligence，简称AGI）即通用人工智能。这是理论上的 AI，能够理解、学习和应用知识到任何领域，表现出类似于人类的智能行为，AGI仍然是一个研究目标，尚未实现

3、什么是AIGC？AIGC是"人工智能生成内容"(Artificial Inteligence Generated Content)的简称，它是指通过 AI 自动生成文本、图片、音频、视频等内容，比如用DeepSeek帮我们写文章，Midjourney

画图，Runway生成视频等等

4、什么是大模型？大模型的全称是大语言模型（Large Language Model，简称LLM），是通过海量文本数据训练出的巨型神经网络，其参数规模达到千亿级别（如GPT-3有1750亿参数），能理解和生成接近人类水平的自然语言，当我们与各种AI具对话的时候，其实就是跟其背后的大语言模型进行对话。

5、什么是AI agent和AI智能体？Agent 翻译为代理人、代理商，技术人员对Agent应该不陌生。AIAgent就是使用了AI能力的Agent，它可以是一个软件，也可以是一个智能机器人，能帮助我们更快速、智能的解决特定的问题。智能体可以是简单的规则型，如自动温度、湿度调节，也可以是学习型，也可以是生成型，如DeepSeek、或者苹果手机的Siri等。

我们经常能看到、接触到的智能体就是通过提示词工程与插件、工作流、知识库等结合起来，生成的特定功能的AI工具，比如腾讯元器、扣子（Coze）等等

6、什么是单模态？：只处理一种类型的数据，比如只处理文本（如GPT-3.5）、只处理图像（如图像识别模型）。

7、什么是多模态？：能够同时处理两种及以上类型的数据。例如，既能理解图片内容，又能理解文本描

述，甚至还能结合音频、视频等信息进行综合分析和生成。对应的场景有。

8、什么是RAG技术？RAG（Retrieval-Augmented Generation，检索增强生成）技术，是一种将信

息检索（IR）与大型语言模型（LLM）的文本生成能力相结合的人工智能框架。其核心思想是：当LLM 需要回答一个问题或生成文本时，不是仅依赖其内部训练时学到的知识，而是先从一个外部知识库中检索出相关的信息片段，然后将这些检索到的信息与原始问题/指令一起提供给LLM，让LLM基于这些最新、最相关的上下文信息来生成更准确、更可靠、更少幻觉的答案。

9、AI Agent 和 AIGC 最大的区别：

a. AIGC主要以生成式任务为主，而 Agent 是可以通过自主决策能力完成更多通用任务的智能系统。

b. 常见的 AIGC 系统（文生文，文生图）的核心就是一个生成模型，而 Agent 是一个集Function Call

模型、软件工程于一体的复杂的系统，需要处理模型和外界的信息交互。

c. Agent 最大的特点是，借助 Function Call 模型，可以自主决策使用外接的

一些工具来完成特定的任务。

10、什么是 Fucntion Call 模型？

Function Calling（函数调用）是大型语言模型的关键技术。前面有提到过 RAG技术是为了解决模型无

法和外接数据交互的问题，但是 RAG 的局限在于只赋予了模型检索数据的能力，而 Function Calling

允许模型理解用户请求中的潜在意图，并自动生成结构化参数来调用外部任何函数/工具，从而突破纯文

本生成的限制，实现与真实世界的交互，比如可以调用查天气、发邮件、数学计算等工具。

支持 Fucntion Calling 能力的主流模型如下表：

11、AI agent的应用

比如有一个出行规划的智能体，这个智能体配置有天气查询、驾车规划、公共交通规划、骑行规划、步

行规划等工具。用户询问【我在深圳，5月1日想去自驾去北京旅行，帮我规划一下出行方案】，一个可

能的具体的执行流程如下：

12、怎么开发一个自己的 Agent

最简单的方法就是把 Agent 的提示词（prompt）、工具、llm 调用，工具执行都硬编码到代码中，这

样确实可以快速开发一个特定功能的 Agent。这样的实现会带来一些问题：

提示词（prompt），工具需要调整的时候，需要改配置或者代码，灵活度不够高

如果要开发一个新功能的 Agent，整体代码可能需要重新实现一遍。

为了解决这一系列的问题，coze 、dify 、腾讯云智能体开发平台等智能体开发平台相继出现。借助这

些平台，开发者甚至不需要会编程，不需要服务器资源，就可以开发一个自己的Agent，Agent 的整个

执行流程完全由平台在云上执行。智能体开发平台的架构一般包含插件配置、Agent 配置、Agent 执行

模块、插件执行模块，发布模块。

13、什么是 MCP？

MCP（Model Context Protocol，模型上下文协议）是由人工智能公司 Anthropic 于 2024 年 11 月

24 日正式发布并开源的协议标准。Anthropic 公司是由前 OpenAI 核心人员成立的人工智能公司，其发

布的 Claude 系列模型是为数较少的可以和 GPT 系列抗衡的模型。

为什么需要 MCP？

MCP 协议旨在解决大型语言模型（LLM）与外部数据源、工具间的集成难题，被比喻为AI应用的USB-C

接口。通过标准化通信协议，将传统的M×N集成问题（即多个模型与多个数据源的点对点连接）转化为

M+N模式，大幅降低开发成本。

14、什么是langchain？

LangChain 是一个基于大型语言模型（LLM）的编程框架，帮助开发者更方便地将 LLM 与外部数据、

工具和业务流程结合起来，构建更实用、更强大的 AI 应用。

langchain的作用：

a. 根据需求文档、接口文档或历史缺陷，自动生成测试用例

b. 使用 LangChain Agent 工具调用 Code Interpreter 工具，支持 Python 脚本生成

c. 将缺陷描述、日志等向量化存储，使用 LangChain + FAISS/Chroma 构建缺陷知识库

d. 日志异常分析，构建 LangChain 问答链，实现我这个请求超时是因为啥？这类查询，配合 LLM 实现

智能摘要与重点异常提示

e.LangChain 加载Swagger或Markdown文档，使用LLM提取字段、参数、请求类型。通过接口文档自

动生成接口测试用例和测试数据

15、什么是cursor？Cursor是由Anysphere公司开发的人工智能编程助手，基于大语言模型提供代码补

全、解释、重构与自然语言生成函数功能，支持接入GPT-4o、Claude 3.7 Sonnet等外部模型。

16、什么是ima？腾讯AI智能工作台ima是腾讯公司于2024年11月15日推出的智能办公产品，基于混元

大模型与RAG架构构建知识管理系统，支持Windows/Mac平台，提供AI问答、多模态文本创作、图像

生成等功能，整合微信公众号生态（可检索超500万篇公众号内容）并支持本地文件智能解析。

17、什么是RPA? 影刀RPA是一款企业级的自动化测试工具、能实现PC、手机上的任何软件自动化操作。

18、什么是n8n？是一款开源的、基于节点的工作流自动化工具

19、什么是Dify？Dify定位为企业级开源智能体平台

20、什么是Coze？

Coze是字节跳动推出的AI智能体开发平台，以零代码和低代码为核心特点，通过拖

拽式界面构建工作流，大幅降低开发门槛。n8n、Dify、Coze是三类不同的 AI 开发平台、适用场景如下

Coze

需求简单：如抖音客服机器人、个人助手

资源有限：非技术团队需快速验证创意

Dify

企业级 AI 应用：如智能客服、合同审查系统、可以用来编写测试用例

需 RAG 和知识库管理。

n8n

复杂流程自动化：如供应链订单处理（Shopify→ERP→物流）

跨系统集成：连接数据库、硬件设备或 SaaS

二、ai对应的岗位

1、ai应用程师

2、ai训练师

3、ai人工智能算法开发工程师 20-35k

4、ai人工智能工程师

5、ai人工大模型

6、ai agent 开发工程师

7、ai软件测试专家 30-60

8、ai软件测试工程师 11-20k 15-25左右

9、ai测试开发工程师

三、AI 发展史

一、ai的发展史
萌芽奠基期：逻辑与数学的源头（1940s-1956）
（1）核心定位
形成 AI 理论基础与学科雏形，提出 “机器能否拥有智能” 核心命题
（2）关键里程碑：
1936 年：艾伦・图灵提出图灵机理论，奠定计算机数学基础
1943 年：麦卡洛克 & 皮茨提出人工神经元模型，神经网络雏形
1950 年：图灵发表《计算机器与智能》，提出图灵测试
1951 年：马文・明斯基开发首个神经网络模拟器 SNARC
（3）技术突破
无实际 AI 技术落地，仅完成数学理论与概念探索
（4）发展特征
聚焦 “用机器模拟人类逻辑思维”，无产业应用、无商业价值
AI 测试关联
无 AI 测试场景，尚未形成相关测试需求
二、早期繁荣期：AI 学科正式诞生，符号主义主导（1956-1974）
（1）核心定位：
“人工智能” 术语定名，早期符号主义 AI 落地，首次发展热潮
（2）关键里程碑：
1956 年：达特茅斯会议，正式提出 AI 术语，AI 成为独立学科
1957 年：弗兰克・罗森布拉特发明感知机，首个单层神经网络模型
1966 年：ELIZA 聊天机器人诞生，NLP 技术雏形
1960s-1970s：美国 DARPA 大规模资助 AI 研发项目
(3)技术突破：
符号主义成为主流：用 “符号 + 规则” 模拟人类逻辑推理
实现简单的图像识别、自然语言对话、数学定理证明
(4)发展特征
技术仅能处理简单、结构化、确定性问题
大众对 AI 期望过高，形成早期 AI 泡沫
(5)AI 测试关联
无系统化 AI 测试，仅简单验证早期程序的功能正确性（如定理证明结果）
三、第一次 AI 寒冬：技术局限与资金撤退（1974-1980）
(1)核心定位
符号主义缺陷暴露，算力 / 数据不足致技术停滞，AI 首次低谷
(2)寒冬原因
技术瓶颈：无法处理非结构化问题，规则库维护成本极高
算力限制：早期计算机性能低下，无法支撑复杂计算
理论批评：明斯基指出单层神经网络无法解决 “异或问题”，连接主义停滞
资金撤退：英、美政府大幅削减 / 停止 AI 研发资助
(3)发展特征
学术研究几乎停滞，无任何 AI 商业应用与产业落地
(4)AI 测试关联
无 AI 测试需求，AI 技术研发进入停滞状态
四、知识工程复兴期：专家系统崛起，连接主义萌芽（1980-1990）
(1)核心定位
符号主义升级为知识工程，专家系统成首个商业 AI 形态，连接主义复苏
(2)关键里程碑
1980s：专家系统落地（XCON 计算机配置、MYCIN 医疗诊断）
1982 年：日本提出第五代计算机计划，激发全球 AI 研发
1986 年：辛顿提出反向传播（BP）算法，解决多层神经网络训练问题
(3)技术突破
知识工程：基于领域知识 + 规则库，模拟人类专家决策
连接主义复兴：BP 算法为后续深度学习奠定核心算法基础
(4)发展特征
AI 首次实现商业化落地，成为企业降本增效工具
专家系统需人工录入规则，跨领域迁移能力为 0
(5)AI 测试关联
初步出现领域 AI 测试：验证专家系统的决策准确性（如医疗诊断结果匹配度）
测试核心：规则库的完整性、决策结果的一致性
五、第二次 AI 寒冬：商业泡沫破裂，专用 AI 初露锋芒（1990-2000）
(1)核心定位
专家系统局限性暴露，商业泡沫破裂，专用 AI 实现突破性成果
(2)寒冬原因
商业瓶颈：重领域、轻通用，维护成本远超实际价值
技术单一：无新核心技术突破，算力 / 数据问题仍未解决
计划失败：日本第五代计算机计划因目标激进宣告失败
(3)关键突破
1997 年：IBM 深蓝击败国际象棋世界冠军，专用 AI 里程碑
(4)发展特征
连接主义研究缓慢推进，BP 算法逐步完善
行业认知回归理性：从专用场景突破，而非一蹴而就实现通用智能
(5)AI 测试关联
专用 AI 测试落地：验证专用 AI 的任务执行准确性（如深蓝的棋步决策）
测试核心：高计算量场景下的功能稳定性、结果正确性
六、深度学习崛起期：算力 + 数据双突破，连接主义主导（2000-2018）
(1)核心定位
算法 / 算力 / 数据三大要素协同突破，深度学习成主流，AI 走向产业落地
(2)关键里程碑
2006 年：辛顿提出深度信念网络，正式提出 “深度学习” 概念
2009 年：Google Brain 开发大规模 GPU 集群，解决算力瓶颈
2012 年：AlexNet 获 ImageNet 冠军，CNN 引爆计算机视觉研究
2014 年：GAN 生成对抗网络 / 注意力机制提出
2016 年：AlphaGo 击败围棋世界冠军，深度学习从感知到决策
2017 年：Transformer 架构诞生，成为 NLP 与大模型核心基础
(3)技术突破
深度学习成为主流：多层神经网络模拟人脑，数据驱动自动学习特征
核心框架开源：TensorFlow（2015）、PyTorch（2016）降低技术门槛
核心领域突破：计算机视觉、语音识别、机器翻译成熟
(4)发展特征
连接主义成为绝对主导，可处理图像 / 语音 / 文本等非结构化数据
AI 产业落地加速，诞生商汤 / 旷视等 AI 企业，进入安防 / 金融 / 工业领域
(5)AI 测试关联
现代 AI 测试萌芽，成为 AI 测试师核心早期场景
测试核心：CV / 语音识别模型的效果测试（准确率、召回率、识别速度）
测试场景：人脸识别准确率、语音转文字容错率、机器翻译一致性
七、大模型时代：预训练范式开启，生成式 AI 引爆认知（2018-2022）
(1)核心定位
Transformer 为基础，预训练 + 微调成主流范式，大语言模型成核心底座
(2)关键里程碑
2018 年：谷歌 BERT 发布 / GPT-1 诞生，NLP 进入预训练时代
2019 年：GPT-2 发布，验证大模型规模化效应
2020 年：GPT-3 发布（1750 亿参数量），首个真正意义上的大语言模型
2022 年：ChatGPT（GPT-3.5）发布，引爆生成式 AI 热潮；Stable Diffusion 实现 AI 图像生成
(3)技术突破
预训练 + 微调范式：通用数据预训练 + 领域数据微调，适配行业场景
强化学习人类反馈（RLHF）：提升大模型的对话交互能力
生成式 AI（AIGC）：AI 从 “感知” 升级为 “生成”，可创作文本 / 图像
(4)发展特征
模型向超大参数量、超大规模数据发展，算力成核心竞争壁垒
AI 从技术圈走向大众，C 端应用爆发，AIGC 成核心赛道
AI 测试关联
AI 测试快速发展，成为 AI 测试师核心工作场景
测试核心：大语言模型能力测试、AIGC 产品功能 / 效果测试
测试场景：问答准确率、生成内容一致性、模型幻觉率、图像生成还原度
八、多模态与产业落地期：大模型通用化，AI 融合各行业（2023 - 至今）
(1)核心定位
大模型向多模态升级，轻量化 / 开源化 / 行业定制化发展，AI 深度产业落地
(2)关键里程碑
2023 年：GPT-4 发布（首个多模态大模型）；国内文心一言 / 通义千问等大模型发布；开源大模型（Llama1/2、ChatGLM）爆发
2024-2025 年：Claude 3/Gemini 2.0/ChatGPT-4o 实现精细跨模态交互；稀疏 MoE 架构推动大模型轻量化
(3)技术突破
多模态融合：文本 + 图像 + 音频 + 视频 + 语音跨模态理解与生成
大模型轻量化：量化 / 蒸馏技术，实现端侧（手机 / 嵌入式设备）部署
行业定制化：通用大模型下沉为金融 / 医疗 / 测试等行业大模型
(4)发展特征
多模态成为标配，AI 从 “技术展示” 走向 “实际产业落地”
全球出台 AI 监管政策（欧盟 AI 法案、中国生成式 AI 管理办法）
开源生态完善，中小企业可低成本接入 AI 技术
(5)AI 测试关联
AI 测试全流程工程化，AI 测试师需求爆发，测试维度全面升级
测试核心：多模态大模型能力、行业大模型业务适配性、AIGC 产品全维度测试
测试场景：图文匹配准确率、音视频理解能力、行业模型合规性、生成内容安全性、模型鲁棒性 / 可解释性
九、AI 发展核心总结
三大核心要素
算法、算力、数据协同突破，是 AI 每一次爆发的核心前提
1950s-1990s 缺算力 / 数据；2000s 后三要素逐步补齐并持续升级
两大核心学派交替主导
符号主义（1956-1990s）：符号 + 规则，无法处理非结构化问题
连接主义（2000s - 至今）：神经网络 + 数据驱动，依赖算力 / 数据，可解释性弱
两次 AI 寒冬的核心教训
技术突破跟不上行业期望，盲目追求通用智能
AI 发展是渐进式，需从专用场景突破，夯实算力 / 数据基础
未来发展趋势
长期目标：通用人工智能（AGI），现阶段聚焦 “具身智能”（大模型 + 机器人）
核心方向：AI 与行业深度融合、模型可解释性 / 安全性、云边端协同
AI 测试：成为 AI 产业落地的核心保障，向全生命周期、智能化测试演

四、AI 核心技术分支（测试师高频接触）

技术分支	核心能力	测试常见场景
计算机视觉（CV）	图像 / 视频识别、分析、生成	UI 视觉缺陷检测、图像识别准确率测试
自然语言处理（NLP）	文本理解、生成、交互	测试用例自动生成、大模型问答一致性测试
机器学习（ML）	数据驱动的规律学习、预测	缺陷预测、测试用例优化效果验证
生成式 AI（AIGC）	文本 / 图像 / 音频 / 视频生成	AIGC 产品生成内容合规性、还原度测试
多模态大模型	跨文本 / 图像 / 音频的理解与生成	图文匹配、音视频分析能力测试

五、AI 在软件测试中的核心应用（你的核心工作场景）

AI 是测试效率提升的核心工具，而非替代测试师，核心落地在：

1、测试用例：自动提取测试点、生成标准化 / 组合用例，解决 “用例编写繁琐、覆盖不足” 问题；

2、自动化执行：智能 UI 自动化（CV 识别元素，无需固定脚本）、接口用例自动执行；

3、缺陷检测：静态代码缺陷扫描、视觉缺陷自动识别、大模型幻觉 / 错误自动检测；

4、结果分析：缺陷智能分类、根因溯源、测试报告自动生成；

5、探索性测试：强化学习模拟复杂用户操作，发现边缘场景缺陷。

六、当前 AI 主流发展趋势（测试师需持续关注）

多模态融合：单一文本 / 图像模型淘汰，跨模态成为标配，测试需覆盖跨模态交互的准确性；
行业定制化：通用大模型下沉为金融 / 医疗 / 测试等行业大模型，测试需关注业务适配性、合规性；
轻量化 / 端侧部署：大模型向手机 / 嵌入式设备迁移，测试需验证端侧模型的性能、效果损耗；
可解释性 / 安全性：解决 “黑箱模型” 问题，测试需重点验证模型鲁棒性、抗攻击能力、无偏见。

posted @ 2026-02-01 09:43 xiaolehua 阅读(2) 评论(0) 收藏举报

刷新页面返回顶部

肖sir软件测试培训师

AI相关的概念（1）

公告