AI相关的概念(1)
标题:AI相关的概念(1)
演讲人:肖sir(金牌高级AI 软件培训师)
一、ai的发展史
萌芽奠基期:逻辑与数学的源头(1940s-1956)
(1)核心定位
形成 AI 理论基础与学科雏形,提出 “机器能否拥有智能” 核心命题
(2)关键里程碑:
1936 年:艾伦・图灵提出图灵机理论,奠定计算机数学基础
1943 年:麦卡洛克 & 皮茨提出人工神经元模型,神经网络雏形
1950 年:图灵发表《计算机器与智能》,提出图灵测试
1951 年:马文・明斯基开发首个神经网络模拟器 SNARC
(3)技术突破
无实际 AI 技术落地,仅完成数学理论与概念探索
(4)发展特征
聚焦 “用机器模拟人类逻辑思维”,无产业应用、无商业价值
AI 测试关联
无 AI 测试场景,尚未形成相关测试需求
二、早期繁荣期:AI 学科正式诞生,符号主义主导(1956-1974)
(1)核心定位:
“人工智能” 术语定名,早期符号主义 AI 落地,首次发展热潮
(2)关键里程碑:
1956 年:达特茅斯会议,正式提出 AI 术语,AI 成为独立学科
1957 年:弗兰克・罗森布拉特发明感知机,首个单层神经网络模型
1966 年:ELIZA 聊天机器人诞生,NLP 技术雏形
1960s-1970s:美国 DARPA 大规模资助 AI 研发项目
(3)技术突破:
符号主义成为主流:用 “符号 + 规则” 模拟人类逻辑推理
实现简单的图像识别、自然语言对话、数学定理证明
(4)发展特征
技术仅能处理简单、结构化、确定性问题
大众对 AI 期望过高,形成早期 AI 泡沫
(5)AI 测试关联
无系统化 AI 测试,仅简单验证早期程序的功能正确性(如定理证明结果)
三、第一次 AI 寒冬:技术局限与资金撤退(1974-1980)
(1)核心定位
符号主义缺陷暴露,算力 / 数据不足致技术停滞,AI 首次低谷
(2)寒冬原因
技术瓶颈:无法处理非结构化问题,规则库维护成本极高
算力限制:早期计算机性能低下,无法支撑复杂计算
理论批评:明斯基指出单层神经网络无法解决 “异或问题”,连接主义停滞
资金撤退:英、美政府大幅削减 / 停止 AI 研发资助
(3)发展特征
学术研究几乎停滞,无任何 AI 商业应用与产业落地
(4)AI 测试关联
无 AI 测试需求,AI 技术研发进入停滞状态
四、知识工程复兴期:专家系统崛起,连接主义萌芽(1980-1990)
(1)核心定位
符号主义升级为知识工程,专家系统成首个商业 AI 形态,连接主义复苏
(2)关键里程碑
1980s:专家系统落地(XCON 计算机配置、MYCIN 医疗诊断)
1982 年:日本提出第五代计算机计划,激发全球 AI 研发
1986 年:辛顿提出反向传播(BP)算法,解决多层神经网络训练问题
(3)技术突破
知识工程:基于领域知识 + 规则库,模拟人类专家决策
连接主义复兴:BP 算法为后续深度学习奠定核心算法基础
(4)发展特征
AI 首次实现商业化落地,成为企业降本增效工具
专家系统需人工录入规则,跨领域迁移能力为 0
(5)AI 测试关联
初步出现领域 AI 测试:验证专家系统的决策准确性(如医疗诊断结果匹配度)
测试核心:规则库的完整性、决策结果的一致性
五、第二次 AI 寒冬:商业泡沫破裂,专用 AI 初露锋芒(1990-2000)
(1)核心定位
专家系统局限性暴露,商业泡沫破裂,专用 AI 实现突破性成果
(2)寒冬原因
商业瓶颈:重领域、轻通用,维护成本远超实际价值
技术单一:无新核心技术突破,算力 / 数据问题仍未解决
计划失败:日本第五代计算机计划因目标激进宣告失败
(3)关键突破
1997 年:IBM 深蓝击败国际象棋世界冠军,专用 AI 里程碑
(4)发展特征
连接主义研究缓慢推进,BP 算法逐步完善
行业认知回归理性:从专用场景突破,而非一蹴而就实现通用智能
(5)AI 测试关联
专用 AI 测试落地:验证专用 AI 的任务执行准确性(如深蓝的棋步决策)
测试核心:高计算量场景下的功能稳定性、结果正确性
六、深度学习崛起期:算力 + 数据双突破,连接主义主导(2000-2018)
(1)核心定位
算法 / 算力 / 数据三大要素协同突破,深度学习成主流,AI 走向产业落地
(2)关键里程碑
2006 年:辛顿提出深度信念网络,正式提出 “深度学习” 概念
2009 年:Google Brain 开发大规模 GPU 集群,解决算力瓶颈
2012 年:AlexNet 获 ImageNet 冠军,CNN 引爆计算机视觉研究
2014 年:GAN 生成对抗网络 / 注意力机制提出
2016 年:AlphaGo 击败围棋世界冠军,深度学习从感知到决策
2017 年:Transformer 架构诞生,成为 NLP 与大模型核心基础
(3)技术突破
深度学习成为主流:多层神经网络模拟人脑,数据驱动自动学习特征
核心框架开源:TensorFlow(2015)、PyTorch(2016)降低技术门槛
核心领域突破:计算机视觉、语音识别、机器翻译成熟
(4)发展特征
连接主义成为绝对主导,可处理图像 / 语音 / 文本等非结构化数据
AI 产业落地加速,诞生商汤 / 旷视等 AI 企业,进入安防 / 金融 / 工业领域
(5)AI 测试关联
现代 AI 测试萌芽,成为 AI 测试师核心早期场景
测试核心:CV / 语音识别模型的效果测试(准确率、召回率、识别速度)
测试场景:人脸识别准确率、语音转文字容错率、机器翻译一致性
七、大模型时代:预训练范式开启,生成式 AI 引爆认知(2018-2022)
(1)核心定位
Transformer 为基础,预训练 + 微调成主流范式,大语言模型成核心底座
(2)关键里程碑
2018 年:谷歌 BERT 发布 / GPT-1 诞生,NLP 进入预训练时代
2019 年:GPT-2 发布,验证大模型规模化效应
2020 年:GPT-3 发布(1750 亿参数量),首个真正意义上的大语言模型
2022 年:ChatGPT(GPT-3.5)发布,引爆生成式 AI 热潮;Stable Diffusion 实现 AI 图像生成
(3)技术突破
预训练 + 微调范式:通用数据预训练 + 领域数据微调,适配行业场景
强化学习人类反馈(RLHF):提升大模型的对话交互能力
生成式 AI(AIGC):AI 从 “感知” 升级为 “生成”,可创作文本 / 图像
(4)发展特征
模型向超大参数量、超大规模数据发展,算力成核心竞争壁垒
AI 从技术圈走向大众,C 端应用爆发,AIGC 成核心赛道
AI 测试关联
AI 测试快速发展,成为 AI 测试师核心工作场景
测试核心:大语言模型能力测试、AIGC 产品功能 / 效果测试
测试场景:问答准确率、生成内容一致性、模型幻觉率、图像生成还原度
八、多模态与产业落地期:大模型通用化,AI 融合各行业(2023 - 至今)
(1)核心定位
大模型向多模态升级,轻量化 / 开源化 / 行业定制化发展,AI 深度产业落地
(2)关键里程碑
2023 年:GPT-4 发布(首个多模态大模型);国内文心一言 / 通义千问等大模型发布;开源大模型(Llama1/2、ChatGLM)爆发
2024-2025 年:Claude 3/Gemini 2.0/ChatGPT-4o 实现精细跨模态交互;稀疏 MoE 架构推动大模型轻量化
(3)技术突破
多模态融合:文本 + 图像 + 音频 + 视频 + 语音跨模态理解与生成
大模型轻量化:量化 / 蒸馏技术,实现端侧(手机 / 嵌入式设备)部署
行业定制化:通用大模型下沉为金融 / 医疗 / 测试等行业大模型
(4)发展特征
多模态成为标配,AI 从 “技术展示” 走向 “实际产业落地”
全球出台 AI 监管政策(欧盟 AI 法案、中国生成式 AI 管理办法)
开源生态完善,中小企业可低成本接入 AI 技术
(5)AI 测试关联
AI 测试全流程工程化,AI 测试师需求爆发,测试维度全面升级
测试核心:多模态大模型能力、行业大模型业务适配性、AIGC 产品全维度测试
测试场景:图文匹配准确率、音视频理解能力、行业模型合规性、生成内容安全性、模型鲁棒性 / 可解释性
九、AI 发展核心总结
三大核心要素
算法、算力、数据协同突破,是 AI 每一次爆发的核心前提
1950s-1990s 缺算力 / 数据;2000s 后三要素逐步补齐并持续升级
两大核心学派交替主导
符号主义(1956-1990s):符号 + 规则,无法处理非结构化问题
连接主义(2000s - 至今):神经网络 + 数据驱动,依赖算力 / 数据,可解释性弱
两次 AI 寒冬的核心教训
技术突破跟不上行业期望,盲目追求通用智能
AI 发展是渐进式,需从专用场景突破,夯实算力 / 数据基础
未来发展趋势
长期目标:通用人工智能(AGI),现阶段聚焦 “具身智能”(大模型 + 机器人)
核心方向:AI 与行业深度融合、模型可解释性 / 安全性、云边端协同
AI 测试:成为 AI 产业落地的核心保障,向全生命周期、智能化测试演
| 技术分支 | 核心能力 | 测试常见场景 |
|---|---|---|
| 计算机视觉(CV) | 图像 / 视频识别、分析、生成 | UI 视觉缺陷检测、图像识别准确率测试 |
| 自然语言处理(NLP) | 文本理解、生成、交互 | 测试用例自动生成、大模型问答一致性测试 |
| 机器学习(ML) | 数据驱动的规律学习、预测 | 缺陷预测、测试用例优化效果验证 |
| 生成式 AI(AIGC) | 文本 / 图像 / 音频 / 视频生成 | AIGC 产品生成内容合规性、还原度测试 |
| 多模态大模型 | 跨文本 / 图像 / 音频的理解与生成 | 图文匹配、音视频分析能力测试 |
多模态融合:单一文本 / 图像模型淘汰,跨模态成为标配,测试需覆盖跨模态交互的准确性;
行业定制化:通用大模型下沉为金融 / 医疗 / 测试等行业大模型,测试需关注业务适配性、合规性;
轻量化 / 端侧部署:大模型向手机 / 嵌入式设备迁移,测试需验证端侧模型的性能、效果损耗;
可解释性 / 安全性:解决 “黑箱模型” 问题,测试需重点验证模型鲁棒性、抗攻击能力、无偏见。

浙公网安备 33010602011771号