人工智能
在软件测试开发中的应用

黄延胜-思寒@测吧（北京）科技有限公司

https://ceba.ceshiren.com/

人工智能在软件测试开发中的应用

智能化测试

为什么测试工程师需要掌握 AI

随着 AI 技术的逐渐成熟，AI 对于测试工程师的影响日益加深。AI 已经成为继自动化之后的下一场技术革命。及时拥抱 AI 以获得更加强大的测试效能与生产力，已经成为当下每位测试工程师的必修课。

日益增多的 AI 测试开发工程师岗位需求

越来越多的 AI 产品涌现，需要精通 AI 系统的测试工程师。
越来越多的应用系统在接入 AI，需要 AI 测试工程师
越来越多的团队需要借助于 AI 提效

智能化测试应用方向

方向	应用
产品	领域知识库业务知识图谱
测试设计	业务测试用例生成测试数据生成基于文档的测试用例生成
自动化	测试自动化智能体模型驱动测试基于探索的自动化测试用例生成
缺陷挖掘	缺陷挖掘缺陷溯源
代码	代码分析精准测试
工作流	工作流自动化

人工智能基础设施与架构

大语言模型技术栈

常用大语言模型对比

大模型	质量	性能	成本	开源	商业	合规
OpenAI ChatGPT	5	5	高		有
Anthropic Claude	5	5	高		有
Google Gemini	5	5	高		有
阿里千问	4	5	低	是	有	是
DeepSeek	4	5	低	是	有	是
Zhipu GLM	3	3	低	是	有	是
Meta Llama	3	3	低	是
Mistral Mistral	4	4	低	是	有

大语言模型部署方案

Ollama 量化大模型管理框架，适合个人本地部署
LM Studio 量化大模型管理框架，适合个人部署
llama.cpp 大模型 c++高性能移植版本，适合低配设备上使用
vLLM 高性能服务引擎，适合企业部署
TGI TEI hugging face 大模型服务

大模型应用平台

open-webui 知识库智能体适合个人部署
Dify 知识库智能体工作流插件体系强大定制性强
Ragflow 知识库智能体工作流
FastGPT 知识库智能体作流
n8n 侧重于工作流编排，强大的变量语法

大语言模型应用开发框架

Microsoft Autogen 微软出品的大语言模型开发框架
llama index 功能齐全
Pydantic.AI 强调类型更加 pythonic
Langchain 功能齐全生态丰富
LangGraph 基于有向图设计的智能体开发框架

开源大语言模型硬件环境

消费级电脑 ollama + 7b
轻量级别方案 MacMini + 7b 14b
适合中等规模大模型推理的方案 MacStudio + 14b 32b
适合推理的方案 h20 华为昇腾满血版本
适合训练的方案 h100 h800

适合自动化的智能体工具与框架

Web 自动化 Agent：Agent-E Browser-Use
App 自动化 Agent：AppAgent
Windows Mac GUI 自动化 Agent: Eko
Hogwarts Agent 专业版 ： 零代码数据驱动自动化测试

视觉识别模型 Yolo OmniParser

yolo
OmniParser
阿里 QWen VL
字节跳动 UI-TARS

对象识别

多模态大模型可以让我们更好的分析通用的 UI 界面。不过缺点也很明显，响应慢，获取的信息量不够全，通常需要结合控件树进行综合分析。虽然很多团队使用了视觉识别大模型，但是我们仍然不建议只使用视觉识别大模型。因为在一些更加复杂的案例场景中，需要获取在可视 UI 之下的深层数据以实现更快更稳定的测试，这是视觉识别无法做到的典型场景。