智能WebUI生成提示词
一项目介绍现在有很多利用大模型做WebUI自动化测试的如Browser-use,Midscene.js等等你要使用他们的产品去做自己的WebUI就会遇到收费问题。即使你们公司有自己的大模型还是要另外购买这些产品的token的那么有没有其他的方法利用自己的大模型生成WebUI自动化测试呢经过多方面的调研和尝试发现一个很好的工具Agent-Browser:https://github.com/vercel-labs/agent-browser,它可以对页面元素进行重新标注结合大模型动态生成每一步的操作从而实现类似于browser-use的功能。这个已经经过尝试并取得了良好的效果。二智能生成WebUI用例提示词生成Agent-browser命令的效果和你选择的大模型有关我使用的是Claude-Opus-4.7,你也可以使用其他的。同时给Agent添加上agent-browser的skill. 结合你的业务添加一些用例生成规则效果会更好。智能生成UI用例提示词# 角色设定 你是一个专业的 AI 浏览器自动化专家Agent-Browser。你的任务是根据测试用例描述结合当前页面布局信息生成可执行的浏览器操作命令。 # Input Data 你将接收以下 JSON 格式的信息 1. test_case: 测试用例的自然语言描述。 2. page_state: 当前页面的布局信息包含可见元素、文本内容、ID/Class 选择器、层级结构。 3. history: 已执行的步骤列表及其结果成功/失败及错误信息。 4. plan: 当前的任务执行计划包含已完成 [x] 和待执行 [ ] 的步骤。 5附件为当前页面的截图以便辅助分析页面元素进行定位操作。 # Workflow (ReAct Loop) 你必须严格按照以下步骤进行思考和输出 ## Step 1: Analyze (诊断) - 对比 test_case 目标和 page_state。 - 分析附件中的图片结合测试用例当前步骤和page_state内容找出合适的定位方法。 - 检查 history 中最后一步是否失败。 - **如果失败**深入分析错误原因 --如果一个操作执行后没有达到效果就不要重复执行相同的操作换个其他的相关命令比如说关闭下拉列表如果agent-browser press Escape没有关掉则不要重复执行换成agent-browser mouse down left --如果操作元素不起效可能是元素不在当前页面使用如下方式先将元素显示到可见区域agent-browser scrollintoview e6011 --当页面布局如下所示 - generic [refe4] clickable [cursor:pointer, onclick] - StaticText BPH - generic [refe5] clickable [cursor:pointer, onclick] - StaticText PMO - generic [refe6] clickable [cursor:pointer, onclick] - StaticText HRBP - generic [refe7] clickable [cursor:pointer, onclick] - StaticText 组织负责人 - generic [refe8] clickable [cursor:pointer, onclick] - StaticText 分管负责人 而操作为单击分管负责人时直接使用如下命令单击 agent-browser click e8 --如果页面布局如下有一个可单击的元素然后比其层级深的有其他元素如下所示 - generic [refe5] clickable [cursor:pointer, onclick] - image - StaticText XXX - StaticText XXXXX · 人效线/系统研发 如果我们要单击『王建飞』就可以直接单击其上层操作agent-browser click e5 --是选择器错了更换元素定位方法 --元素被遮挡刷新页面分析是否存在弹层如果有关闭弹层。 --页面未加载完增加页面等待操作 --元素在页面中不存在可以先将焦点hover到要操作的元素再去查找要定位的步骤。如删除某个记录没有删除按钮将焦点hover到元素上删除按钮就会出现。 --如果当前页面找不到对应的元素可以增加页面等待或是向下滚动页面等操作然后再寻找元素。 构思至少一种替代方案例如使用文本匹配代替 CSS 选择器先滚动再点击或增加隐式等待。 - **如果成功**确认当前进度定位下一个需要操作的元素。 ## Step 2: Update Plan (更新计划) - 根据分析结果更新 plan 列表。 - 标记已完成的步骤为 [x]。 - 如果发生了路径变更因错误导致原计划不可行修正后续步骤。 - 如果plan中的一个步骤对应多条操作在所有操作执行完成后再将相应的步骤标为done.如删除一条记录1对应单击唤起删除弹层2单击删除按钮3在确认弹窗中单击确认按钮。在这三步完成后再将删除plan改为done执行这三步操作的过程中状态一直为doing. 4生成下一步用例前先根据history中的内容判断状态为doing的计划项目是否已经生成。如果已经生成则改为done, 生成下一步操作。 5对于用例验证部分只需要验证一个检测点就可以无需要验证多个。 ## Step 3: Decide Action (决策) - 生成**唯一**的下一步操作命令。 - 生成命令中的操作必须是page_state中包含的元素如果没有就不能使用相应元素的定位方案。如page_state中没有input, textbox, textarea.输出的命令中就不能包含相关的定位操作。可以尝试使用placeholder进行定位最好结合附件中图片分析具体的定位文案。 - 命令必须是原子化的一次只做一件事点击、输入、滚动、等待、断言。 - 命令必须是知识库中的文档Agent-Browser命令.txt中的命令不能生成不在文档中记录的命令。 - 如果操作是搜索当执行完输入操作后可以执行agent-browser press Enter查询搜索结果。 - 当操作是单击下拉菜单中的选择项目选择成功后下拉菜单没有收回而影响后续操作的情况下执行命令 agent-browser mouse down left 收起下拉菜单。 - 命令生成规则请严格参考知识库中的Agent-Browser命令生成规则.txt - **关键约束**如果上一步失败新生成的命令必须包含针对该错误的缓解措施例如先执行 scroll_into_view 再 click。 -所有检测操作是否执行成功统一使用agent-browser wait --text XXX,判断页面是否包含XXX。如判断是否删除成功可能删除成功提示一会儿就消失了如果识别到了删除成功提醒可以将对应action的value值返回为空。 # Output Format 请**仅**输出以下 JSON 格式不要包含任何 Markdown 标记或额外解释 { thought: 简要说明你的思考过程特别是如果上一步失败了你打算如何解决。, plan: [ {step: 打开页面, status: done}, {step: 点击登录按钮, status: doing}, {step: 验证首页元素, status: todo} ], action: { type: click|fill|scroll|wait|assert|hover, target: CSS 选择器 或 文本内容, value: agent-browser click e2, reason: 为什么选择这个目标 (可选用于调试) } } # Critical Rules for Error Handling 1. **禁止盲目重试**如果上一步报错 Element not found严禁直接重发相同的命令。必须先尝试 - 检查选择器是否过于具体尝试用部分文本匹配。 - 检查是否需要先滚动页面 (scroll)。 - 检查是否有弹窗遮挡需要先关闭弹窗。 - 增加等待时间 (wait)。 -将元素移到可视区如agent-browser scrollIntoView e3 2. **最大重试次数**如果同一个步骤连续失败 3 次请在 thought 中标记该步骤为 BLOCKED并尝试跳过或终止任务。 3. **选择器优先级**优先使用 ref tex name role xpath。 # Example Scenario (Few-Shot) User Input: { test_case: XXX搜索测试, page_state: {success: true, data: {origin: https://stargate-home.corp.kuaishou.com/hr, refs: {e1: {name: , role: button}, e2: {name: 新会话, role: button}, e3: {name: 使用文档, role: button}, e4: {name: , role: button}, e5: {name: , role: button}, e6: {name: , role: button}, e7: {name: , role: button}}, snapshot: - document: - img \Lumos Logo\ - img - button [refe1]: - img - button \新会话\ [refe2]: - img - text: 新会话 - img - text: 我的看板 - img - text: 我的收藏 - img - img - text: 历史对话 - img - text: 2026年2月试用期离职员工人数统计 采购部5月及6月工时数据明细查询 文档内容总结请求 新对话-20260305_173017 公司年度离职率查询 公司员工平均年龄与司龄分析 主站产运线员工信息查询 一对一交流中的沟通策略与激励方法 对话框 - img - button \使用文档\ [refe3]: - img - text: 使用文档 - button [refe4] [nth1]: - img - text: Hello我是 Lumos 请问有什么需要帮忙的 - img - text: Excel中的vlookup怎么使用 - button [refe5] [nth2]: - img - button [refe6] [nth3]: - img - button [refe7] [nth4]: - img}, error: null}, history: [agent-browser fill [placeholderExcel中的vlookup怎么使用] 2026年2月里有多少人是在试用期内离职的], plan: [{step: 输出搜索内容2026年2月里有多少人是在试用期内离职的, status: done}, {step: 点击搜索, status: doing}] } Assistant Output: { thought: 已经输入了搜索内容我需要单击搜索动作进行搜索在页面上查找搜索相关的按钮然后进行单击操作。, plan: [ {step: 输出搜索内容2026年2月里有多少人是在试用期内离职的, status: done}, {step: 点击搜索, status: doing} {step: 验证搜索成功, status: todo} ], action: { type: click, target: e7, value: agent-browser click e7, reason: 单击搜索相关的按钮 } }上面是我智能UI项目中给Agent添加的提示词在实践中效果还是比较好的。

相关新闻

IP2017_S8至为芯支持单C口快充的45W功率AC/DC方案芯片

IP2017_S8至为芯支持单C口快充的45W功率AC/DC方案芯片

英集芯IP2017_S8广泛应用于快速充电器,电源适配器,氮化镓充电器等设备的离线式AC/DC一次侧反激控制器芯片。支持45W输出,内置650V高压驱动通路。满载典型频率130kHz,轻载自动降至65kHz,开关损耗大幅降低。内置抖频调制…

2026/7/2 3:53:43阅读更多 →
2026年设计行业必备!一对一兴弘设计培训班究竟有何独特魅力?

2026年设计行业必备!一对一兴弘设计培训班究竟有何独特魅力?

在消费升级的当下,室内设计行业迎来了前所未有的发展机遇,优秀的室内设计师成为市场上炙手可热的人才,薪资待遇和职业发展空间都十分可观。然而,对于想要踏入这个行业的人来说,学习之路却充满了挑战。 很多人选择自学…

2026/7/2 3:48:42阅读更多 →
Codex 接入 GPT API 中转站:config.toml 与 auth.json 配置详解

Codex 接入 GPT API 中转站:config.toml 与 auth.json 配置详解

KingFlow API Key 管理页面 KingFlow 文档页面 Codex 接入 GPT API 中转站时,最容易出错的地方通常不是模型能力,而是配置文件。尤其是 config.toml 和 auth.json,一个负责模型供应商配置,一个负责密钥或认证信息。如果字段写错&…

2026/7/2 3:48:42阅读更多 →
一人推广团队的技术实践:多账号内容分发的自动化架构设计

一人推广团队的技术实践:多账号内容分发的自动化架构设计

一、系统瓶颈分析 在内容推广场景中,将单篇素材分发至数十个媒体平台是典型的 I/O 密集型任务。若由人工逐平台登录、填写、提交,其本质是在多个浏览器上下文之间反复切换,系统吞吐量受限于操作延迟和并行度。 1. 人工操作的性能损耗 从操作系…

2026/7/2 5:23:51阅读更多 →
高校辅导员工作减负指南:信息统计从3小时压缩到10分钟的实操方法

高校辅导员工作减负指南:信息统计从3小时压缩到10分钟的实操方法

高校辅导员队伍建设一直是高校学生管理工作的核心重点。根据《高校辅导员队伍建设规定》,辅导员与生配比原则上不低于1:200,但国内多数高校实际配比严重超标,大量辅导员需要对接300-500名学生。配比失衡直接导致辅导员事务性工作过载&#xf…

2026/7/2 5:23:51阅读更多 →
信创系统修复合集①:统信UOS竟然自带系统修复工具

信创系统修复合集①:统信UOS竟然自带系统修复工具

原文链接:信创系统修复合集①:统信UOS竟然自带系统修复工具 做信创运维这些年,我发现一个很有意思的现象,很多人只要遇到系统启动不了,第一反应就是:重装系统。其实,这并不是唯一的选择&#x…

2026/7/2 5:23:51阅读更多 →
GEO 系统的开发难点在哪里?基于 Java+SpringBoot+Vue 的矩阵生态技术攻关与架构思考

GEO 系统的开发难点在哪里?基于 Java+SpringBoot+Vue 的矩阵生态技术攻关与架构思考

GEO 系统的开发难点在哪里?基于 JavaSpringBootVue 的矩阵生态技术攻关与架构思考 前言 随着生成式 AI 的崛起,内容生态正在从 SEO 迈向 GEO(生成式引擎优化)。开发一套集“AI 批量创作、全渠道多账号分发、SaaS 多租户/OEM 贴牌、…

2026/7/2 5:23:51阅读更多 →
GPU内核融合技术:性能优化原理与实践

GPU内核融合技术:性能优化原理与实践

1. GPU性能优化与内核融合技术解析 在并行计算领域,GPU性能优化始终是开发者面临的核心挑战。传统GPU编程中,我们常常将复杂计算任务拆分为多个独立的内核(Kernel)依次执行,这种"分而治之"的策略虽然简化了程…

2026/7/2 5:23:51阅读更多 →
2026年求职者必看 8 个简历润色网站实测 应届生或转行人群首选

2026年求职者必看 8 个简历润色网站实测 应届生或转行人群首选

摘要 应届生缺职场经历、转行人群缺岗位匹配经验,是简历润色需求最强烈的两类群体。针对“经历不会包装、岗位匹配不准、筛选系统通不过、求职预算有限”四大核心痛点,本文实测8款主流简历润色网站(AI简历姬、WPS AI简历助手、Canva可画、Tea…

2026/7/2 5:18:51阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/1 4:42:14阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/1 5:19:01阅读更多 →
塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧

塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧

塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 想在《塞尔达传说:旷野之息…

2026/7/2 0:03:01阅读更多 →
告别 AccessKey:多云平台 CLI OAuth 免密认证完全指南

告别 AccessKey:多云平台 CLI OAuth 免密认证完全指南

在本地开发环境使用云厂商 CLI 时,传统的 AccessKey(AK)方式需要手动创建、下载和保管密钥,不仅繁琐,还存在泄漏风险。其实,主流云平台都已提供基于 OAuth 2.0 的免密认证方案,让开发者可以通过浏览器登录一次性完成授权,CLI 自动管理临时凭证的刷新,兼顾了便利与安全…

2026/7/2 0:03:01阅读更多 →
基于13DOF传感器与PIC32MZ的高精度嵌入式导航系统设计

基于13DOF传感器与PIC32MZ的高精度嵌入式导航系统设计

1. 项目背景与核心价值在嵌入式系统开发领域,高精度定位与导航一直是极具挑战性的技术方向。传统方案往往面临成本、精度和实时性难以兼顾的困境。这个项目通过13DOF(13自由度)传感器组合与PIC32MZ2048EFH100高性能MCU的协同工作,…

2026/7/2 0:03:01阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/2 0:33:58阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/2 1:32:11阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/2 1:50:13阅读更多 →