Skip to content

Commit 3d62f06

Browse files
committed
feat:《AI Agent 场景应用 - MobileOpenClaw》第5-7节:使用AutoGLM-Phone-9B构建手机智能体
1 parent 24e4d4b commit 3d62f06

6 files changed

Lines changed: 29 additions & 16 deletions

File tree

docs/.vuepress/config.js

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -2479,7 +2479,7 @@ function getBarAIAgentScaffold() {
24792479
"part-5/第5-4节:初步通过智能体,操作手机设备.md",
24802480
"part-5/第5-5节:智能体工作流设计.md",
24812481
"part-5/第5-6节:智能体异步响应展示执行过程.md",
2482-
"part-5/第5-7节:图片位点识别增强.md",
2482+
"part-5/第5-7节:使用AutoGLM-Phone-9B构建手机智能体.md",
24832483
"part-5/第5-8节:多版本安卓版本策略支持.md",
24842484
"part-5/第5-9节:会话上下文细化处理.md",
24852485
]
236 KB
Loading
552 KB
Loading
2.32 MB
Loading
Lines changed: 28 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,28 @@
1+
---
2+
title: 【更】第5-7节:使用AutoGLM-Phone-9B构建手机智能体
3+
pay: https://t.zsxq.com/6qOqE
4+
---
5+
6+
# 《AI Agent 场景应用 - MobileOpenClaw》第5-7节:使用AutoGLM-Phone-9B构建手机智能体
7+
8+
作者:小傅哥
9+
<br/>博客:[https://bugstack.cn](https://bugstack.cn)
10+
<br/>视频:[https://t.zsxq.com/06kx8](https://t.zsxq.com/06kx8)
11+
12+
> 沉淀、分享、成长,让自己和他人都能有所收获!😄
13+
14+
## 一、本章诉求
15+
16+
引入智谱发布的 autoglm-phone-9b 专属模型,构建手机智能体。专属模型对手机上的内容操作有更为全面流程控制,比通用视觉模型在处理用户动作时会更加准确。目前这套模型可以使用官网(限时免费 [autoglm-phone](https://docs.bigmodel.cn/cn/guide/models/vlm/autoglm-phone)),也可以在 24G * 2 显卡[自己部署](https://bugstack.cn/md/algorithm/model/autoglm-phone-agent.html)。所以,如果你考虑的是将来在一些场景使用,成本相对也是很低的。
17+
18+
## 二、流程设计
19+
20+
如图,通过 autoglm-phone-9b 专属模型,构建手机智能体设计;
21+
22+
<div align="center">
23+
<img src="https://bugstack.cn/images/article/project/ai-agent-scaffold/part-5/5-7/images/ai-agent-scaffold-5-7-01.png" width="850px"/>
24+
</div>
25+
26+
- 首先,我们把之前的通用模型的实现,定义为 flow 我们要自己编写流程。把专属的手机模型定义为 auto,因为他提供了默认的一些专属特性,可以减少我们流程化上的操作。
27+
- 之后,对照来看,autoglm-phone-9b 模型,会为我们返回具体的手机的操作指令,如点击、打开、滑动、双击、回到主屏幕等。这部分内容在智谱官网访问也有说明 [AutoGLM-Phone](https://docs.bigmodel.cn/cn/guide/models/vlm/autoglm-phone)
28+
- 那么,现在需要我们改动的内容,主要是围绕着特定官网的给的智能体 prompt 提示词,编写智能体处理过程,与网关通信完成一些列的流程操作。

docs/md/project/ai-agent-scaffold/part-5/第5-7节:图片位点识别增强.md

Lines changed: 0 additions & 15 deletions
This file was deleted.

0 commit comments

Comments
 (0)