用 OpenClaw 搭个人 AI 工作流:从小白到跑起来
2025 年初我开始折腾各种 AI 工具的 API 配置,光是让不同平台的消息打通就花了不少精力。现在换了 OpenClaw,工作流终于稳定下来了。写这篇文章算是把踩过的坑整理一下,供有类似需求的同学参考。
在聊安装之前,先说清楚它解决什么问题。
OpenClaw 本质上是一个本地运行的 AI Agent 框架,支持插件式扩展。它可以连接各种消息渠道(Telegram、Discord、Signal、WhatsApp 等),同时维护一个持久的工作区——你的文件、记忆、人格设定都存在本地,不依赖任何云服务。
最直接的使用场景:
如果只是偶尔查个资料,网页版 AI 聊天就够用了。但如果需要 AI 在后台帮你做事情,且希望整个过程都在自己控制之下,OpenClaw 是值得投入时间配置的。
在 Windows 上运行 OpenClaw,官方推荐通过 WSL(Windows Subsystem for Linux)。原因倒不是 Windows 版有什么硬伤,而是很多工具链在 Linux 环境下更省心,尤其是涉及定时任务和后台服务的时候。
WSL 的安装很简单,在 PowerShell 里执行一条命令:
wsl --install安装完成后重启电脑,会自动进入 Ubuntu 的初始化流程,自己设置用户名和密码就好。
OpenClaw 基于 Node.js 运行,需要提前装好。WSL 里执行:
curl -fsSL https://deb.nodesource.com/setup_22.x | sudo -E bash -sudo apt-get install -y nodejsnode -v # 确认版本,22.x 即可这一步卡住的人不少,最常见的问题是网络原因导致下载失败。如果遇到,换个镜像源或者确认 WSL 的网络模式是否正常。
Node.js 就绪之后,安装 OpenClaw CLI:
npm install -g @openclaw/cli安装成功后,执行 openclaw --version 应该能看到版本号。如果提示命令找不到,先确认 npm 的全局 bin 目录是否加入了 PATH。
首次运行时,OpenClaw 会引导你完成初始化:
openclaw init这一步会在 ~/.openclaw/ 目录下生成基础结构,包含配置文件夹和工作区。工作区是实际存放文件的地方,可以放在任何你喜欢的位置。
如果只是本地使用,可以跳过这一步。但大多数人装 OpenClaw 就是为了在 Telegram 或者 Discord 上跟 AI 对话,这步就需要认真做。
以 Telegram 为例,需要:
Discord 的流程类似,但多了 OAuth 权限配置这一步。官方文档里有详细的分步指南,对应不同平台的差异写得很清楚。
初始化完成之后,工作区里有几个文件值得提前了解。
这个文件定义了 AI 的说话风格和行为准则。默认是一个通用的”靠谱助手”形象,但你可以改成任何你想要的设定。
比如你想让 AI 用更口语化的方式交流,或者设定一个特定的角色,都通过修改这个文件实现。格式上就是一段说明文字加一些行为规则,不需要懂代码。
AI 的名字、头像、一些基本属性都在这里。新建一个 AI 身份时先填这个文件,帮助 AI 建立角色感。
这里放的是关于”你在哪里找这个 AI 聊天”的信息。时区、称呼方式、偏好设置,写得越具体,AI 的回应就越贴合你的习惯。
如果你的工作流涉及多个 AI Agent 同时运行,这个文件定义它们之间的分工和协作方式。比如哪些任务分配给哪个 Agent,如何传递信息,如何避免重复工作。
每次对话结束后,AI 会把值得记住的内容写入当天的记忆文件。时间久了,这些文件构成一个长期记忆库,让 AI 在后续对话中保持上下文连续性。
这个目录里的文件是纯文本格式,可以直接打开看,也可以手动编辑。定期清理无用内容是个好习惯。
OpenClaw 的技能(Skill)本质上是预设好的提示词和工具配置,相当于给 AI 装插件。一个技能通常包含:
安装技能有两种方式:通过 SkillHub 平台一键安装,或者手动下载复制到本地。
SkillHub 是一个技能市场,大多数常见需求都能找到现成的方案。在 WSL 里执行:
npx skills install <skill-name>比如安装浏览器自动化技能:
npx skills install agent-browser安装完成后,OpenClaw 会自动加载这个技能,下次对话时就能使用对应的功能了。
有些技能不在 SkillHub 上,或者你想自己改一改再装,就手动复制到工作区:
cp -r /path/to/skill ~/.openclaw/workspace/skills/<skill-name>然后在 OpenClaw 的配置里启用这个技能即可。
用了一段时间之后,以下这几个技能是我最常用的:
浏览器自动化(agent-browser-cli)
适合需要 AI 操作网页的场景,比如自动签到、填表,信息抓取。它基于 Playwright,底层是真实的浏览器,兼容性比 headless 方案好很多。
agent-browser open https://example.comagent-browser snapshotagent-browser find role button click --name "登录"GitHub CLI(github)
在终端里管理 Issues、PR、CI 运行状态。不用开网页就能查谁提了 PR、构建有没有挂掉,适合程序员日常使用。
gh issue list --repo owner/repo --limit 10gh run view <run-id> --repo owner/repo --log-failedObsidian 笔记(obsidian)
管理 Obsidian 笔记库,搜索、创建,整理笔记。Obsidian 的 vault 本质上就是一堆 Markdown 文件,这个技能帮 AI 找到正确的文件路径并做修改。
自我改进(self-improving-agent)
这个技能的设计思路挺有意思。它会在每次对话结束后自动记录 AI 犯过的错误、踩过的坑,以及从中学到的东西。随着时间推移,AI 会从自己的失败中学习,越来越少犯同样的错误。
具体记录三类内容:
记录本身不难,养成习惯就行。关键是要定期回顾,把高频重复的错误提炼成预防规则。
这是我认为 OpenClaw 最实用的功能之一。
OpenClaw 内置了 cron 系统,可以设置精确的执行时间。比如每天早上九点推送天气情况:
openclaw cron add \ --name "daily-weather" \ --schedule "0 9 * * *" \ --message "查询今天的天气,发送给主频道"也可以设置一次性提醒:
openclaw cron add \ --name "meeting-reminder" \ --at "2026-04-20T14:00:00+08:00" \ --message "还有半小时会议,记得准备资料"我目前在用的一些周期任务:
定时任务的好处是把被动响应变成主动推送。不需要主动去问,AI 会按时出现在那里。
在 .env 文件里写 API Key,有人习惯写成 KEY=value,但如果值里包含特殊字符,引号一定要加上。漏了的话,解析到特殊字符就会截断,后面的调试会走很多弯路。
先确认 AI 在本地能正常对话,再去接 Telegram 或者 Discord。两个变量同时调,很容易分不清问题出在哪里。
刚用 OpenClaw 的时候什么都往 memory 里记,时间久了文件膨胀严重。养成定期整理的习惯,把有价值的内容沉淀下来,无关的记录删掉或者移走。
装了一堆技能但用不上的话,维护成本会慢慢上来。只保留自己实际在用的技能,定期清理不用的,比囤积要有意义得多。
早上到公司,打开电脑。OpenClaw Gateway 已经在后台运行,检查一下昨晚有没有重要的定时任务通知。
打开 Telegram 问今天的待办事项。AI 调取 memory 里的上下文,结合前一天的记录,给出一个清单。有需要处理的文件,顺手就让 AI 帮忙整理。
白天工作过程中,遇到需要自动化操作网页的时候,直接发消息让 AI 处理。截图确认结果,满意就继续,不满意让 AI 重来。
下班前触发日报任务,AI 自动生成一份当天的工作记录推送到频道里,自己过一遍有没有遗漏。
这就是日常的使用节奏。没有复杂的多步骤流程,就是让 AI 在需要的地方出现,然后该干嘛干嘛。
整体搭下来需要花的时间因人而异,快的半天,慢的一两天。如果只用到基础的聊天功能,半小时就能跑起来。但要真正让它成为工作流的一部分,需要花点时间配置技能和记忆系统。
用了一段时间之后,最大的感受是:它不像那些”全能型”AI 产品什么都想做,而是在你需要的几个点上做得足够深入。这种克制的设计,反而让稳定性好了很多。
如果你也在找一个可以长期用的本地 AI 助手方案,OpenClaw 值得一试。