最近,Clawdbot 这个名字在技术圈和效率爱好者群体里彻底刷屏了。作为一个能直接操控电脑、执行真实任务的 AI 智能体,它不再只是“动嘴”,而是真正“动手”。我一直对 AI Agent 的概念着迷,于是决定放手一搏:把一台闲置的 Mac Mini 交给 Clawdbot 管理整整一周,看看它到底是能成为我的超级助手,还是会变成一个麻烦制造机。
这一周,我从日常琐事到稍微复杂的工作流,全都尽量交给它来处理。结果既有惊艳到起鸡皮疙瘩的时刻,也有让我想砸键盘的崩溃瞬间。下面是我的完整实测复盘。

文章导航
一、Clawdbot 到底是什么?为什么这么火?
简单来说,Clawdbot 是一个开源的本地 AI 助理,它的核心能力是:通过聊天软件远程下指令,让 AI 在你的电脑上直接操作。你可以在手机上用 Telegram、WhatsApp、飞书或者 Discord 发一条消息,它就会在电脑上打开浏览器、移动文件、写代码、发邮件,甚至控制智能家居。
它和 ChatGPT、Claude 这类纯聊天模型最大的区别在于“执行力”。它运行在本地设备上,拥有系统级权限,能读写文件、控制鼠标键盘、调用浏览器,几乎可以做任何你手动能做的事。更厉害的是,它有“长期记忆”机制,通过本地 Markdown 文件记录你的偏好和历史对话,隔几天再聊,它依然记得上下文。
GitHub 上已经超过 6 万星,很多人把它部署在 24 小时开机的 Mac Mini 上,打造了一个“永不关机的数字员工”。也正因为这个需求,Mac Mini 的二手价格都被抬高了一波。
二、安装与准备:门槛比想象中高,但还能接受
我用的是 2020 款 Mac Mini(Intel 版),系统是 macOS Ventura。安装过程其实不复杂:
- 装 Node.js 22+
- 一行命令克隆仓库并启动
- 配置 API Key:我选了 Claude 3.5 Sonnet 和 GLM-4 作为备用
- 接入飞书:国内最方便的渠道
整个过程花了我大概 4 个小时,主要卡在飞书插件的权限配置和第一次启动时的各种报错。英文错误提示对于非技术人员肯定是劝退级别的,好在社区已经有不少现成的解决方案。
重要提醒:千万不要在主力机上直接跑。我专门为它准备了这台旧 Mac Mini,就是为了隔离风险。

三、一周实测:我让它做了什么?
我把一周分成几个典型场景,尽量覆盖日常工作中常见的重复性任务。
Day 1-2:桌面与文件管理——基本功扎实
第一天我就扔给了它一个经典任务:把乱成一团的 Downloads 文件夹彻底整理。
指令:“把 Downloads 里的所有文件按类型分类(视频、图片、文档、压缩包、其他),分别放到对应的新文件夹里,文件名乱的帮我改成规范格式。”
结果:10 分钟左右完成,分类准确率大概 95%。有几个文件名太抽象的它改得不太理想,但我手动调整一下就行。
第二天我加大难度:“把最近一个月的截屏全部整理到‘截屏合集’文件夹,按日期建子文件夹。”
这次更快,5 分钟搞定。
小结:文件整理这类任务,它的表现几乎完美,省了我大量机械劳动时间。
Day 3-4:邮件与信息处理——半自动的甜蜜与痛苦
我给它建了一个专门的 Gmail 子账号,转发部分工作邮件,让它帮我筛选和初步回复。
指令示例:
– “筛选今天收到的所有邮件,把明显是推广的标记为已读并归档。”
– “把包含‘发票’的邮件附件下载下来,提取金额和日期,汇总到 Excel 表格。”
第一条基本没问题,执行得很利索。
第二条就有点翻车了——它成功下载了附件,但提取信息时漏掉了两张扫描件(OCR 识别不准),表格格式也乱了点,我得手动修正。
消耗情况:这两天光邮件相关任务就烧了我接近 800 万 Token(用 Claude 3.5),成本大概 15 美元左右。

Day 5:浏览器自动化——社交媒体发布翻车记
我尝试让它帮我发小红书笔记。
指令:“打开小红书网页版,登录(我提前给了它临时账号),发布一篇关于 AI 工具测评的笔记,配图用我桌面上的三张截图,文案自己写一篇 300 字左右的。”
结果:
– 登录成功
– 文案写得还不错
– 但上传图片时卡住了——它没识别到上传按钮需要点击两次
– 我得一遍遍提醒它“点击上传区域”“确认上传”
– 最后笔记发出来了,但图片排列乱七八糟,还留了巨大空白
整个过程折腾了近 40 分钟,我自己手动发可能只要 5 分钟。
Day 6-7:代码与复杂任务——惊艳但昂贵
周末我让它干点“高级活”:
- “帮我写一个 Python 脚本,监控某股票价格,到达某个值时发飞书消息提醒。”
- “把我最近写的 5 篇博客草稿整理成 Markdown 格式,统一标题风格,加上标签。”
第一个任务:它写出了可运行的脚本,但逻辑有小 bug(价格判断条件写反了),我调试了三次才修好。
第二个任务:完成度很高,格式统一得漂亮,还主动加了目录和关键词。
亮点的时刻:周日早上我醒来,发现它主动给我发了一份“每日简报”——包含天气、AI 圈热点新闻、我日历里的待办提醒,完全是根据我之前随口说的偏好生成的。这一刻我真的起鸡皮疙瘩了:它真的在“主动”关心我。
四、一周任务总结表
| 天数 | 任务类型 | 完成度 | 执行时间 | Token 消耗(约) | 我的干预程度 | 总体评价 |
|---|---|---|---|---|---|---|
| Day 1-2 | 文件整理 | 95% | 5-10 分钟 | 300 万 | 低 | 优秀 |
| Day 3-4 | 邮件处理 | 80% | 15-30 分钟 | 800 万 | 中 | 可用但需校对 |
| Day 5 | 社交媒体发布 | 60% | 40 分钟+ | 1200 万 | 高 | 翻车 |
| Day 6-7 | 代码编写+内容整理 | 90% | 20-60 分钟 | 1500 万 | 中 | 惊艳但需调试 |
| 全周 | 主动每日简报 | 100% | 自动 | 不详 | 无 | 最大亮点 |
总计一周 Token 消耗约 4500 万(主要用 Claude 3.5),成本约 85 美元。如果换成国产模型 GLM-4,费用能降到 20-30 美元,但智能度和稳定性会明显下降。
五、优点:它真的让我看到了未来
- 真正的“动手能力”:不再是“告诉我怎么做”,而是直接帮你做了。
- 远程操控:躺在床上用手机发指令,电脑默默干活,这种体验上瘾。
- 长期记忆:它记得我喜欢什么风格的简报、讨厌什么类型的邮件,越来越“懂我”。
- 主动性:主动生成简报、提醒待办,这才是真正助理的感觉。
六、缺点:麻烦源头也不少
- 成本高得离谱:一周 85 美元,一个月下来可能上千,对普通用户完全不友好。
- 执行不稳定:经常需要人工干预,尤其浏览器操作容易卡住。
- 安全风险极高:它拥有系统最高权限,万一被提示词注入攻击,后果不堪设想。
- 门槛不低:安装、调试、修复 bug,全程需要一定的技术基础。
- 性价比存疑:很多简单任务,自己 30 秒搞定,却要花几分钟描述+等待+检查。
七、它到底是好帮手还是麻烦源?
一周体验下来,我的结论是:Clawdbot 目前更像一个“潜力巨大但尚未成熟的实习生”。
- 如果你是技术爱好者、有闲置设备、愿意花时间调教,它绝对能成为你的超级助手,尤其是处理大量重复性工作时。
- 如果你是普通用户,只想装上就能躺平享受,那它现在还远远不够傻瓜化,而且成本和风险都太高。
对我个人来说,这一周它确实帮我省下了大概 5-6 个小时的机械劳动时间,也让我体验到了“数字员工”的魅力。但同时也让我在翻车和心疼钱包中度过了不少焦虑时刻。
未来,当模型更聪明、Token 更便宜、安全机制更完善时,Clawdbot 这种本地 AI 助理很可能真正改变我们的工作方式。但现在,它更适合当作一个“极客玩具”来玩,而不是完全依赖的刚需工具。
如果你也想试试,我的建议是:
– 用备用设备或虚拟机
– 先从小任务开始
– 准备好一定的预算和技术耐心
– 永远不要把重要账号和隐私数据完全交给它
这一周的实验结束了,但我还没卸载它。也许下周,我会继续调教它——毕竟,被未来感吊着胃口的感觉,还挺上瘾的。
延展阅读:
淘宝双十一定金是否可以退还?双十一定金是否计入总价?享受狂欢的时候避免麻烦。