Skip to content
0

AI Agent 不是玩具,是工具人

如果要用人格类型解释我为什么会这样用 AI,我大概是很典型的 INTJ 式工具观

我不太把 AI 当成陪聊对象,也不太在意它会不会给情绪价值。我更关心的是:它能不能进入系统、能不能减少重复劳动、能不能把结果交付出来。

AI Agent 工具人开发工作流

对我来说,一个工具值不值得长期用,不看它多新,而看它能不能被纳入我的流程。

我对 AI 的期待一直很简单:

少说废话,直接把事做完。

如果一个 AI 只能陪聊、写几句文案、给一堆建议,那它对我有用,但用处有限。

真正让我觉得有价值的,是它能不能进入我的真实工作流:

  • 看本地文件
  • 修改代码
  • 跑构建
  • 查日志
  • 处理 Git
  • 写文章
  • 推送博客
  • 记住我的偏好
  • 出问题自己继续排查

做到这些,它就不只是聊天机器人,而是工具人。


我不需要“建议”,我需要执行

很多 AI 回答最大的问题,是喜欢把事情讲成教程。

比如你让它配置一个东西,它会说:

  1. 你需要创建一个文件
  2. 然后复制以下内容
  3. 再运行这个命令
  4. 如果报错你可以检查……

这当然没错,但不够。

如果它已经有权限操作文件和终端,那它就应该直接创建、直接修改、直接运行、直接验证。

我不想听“你可以怎么做”。

我想要的是:

我已经做了,验证结果如下。

这就是普通问答 AI 和 Agent 的区别。

前者给答案,后者交付结果。


真正有用的 Agent 必须会验证

一个不会验证的 Agent,很容易变成高级甩锅机。

它能生成代码,但不知道代码能不能跑。

它能说“已修复”,但没看日志。

它能说“已发布”,但没确认 Git push 成功。

它能说“页面正常”,但没打开页面,也没看截图。

这种 AI 看起来很勤快,实际上会制造更多工作量。

因为你还要替它验证。

所以我现在判断一个 Agent 靠不靠谱,不看它话说得多漂亮,而看它有没有形成闭环:

接任务 → 查现状 → 动手改 → 跑测试/构建 → 看结果 → 失败继续修 → 成功再汇报。

少了验证,前面做再多都不稳。


本地化工具才是真生产力

AI 真正好用的地方,不是云端回答一句话,而是能连接到我的本地环境。

因为真实工作都在本地:

  • 项目文件在电脑里
  • 配置在 .env
  • 博客仓库在磁盘里
  • 日志在服务器或 WSL 里
  • Git 状态要现场看
  • 构建结果要现场跑

如果 AI 看不到这些,它只能猜。

而我最讨厌的就是猜。

能读文件、能跑命令、能改代码、能看日志,AI 才能从“建议者”变成“执行者”。

这也是我为什么会折腾 Hermes、Telegram、WeChat bot、本地博客、自动化脚本。

不是为了酷。

是为了把 AI 放进我真正做事的地方。


Agent 最适合做重复但烦的事

我不指望 AI 替我决定人生。

但我很愿意让它做这些事:

  • 检查文章格式
  • 扫描图片路径
  • 生成封面草图
  • 跑构建
  • 查为什么服务没回消息
  • 根据日志定位问题
  • 写 commit message
  • 推送仓库
  • 总结改动

这些事不一定难,但烦。

而且越烦的事,越容易因为懒而跳过。比如验证、检查、整理、记录。

AI Agent 的价值,就是把这些容易被人省掉的步骤补上。

前提是你要要求它补上,而不是允许它说一句“应该可以”。


好的 Agent 应该越来越懂你

我不希望每次都从零解释我的偏好。

比如我喜欢:

  • 回复短一点
  • 直接做
  • 不要假装完成
  • 出错说实话
  • commit message 写清楚
  • 配置改完要重启验证
  • 博客推送前要 build

这些东西如果每次都要重新说,那 AI 就还停留在一次性工具。

真正适合长期使用的 Agent,应该有记忆、有习惯、有技能。它应该逐渐知道我在意什么,也知道哪些错误我不能接受。

这不是为了让 AI 更像人。

是为了让它更像一个熟练工。


一句话收尾

AI Agent 的价值,不是更会聊天,而是更能把事情闭环。

能查、能改、能跑、能验、能推,才是我愿意长期用的工具人。

最近更新

基于 VitePress + Teek 搭建