用AI协作写代码,我做了一个自动化测试工具 | AutoClick 项目实录
这段时间,晚上下班回家,我没有选择刷剧、打游戏,而是做了一件既轻松又有点意思的事:测试 AI 编程的可行性。
我没有“全权托付”给 AI,也不是整晚死磕写代码,而是用了一种非常自然的方式:有点像有人在和你聊天,你只需要时不时回一句,指明一下方向,他就能继续往下做。这就是我和 Codex 的工作模式:我说思路,AI写代码,我再评估与修正。
于是,就有了这个小项目:AutoClick - 一个轻量的自动化点击工具。
📌 项目简介:AutoClick 是什么?
AutoClick 是一款基于 Python + OpenCV 开发的图像识别类自动化工具,目标是帮助用户高效完成重复的鼠标点击与测试工作。支持多平台运行(Windows、Linux、macOS),拥有完整的图形界面,已经能独立胜任一些基础的桌面自动化任务。
它能做的事情包括:
- ✅ 基于 ORB 的图像特征匹配,用于精准识别屏幕区域;
- 🔁 匹配失败时自动回退到模板匹配,增强容错能力;
- 🖼️ 截图剪裁创建模板,内置轻量图像编辑界面;
- ⌨️ 全局热键触发搜索与操作,无需切换界面;
- ❌ 支持模板删除、替换与列表管理;
- 🍎 在 macOS 上需在“隐私与安全 → 辅助功能”中授权 Python 控制鼠标键盘。
项目主页:
👉 https://github.com/KeyleXiao/AutoClick
🤖 AI 编程的正确打开方式:你是“总指挥”,AI是“执行兵”
这个项目的最大亮点,其实不是它实现了什么功能,而是它是 AI 辅助开发的产物,从立项到落地我几乎没有专门“抽时间写代码”,而是利用零碎时间,和 AI 对话、沟通、让它生成代码、再测试、再纠正。
我得出一个有意思的结论:
AI时代,人人都可以是项目经理,但并不是人人都能单兵作战。
AI 很擅长执行,写细节、封装逻辑、补全函数、改UI、加配置……这些它样样精通。但前提是:你要懂你在做什么。
你要能告诉它你需要什么样的识别逻辑、哪个模块该怎么连接、为啥要用 ORB 而不是别的特征算法。否则你得到的只是一个代码堆砌的“黑盒”,根本无法维护。
🧭 掌控全局:人类开发者的核心价值
这就像一个项目里,如果你只能说“我想实现某某功能”,却不懂技术、不懂数据结构、不知道系统之间如何通信,那你就只是一个“提需求的人”。
但在 AI 时代,你如果掌握全局业务逻辑,并能选用熟悉的技术栈,比如 Python,那么你就是一个真正有掌控力的指挥官:
- 你能把复杂的问题拆成具体任务;
- 你能判断代码的风险点和未来可扩展性;
- 当 AI 写出有 bug 的代码时,你能快速锁定出错方向;
- 最重要的是:你知道**“这个工具该长成什么样”。**
⚠️ 写在最后的提醒:技术栈选错,等于全盘皆输
在这个项目里我就明确选择了 Python 作为基石语言。为什么?
因为我熟。熟意味着我能看懂 AI 写出来的东西,能判断逻辑是否合理,能补漏洞,也能重构。而不是每次出错都要重新向 AI 求助,却连错误是啥都说不清。
所以我非常建议:
用你最熟的语言,做你最懂的事,然后让 AI 成为你最强的外援。
✅ 总结几条经验:
- AI 是很棒的执行者,但它需要你指路;
- 懂业务的人适合当指挥者,但必须有技术支撑;
- 用你熟悉的技术栈,不要把AI生成的代码变成你的恐惧来源;
- 最理想的模式是:你主导架构,AI生成细节,你持续校验和迭代。
如果你对 AI 编程、桌面自动化、图像识别有兴趣,欢迎 Fork 项目试试看:
🔗 AutoClick on GitHub
或者你也可以把自己的业务流程交给 AI 帮忙实现一遍,看看你是否具备“带队写代码”的能力。这个时代,真的已经不同了。
本文标题:用AI协作写代码,我做了一个自动化测试工具 | AutoClick 项目实录
文章作者:Keyle
发布时间:2025-06-08
最后更新:2025-06-08
原始链接:https://vrast.cn/posts/23562/
版权声明:©Keyle's Blog. 本站采用署名-非商业性使用-相同方式共享 4.0 国际进行许可