很多公司现在都有同一種压力:网站要改、App 要加功能、内部系统要接新報表,客戶服務和销售团队又不断提出小修改。以前最大的限制是开发人手不足;现在 AI coding agent 可以帮手讀 code、写 function、改测试、甚至准备 pull request。速度看起來快了,但如果没有管理方法,问题也會快很多地累积。
Gartner 在 2026 年 5 月 20 日指出 enterprise AI coding agents 市场进入新一轮扩张和竞争重整。OpenAI 亦在 2026 年 5 月 22 日提到 Codex 在 enterprise governance、sandboxing 和 flexible deployment options 等方面获得 Gartner 评估。这些讯号代表 AI coding agent 已经不只是开发者個人辅助工具,而是企业软件交付流程的一部分。
先分清楚哪些任务可以交给 AI,哪些必须由人决定
AI coding agent 很适合处理明确、可测试、低风险的任务。例如网上预约系统要新增一個 email template、CRM 导出報表要多一個栏位、后台表單要加入必填检查。这些任务范围清楚,完成后可以用测试和人工 review 验证。
但涉及付款逻辑、权限规则、客戶资料处理、折扣計算或合約承诺的功能,就不应讓 AI 自行决定。以 eShop 為例,AI 可以草擬「订单状态通知」的程序修改,但不能自行改變退款条件或付款 gateway 流程。产品负责人和技術负责人仍要批准业务规则。
每个 AI 任务都要有清楚的 brief
如果只对 AI 说「幫我改这个 bug」,输出很容易偏離真实需要。较好的做法,是把工作写成簡短但完整的 brief:现时问题、期望結果、不可改动的地方、测试方法和回滚方式。
例如内部管理系统的報表日期显示错误,brief 可以写明:「只修正月結報表的日期范围显示,不改资料庫 schema,不改其他報表;完成后要确认 2026 年 5 月和跨月份资料显示正確。」这样 AI coding agent 的工作范围會窄很多,review 亦更容易。
Pull request 不应因為是 AI 写的就放松
AI 令开发速度加快,並不代表 review 可以減少。相反,越快产生程序碼,越需要更稳定的检查流程。香港中小企常見的网站、App、CRM、booking system 或 payment workflow,都可能牵涉客戶资料和收入流程,一個小错误都可能造成服務中断。
实際做法是要求 AI 產出的修改必须经过 pull request。PR 內应列出改了哪些文件、影响哪些流程、测试結果是什麼。技術同事 review 時,不只看程序能否运行,也要問:有没有改到不相关功能?有没有把敏感资料写入 log?有没有破坏手機版或多语言内容?
把测试變成 AI 工作的一部分
AI coding agent 不应只负责写 code,也应协助補测试。以 booking system 為例,如果 AI 加入「取消预约后自动發通知」功能,它也应補上基本测试:取消成功會發通知、已过期预约不能取消、没有 email 的客戶不會令流程崩溃。
对没有完整自动化测试的中小企,也可以先建立较轻量的驗收清单。例如 App 改动后,必须检查登入、付款、预约、推送通知和繁簡英三語主要頁面。AI 可以帮手整理检查步骤,但最终是否通过仍要由人确认。
权限和环境要分層,不要讓 AI 直接碰 production
AI coding agent 可以提升效率,但不应直接拥有 production database、付款系统或客戶隐私资料的无限制权限。较稳妥的设计,是讓 AI 在 sandbox、development 或 staging 环境工作,只讀必要的程序碼和假资料。
例如一間教育中心想用 AI 修改報名系统,AI 可以在测试环境中读取程序碼、建立修改和跑测试,但不能直接连接真实学生资料庫。部署到 production 前,仍要经过人手批准、备份确认和 release note。这样即使 AI 改错方向,也不會立即影响客戶。
供应商和内部团队要共享同一套开发记录
很多香港企业的软件不是完全由内部团队维护,而是由外判公司、freelancer 和内部 IT 一起处理。當 AI coding agent 进入流程,如果没有统一记录,很容易出現「谁改了什麼」说不清的情况。
建议把任务、PR、测试、部署和回滚记录放在同一套工具內。即使 AI 产生了大部分修改,负责人仍要在任务上留下决策原因。例如「這次只改前台显示,不改付款 API」、「这个 bug 暂时用 hotfix,下一版本重构」。日后维护時,团队才不會只看到一堆看似正確但無背景的程序碼。
30 日导入清单
第一星期,选三類适合 AI 协助的低风险任务,例如 UI 小修、報表格式、测试补充或文件整理。
第二星期,建立 AI 任务 brief 模板,要求每个任务写明范围、不可改动内容、测试方法和负责 reviewer。
第三星期,把 AI 產出的修改全部放入 pull request,並加入安全、资料、手機版和多语言检查项目。
第四星期,检视成果:开发交付是否更快、bug 有否增加、review 時間是否可控、部署是否仍然稳定。通过后才逐步擴展到较复杂功能。
结语:AI 可以加快开发,但流程决定結果
AI coding agent 的價值,不是讓企业跳過软件工程纪律,而是讓团队更快完成清楚定義、可测试、可審批的工作。对香港公司來说,真正重要的是建立一套「AI 可参与,但不能失控」的交付流程。
