AI 能終結 UI 自動化的噩夢，還是讓我們掉入「瞎猜」的陷阱？

作者：act

刊登時間：April 13, 2026

作者：柯仁傑（三叔公）

在軟體測試圈，UI 自動化（UI Automation）一直是大家又愛又恨的技術。傳統工具（Selenium, Cypress）太脆弱，前端改個 ID、網路稍微延遲，測試就崩潰。最近 AI Agent 框架和工具大紅，有些號稱能「自我修復」並解決所有 Timeout 問題，這真的代表 RD 與測試工程師從此能高枕無憂嗎？

我認為，這背後隱藏著一個巨大的「信任危機」。

當 AI 幫你「撐過」測試，它可能是在幫軟體遮醜

傳統腳本失敗是因為它「笨」，但笨得很老實。而 AI 的核心邏輯是機率與推理，這帶來了幾個致命問題：

1. 它是「精準定位」還是「靠賽盲猜」？

當 AI 發現原本的按鈕 ID 變了，它會根據語意（視覺或文字）去找「看起來最像」的東西點下去。如果開發者不小心誤植了兩個相似的按鈕，AI 可能點了錯誤的那個，卻回報測試成功。這種「誤判」比直接報錯更可怕，因為它掩蓋了真正的 UI 迴歸。

2. Timeout 的消失：智慧等待還是效能殺手？

AI 確實能觀察頁面加載狀態，不會死板地報時限錯誤。

如果頁面載入從 2 秒退化到 10 秒，AI 透過「智慧重試」最後成功點擊了。對 AI 來說測試通過了，但對用戶來說效能已經崩潰。AI 正在無形中拉長測試回饋循環，並讓我們對系統的遲鈍變得麻木。

3. 不可重現的「黑箱測試」

科學測試講求可重現性。但 AI Agent 的行為具有機率性，今天成功不代表明天能用同樣的路徑成功。當測試結果變得像「抽籤」，團隊對測試報告的信任度就會降到冰點，最終淪為狼來了效應。

我們該如何正確看待 AI 輔助測試？

我們不必否定 AI 的潛力，但要認清它無法從物理上消除 UI 的不穩定。它把原本「脆弱的玻璃」變成了「有彈性的橡膠」，但橡膠拉久了還是會斷。

目前最務實的 AI 應用策略：

從「接管」轉向「診斷」： 讓 AI 發現問題後，回報「我猜這個按鈕變了」供人類確認，而非私自修改腳本。
拒絕掩耳盜鈴： 即使有 AI 輔助，Timeout 的監控依然重要。我們需要 AI 區分「那是 DOM 結構改變」還是「後端 API 效能退化」。
回歸測試金字塔： 無論 AI 多強，UI 測試依然應該保持精簡。核心邏輯應鎖定在更穩定的 API 測試，而高階的觀察則留給 Exploratory Testing（探索性測試）。

AI 確實能接手大量的執行工作，但「品質決策」的責任依然在人身上。在 Agent 時代，RD 的價值不再是寫幾行 Selector，而是如何編排這些 AI 工具，並保持對系統細微變化的敏銳度。

你認為讓 AI 幫你「修復」測試腳本是省時，還是增加了未來維護的風險？

文章標籤

你有敏捷的想法或實務經驗想分享嗎？
歡迎投稿加入我們的知識庫！

聯絡我們

協會簡介

敏捷活動

敏捷知識庫

專家黃頁

成為會員

聯絡我們

act@act.club.tw
115臺北市南港區園區街3之1號11樓之1
（軟體園區二期G棟）

AI 能終結 UI 自動化的噩夢，還是讓我們掉入「瞎猜」的陷阱？