
英國AI Security Institute與美國派拓網路的最新分析指出,Anthropic的Claude Mythos Preview和OpenAI的GPT-5.5等前沿AI系統,已在網路安全任務上展現出乎意料的自主能力,其成長速度遠超專家預期,並能獨立執行複雜的網路攻擊模擬,迫使各組織需立即升級防禦措施。
根據英國AI Security Institute(AISI)與美國派拓網路(Palo Alto Networks)近期發布的獨立分析報告指出,前沿人工智慧(AI)系統已達到全新的自主網路安全能力水準,其進步速度超乎專家追蹤的所有基準。這些發現揭示了AI技術在網路安全領域的突破性進展,並對現有威脅防禦構成新的挑戰。
分析顯示,Anthropic的Claude Mythos Preview模型與OpenAI的GPT-5.5模型,在網路安全任務上的表現已超越先前預測的能力成長趨勢。研究人員坦言,目前尚無法判斷這項飛躍是暫時性異常,抑或代表著永久性的加速。這些研究聚焦於AI系統獨立執行複雜網路安全任務的效率,包括弱點偵測、逆向工程、漏洞利用鏈建構以及多階段攻擊模擬。
研究人員指出,AI能力發展的推進速度是以月而非年來衡量,大幅壓縮了對進階AI網路能力演進速度的預期。AISI研究人員在2025年末曾估計,AI執行網路安全任務的效能每八個月會翻倍;然而,至2026年2月,此預估值已加速至約每4.7個月翻倍。Claude Mythos Preview與GPT-5.5模型的表現,甚至超越了這些更新後的預測,顯示目前的預測模型可能低估了AI能力成長的步伐。
在結構化的網路靶場測試中,Claude Mythos Preview成為首個完整完成AISI兩項模擬企業攻擊環境的AI模型。其中一個名為「The Last Ones」的情境,涉及32個步驟的企業網路入侵;另一個「Cooling Tower」情境則在此前未曾有任何AI系統能成功解決。GPT-5.5模型也在相同的環境中展現了顯著的自主攻擊能力。派拓網路亦透過AI輔助測試,在超過130項產品中發現了75個安全問題,對應到26個常見漏洞與揭露(CVE),大幅超越其正常每月的發現率。該公司形容最新的AI模型在識別弱點並將其升級為可利用的攻擊鏈方面,具備卓越且近乎即時的能力。
AISI承認,其現有的評估框架正逐漸變得不足,因為部分模型在現有約束條件下表現過於出色。該機構提到,若不設「token cap」(符記限制),模型成功率將高到使得有意義的「時間尺度」計算變得難以進行。研究人員也坦言,其最長僅限12小時的測試,可能已無法揭露模型可靠性實際失效的臨界點。AISI和派拓網路均強調,企業組織應立即強化基礎網路安全控制、縮小暴露的攻擊面、加速修補週期,並改進自動化偵測與回應系統。研究人員警告,AI驅動的網路攻擊可能很快就會在數分鐘內完成,而非數天或數週,這將徹底改變事故回應的預期。

