6 月 2 日消息,據(jù)外媒 The Decoder 1 日報道,Palisade Research 最近舉辦的一系列網(wǎng)絡(luò)安全競賽表明,AI 智能體已具備與人類黑客正面較量的能力,甚至在部分場合中勝出。
研究團隊在兩場大規(guī)模的 " 奪旗賽 "(CTF)中對 AI 系統(tǒng)進行了實戰(zhàn)測試,數(shù)千名選手參與角逐。在這類比賽中,參賽隊伍需通過破解加密、識別漏洞等方式解決安全難題,找到隱藏的 " 旗幟 "。
測試的目的是檢驗 AI 智能體能否與人類隊伍抗衡。結(jié)果顯示,AI 的表現(xiàn)遠超預(yù)期,大多數(shù)參賽 AI 都超過了人類選手的平均水平。
參賽的 AI 系統(tǒng)復(fù)雜程度各不相同。有的團隊如 CAI 花費約 500 小時打造專屬系統(tǒng),也有像 Imperturbable 團隊僅花 17 小時就通過優(yōu)化現(xiàn)有模型 EnIGMA 和 Claude Code 的提示詞參賽。
在首場名為 "AI vs. Humans" 的比賽中,六支 AI 團隊與約 150 支人類隊伍展開比拼。所有選手需在 48 小時內(nèi)完成 20 道密碼學與逆向工程題目。
七個參賽 AI 中有四個成功破解了其中 19 道題。排名最高的 AI 團隊位列總榜前 5%,整體表現(xiàn)優(yōu)于大多數(shù)人類選手。比賽題目均可在本地運行,降低了 AI 的技術(shù)門檻。
盡管如此,部分經(jīng)驗豐富的人類選手依舊不落下風。有選手指出,自己曾參加多支國際強隊,豐富的 CTF 實戰(zhàn)經(jīng)驗和對常用解題策略的熟悉,是他們保持競爭力的關(guān)鍵。
第二場 "Cyber Apocalypse" 則難度大幅升級。AI 智能體需面對全新題型,并與近 18000 名人類玩家同臺競技。62 項任務(wù)中,不少要求與外部服務(wù)器進行交互,對主要依賴本地計算的 AI 系統(tǒng)提出挑戰(zhàn)。
從報道中獲悉,本場共有四個 AI 智能體參賽,其中 CAI 表現(xiàn)最佳,完成了 20 項任務(wù),排名第 859 位,位列全部參賽隊伍前 10%、活躍隊伍前 21%。Palisade Research 表示,該 AI 系統(tǒng)的表現(xiàn)超過了約 90% 的人類團隊。
研究人員還分析了 AI 所破解題目的難度。以人類頂尖隊伍解題所需時間為參考,發(fā)現(xiàn) AI 有 50% 成功率解出人類高手也需約 78 分鐘才能破解的題目。換言之,AI 已具備解決高難度問題的能力。