近期ChatGPT爆火,其對傳統文字工作的效率提高及總結能力讓使用者驚艷。緊隨其后CodeGPT這樣基于GPT的插件出現,也充分體現了其對代碼編寫效率的提高。而最新GPT-4的發布,是否可以應用到對區塊鏈、Solidity智能合約的審計中呢?
基于這樣的疑問,我們進行了多種可行性測試。
測試環境及測試方法
測試使用的對比模型對象:GPT-3.5(Web),GPT-3.5-turbo-0301,GPT-4(Web)。
代碼片段使用Prompt:HelpmediscovervulnerabilitiesinthisSoliditysmartcontract.
漏洞代碼片段的檢測對比
在此部分,我們分三次測試,使用歷史上常見的漏洞代碼作為測試一和測試二的用例,來驗證其對基礎漏洞的檢測能力,測試三中使用中等難度的漏洞代碼作為測試用例。
測試一
用例:《智能合約安全審計入門篇——Phishingwithtx.origin》
冉小波:算法交易誕生的流動性挖礦推動整個DeFi進入火爆階段:9月4日消息,NULS聯合發起人冉小波在做客《HyperPay焦點》欄目時提及:DeFi大熱,資金都傾向于玩DeFi,反而應該是其他公鏈的一個挑戰。所以公鏈也需要一些結合DeFi的一些創新的玩法了,不然大部分的資金和流量可能都會流轉到一些毫無實際意義項目的流動性挖礦中。這一點相信其他的公鏈團隊應該也感觸頗深。DeFi的分支有很多,各家公鏈也都有在做一些探索,總的來看,推動整個DeFi進入火爆階段的是算法交易誕生的流動性挖礦。近期大熱的項目基本上都是一些新的項目,通過流動性挖礦來進行籌碼的分配,以非常高的收益率來進行高通脹的Token分配,從而吸引大量的資金短時間內快速加入。[2020/9/4]
漏洞代碼:
對GPT進行提問:
GPT-3.5(Web)answer
火幣尖峰對話卡咩:Defi項目的火爆集中在基于Token的金融領域:6月24日下午,在由火幣主辦的火幣尖峰對話“Waiting For ETH2.0”系列AMA活動中,火幣礦池與dForce創始人楊民道、Infstones Head of Bussiness Sili、Stafi&Wetez創始人卡咩、真本聰聯合創始人索老頭就“乘風破浪的以太坊DeFi ”展開主題討論,深度解讀ETH2.0將給行業帶來的重大影響。
在Stafi&Wetez創始人卡咩看來,目前Defi項目的火爆集中在基于Token的金融領域,無論是交易、穩定幣、借貸還是衍生品。他表示,任何基于Token的創新金融業務都有可能是新的引爆點,也會在引爆點后形成更寬的賽道。基于Token的業務將會發展的越來越快,種類會越來越多。在這種情況下,進行組合、重組或者整合的機會就開始變多,而邊緣一些為這些服務提供工具的機會也會出現。[2020/6/24]
GPT-3.5-turbo-0301answer
GPT-4(Web)answer
INT chain主鏈全球公測,答題送20萬INT糖果火爆進行中:為慶祝INT chain主鏈進行全球公測,連續多場贈送糖果活動正在進行中,用戶進入INT官方社群即可進行參與。INT chain是一個基于物聯網區塊鏈的項目,目標是要做一條可以中繼不同的物聯網的公鏈,形成邊緣計算網絡,有效流通資源,加快物聯網普及進度。大幅降低物聯網區塊鏈應用的開發難度,致力于使物聯網區塊鏈內化成如同 TCP/IP 一樣的物聯網基礎架構。INT將圍繞工業制造、無人駕駛、物聯網+區塊鏈避開交通堵塞、公共技術設施和智能城市等應用場景發力。[2018/5/10]
可以看到結果:3個測試版本都發現了關鍵的tx.origin相關問題。
測試二
用例:《智能合約安全審計入門篇——溢出漏洞》
漏洞代碼:
對GPT進行提問:
“區塊鏈大爺”火爆2018全球區塊鏈精英峰會會場:據火訊財經報道稱,4月28日,在2018全球區塊鏈精英峰會會場外,一個頭發花白的大爺吸引了很多人的注意,大爺手持宣傳牌,上面寫著“全球首個保潔鏈-Clean Chain,去中介化的保潔服務與管理”,同時發布需求“求技術合伙人!求交易所聯系方式!”在宣傳語中還表達了保潔行業是人類剛需,與區塊鏈技術相結合勢不可擋的強烈意愿。現場很多人稱其為“區塊鏈大爺”。[2018/4/28]
GPT-3.5(Web)answer
GPT-3.5-turbo-0301answer
GPT-4(Web)answer
可以看到GPT-3.5(Web)、GPT-3.5-turbo-0301都發現了關鍵的Overflow漏洞,出乎意料的是GPT-4(Web)居然沒有相關提示。
德意志銀行高管:比特幣火爆背后,銀行賬戶或將在5年內消失:德意志銀行高管馬庫斯申克認為,現在我們所熟悉的銀行賬戶可能會在短短五年內消失。“科技正在以不同的方式影響我們經營的業務,”申克指出零售銀行業務正“面臨一個全新的正常演變。”[2018/3/23]
測試三
用例:《空手套白狼——Popsicle被黑分析》
漏洞代碼:
對GPT進行提問:
GPT-3.5(Web)answer
GPT-3.5-turbo-0301answer
GPT-4(Web)answer
對比結果,我們可以看到3個版本都未發現關鍵的漏洞點。
代碼片段的檢測總結
可以看到GPT模型對簡單的漏洞代碼塊的檢測能力還是不錯的,但是對稍微復雜一點的漏洞代碼暫時還無法檢測,并且在測試中可以看到GPT-4(Web)的整體上下文可讀性很高,輸出格式清晰、舒服,但是其對代碼的審計能力暫時沒有遠超GPT-3.5(Web)、GPT-3.5-turbo-0301,甚至在部分測試中由于Transformer輸出存在一定的不確定性反而導致GPT-4(Web)遺漏了一些關鍵問題。
對比已知漏洞的全量合約檢測
為了更加契合普通項目方在合約審計中的簡單操作需求,這里我們提高些難度,針對代碼量大的合約進行全量導入上下文,讓GPT-4模型進行審計。
用例:《千萬美元被盜——DeFi平臺MonoXFinance被黑分析》
整份合約分批輸入,在對話最后提出檢測漏洞請求
這里使用Prompt:
Hereisasoliditysmartcontract
Contractcode
Theaboveisthecompletecode,helpmediscovervulnerabilitiesinthissmartcontract.
可以看到,GPT-4雖然在OpenAI公布的信息中其單次輸入字符總數已經是當前最高,但還是會由于文本超長導致在最后提問時GPT會上下文缺失而只識別到部分內容,所以這樣對大型合約而言就無法進行完整的上下文審計。
拆封整份合約,分批輸入分批檢測
這里使用Prompt:
對話1:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段內容1
對話2:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段內容2
對話3:
Helpmediscovervulnerabilitiesinthissoliditysmartcontract.
分段內容3
總結
GPT當前是否適合合約分析
優點
GPT對合約代碼中基礎的簡單的漏洞具備部分檢測能力,并且在檢測出漏洞后會以很高的可讀性來解釋漏洞問題,這樣的特性比較適合為初級合約審計工作者前期訓練提供快速指導和簡單答疑。
存在的問題
a.每次生成內容波動
GPT對每次對話的輸出存在一定的波動,可以通過API接口參數進行調整,但是依舊不是恒定的輸出,雖然這樣的波動性對語言對話來說是好的方式,大大提高了對話給人的真實感。但是這對代碼分析類的工作來說是一個不好的問題。因為為了覆蓋AI可能告知我的多種漏洞回答,我需要多次請求同一問題并進行對比篩選,這無形中又提高了工作量,違背了AI輔助人類提高效率的基準目標。
例如這里再次運行"漏洞代碼片段的檢測對比測試二:
可以看到其輸出結果比之前測試又多了一些額外內容。
b.漏洞分析能力依舊有很大的提高空間
對稍微復雜的漏洞進行檢測即會發現當前的訓練模型不能正確的分析并找到相關關鍵漏洞點。
GPT輔助合約審計的可行性和潛力分析
雖然當前來看GPT對合約漏洞的分析及挖掘能力還處于相對較弱的狀態,但它對普通漏洞小代碼塊的分析并生成報告文本的能力依舊讓使用者興奮,在可預見的未來幾年伴隨這GPT及其他AI模型的訓練開發,相信對大型復雜合約的更快速,更智能,更全面的輔助審計一定會實現。當科技發展可指數級提高人工的效率時就會發生質變,我們非常期待AI對區塊鏈安全的助力,我們會持續關注新AI產品對區塊鏈安全的影響。最后可見的將來我們必將與AI在一定程度上進行融合,愿AI和區塊鏈與你同在。
Tags:GPT區塊鏈APIGPT價格GPT幣區塊鏈工程專業學什么區塊鏈存證怎么弄區塊鏈技術發展現狀和趨勢API價格API幣
前言 2023年Q3的加密市場是各類Layer2爭奇斗艷的競技場,而“傳統”的DeFi和NFT等細分賽道則稍顯沉寂,尤其是在Azuki的自殺式營銷之后.
1900/1/1 0:00:00FTX地震的余波正在一波波向全球蔓延。除了已知的FTX存在的80億美元資金缺口,受波及的還有與FTX和Alameda相關聯的100多家企業,FTX此前重金布局的廣告贊助等合作也紛紛暫停,這是一場.
1900/1/1 0:00:00英國一家科技公司最近宣布為海地的農民建立一個區塊鏈生態系統,在促進銷售的同時,使供應鏈更加清晰。總部位于英國的區塊鏈機構Agriledger負責構建這個新的生態系統.
1900/1/1 0:00:00從去年的DAO經典到更早的NFT經典。本文,為那些尋求理解、深入和構建零知識的人挑選了一組資源:強大的基礎技術,這些基礎技術掌握著區塊鏈可擴展性的關鍵,代表著隱私應用程序的未來,包括加密/web.
1900/1/1 0:00:00黑客松活動表明提交數量的持續增長,只有六分之一的黑客松顯示活動比之前的黑客松有所下降。與以太坊相比,Solana黑客松規模更大,但頻率卻低得多。社交和游戲項目在兩者中都占有重要地位.
1900/1/1 0:00:00世界經濟論壇即將召開的“達沃斯議程”對話會將包括兩個關于加密貨幣的會議,這是數字資產已經滲透到主流意識的又一個引人注目的跡象。會議將于周一和周四舉行,主題是“重置數字貨幣”.
1900/1/1 0:00:00