買比特幣 買比特幣
Ctrl+D 買比特幣
ads
首頁 > MEXC > Info

COD:以太坊智能合約逆向分析與實戰:(5)深入EVM之合約的部署與調用_ODE

Author:

Time:1900/1/1 0:00:00

當我們部署和調用合約的時候,EVM 都在做些什么?

如果你開發過以太坊智能合約,想必你應該熟悉這樣的操作 (此處以remix為例) :

編寫solidity代碼 -> 編譯 -> 部署-> 交互 。合約的編寫與部署似乎并不是一件很麻煩的操作:編寫階段就不說了,Solidity語言大家都應該會;到了編譯階段,本地的 solc 編譯器會把 Solidity 代碼編譯成字節碼(bytecodes);而在部署階段,部署者通過發起一筆特殊交易(to的地址為空)calldata 帶上編譯后的字節碼,等交易上鏈之后,就完成了合約的部署;而合約交互,就是call合約里的某個函數,等待函數的響應和返回,一切就是這樣的簡單。

但是正如開車一樣,當你踩住油門后,車輛開始前進。然而這看似簡單的操作背后是汽油爆燃、活塞往復、數百個齒輪嚙合傳動、輪胎與地面滾動摩擦的復雜行為。部署和調用合約也是如此,它涉及到 EVM 的堆棧操作,內存讀寫,存儲訪問等一系列底層操作。當部署合約時, EVM 把收到的 calldata 翻譯成操作指令,把它們按照給定的長度和參數讀入內存;當調用合約時,EVM 又根據收到的 calldata ,通過函數選擇器來確定調用哪一段代碼,并返回數值。如果只講理論未免過于枯燥,為了便于講解,我們這次用 ethernaut 的一道題目作為例子,詳細了解 EVM 是如何部署和運行合約的,以及如何充當人肉編譯器,徒手編寫智能合約。

以太坊網絡持幣多于0.01ETH地址數創歷史新高:12月19日消息,據 Glassnode 數據顯示,當前以太坊網絡持幣多于 0.01ETH 地址數達到 20,106,666 個,創歷史新高。[2021/12/19 7:48:41]

這個題目是這樣的:我們需要部署一個合約,當我們調用合約 **whatIsTheMeaningOfLife()**函數的時候,它需要返回一個數字 “42”。看起來很簡單對吧?我們分分鐘編寫完畢:

慢著,題目后面還有個小小的附加要求:“所部署的合約大小不超過10個操作碼”。好吧,這個要求的確夠“小”,要知道連合約頭部的 “函數選擇器” 都不止 10 個操作碼好吧?可是“函數選擇器” 是什么,為什么會出現在合約里面呢?帶著你的疑問,繼續向下看。

我們通過 ./solc --asm --bin target.sol 來看看這個合約的最終編譯結果:

608060405234801561001057600080fd5b5060b68061001f6000396000f3fe6080604052348015600f57600080fd5b506004361060285760003560e01c8063650500c114602d575b600080fd5b60336047565b604051603e91906067565b60405180910390f35b6000602a905090565b6000819050919050565b6061816050565b82525050565b6000602082019050607a6000830184605a565b9291505056fea26469706673582212206ef8c7b5177952a701b3b46b69cb3ec296f4c54c946692e8ec901f5e43c1e78a64736f6c63430008110033

以太坊開發商 Virgil Griffith 對朝鮮制裁案中的陰謀指控認罪:9月27日消息,被控違反美國制裁法的以太坊開發商 Virgil Griffith 已在與聯邦檢察官達成的協議中認罪,Griffith周一在紐約一家法院對一項串謀指控認罪。認罪協議可能會使他服刑 63 至 78 個月。他將面臨 2022 年 1 月的量刑聽證會。(Coindesk)[2021/9/28 17:10:51]

這么一大坨十六進制數據,就是上述 Solidity 程序編譯之后的字節碼。當我們部署合約時,把這一堆 data 發給以太坊節點,等廣播完成后,合約就部署完畢了。這是 solc 編譯器編譯 Solidity程序得到的代碼,看似雜亂無章的的數據,其實都是和 opcodes 一一對應的。我們來一段一段地看這些代碼:

合約部署代碼:

合約運行代碼:

auxdata:

我們先簡單地把這堆代碼分為合約的部署代碼、運行代碼、auxdata 三部分,如何理解這三種代碼呢?我覺得可以理解為向太空發射衛星:“部署代碼” 就是運載火箭,而“運行代碼”就是衛星。運載火箭只在發射衛星時才起到作用,一旦衛星進入軌道,火箭就廢棄了,只留下衛星在太空中與地球通信。 部署合約也是如此,在部署合約時,部署代碼把一些初始化工作作完之后,就把合約的運行代碼送入EVM,只留下運行代碼在鏈上與用戶進行交互。 (至于auxdata,它是緊跟在runtime代碼后面的43個字節,相當于源碼的指紋,可以用來驗證。這只是數據,并不會被EVM執行。)

以太坊2.0合約質押新增3.53萬ETH:據歐科云鏈OKLink數據顯示,截至上午10時,以太坊2.0存款合約地址已收到604.22萬 ETH,占當前以太坊供應量的5.19%,近24小時新增35360 ETH。[2021/7/2 0:22:01]

那么言歸正傳,我們題目要求我們合約運行代碼的 opcedes 不超過 10 條,那么,這段代碼對應的 opcodes 是多少條呢?答:71 條。(通過查看 Remix : ./artifacts/MagicNum.json 中的 bytecode 里的 opcodes 可以看到。而 deployedBytecode 里的 opcodes 卻是 92 條,因為它的長度是 部署代碼 + 運行代碼 )

那么問題來了,如何把 71 條 opcodes 精簡到 10 條以內呢? 這就需要我們對 EVM 運行智能合約的方式有著一定的了解。如果不了解也沒關系,拿起你手邊的 EVM 指令集 ,我們一起來看看吧:

首先我們要知道,EVM 執行代碼時是按照自上而下的順序執行的,代碼中沒有其他入口點,始終從頂部 (也就是第一行 opcode ) 開始執行。(這點和 Windows 軟件不一樣,PE文件是有固定的入口點的,而且不同的 Windows 版本或不同的 PE 文件 入口點也會有所不同)。也就是說,當我們部署合約時, EVM 會從第一個bytecode開始讀起。

數據:以太坊2.0驗證者數量已超10萬:數據顯示,以太坊2.0驗證者數量已超10萬,存款合約地址已收到超320萬枚ETH(3,208,226),占ETH供應量的2.8%。[2021/2/23 17:43:34]

所以我們看字節碼最前面的部分,也就是它的部署代碼:608060405234801561001057600080fd5b5060b68061001f6000396000f3fe

對照 EVM 指令,我們可以識別出這段代碼的含義:

然后我們看合約的運行代碼:

綜合以上可以發現,合約的運行代碼的架構是這樣的:

HashQuark首期搭建1000個以太坊2.0驗證節點:北京時間2020年11月24日上午10時許,以太坊2.0存款合約地址已達到了創世區塊啟動的最低要求524.288枚ETH,這意味著以太坊2.0將于12月1日如期啟動。作為最大的PoS服務商之一,HashQuark已接受用戶委托的逾3萬枚ETH,首批搭建1000個以太坊2.0驗證節點。通過HashQuark推出的企業級Staking服務 EtherPocket Pro,企業用戶可實現“一鍵化”節點搭建和節點可視化管理。HashQuark也推出了理賠方案,增加了用戶資產的安全保障。

HashQuark作為專業的Staking生態服務商,提供安全、便捷、穩定的企業級基礎設施服務。[2020/11/24 21:58:35]

初始化操作、函數選擇器這些,是 solc 在編譯 Solidity 程序的時候自動生成的。如果我們砍掉這些復雜的東西,直接把我們想要的核心功能編碼上去,不就可以在 10 條以內opcodes 實現既定功能了嗎?

通過分析 圖4 的 whatIsTheMeaningOfLife() 函數調用棧可以得知,讓智能合約返回 “42” ( 十六進制 0x2a) 的關鍵在于 先用 mstore 指令將 0x2a 放入 Memory , 再用 return 指令將內存里的 0x2a 返回即可。至于那些函數名稱和函數簽名,只是高級語言的編譯產物,直接用匯編實現的話,我們直接用這段代碼讀寫內存,完全沒有必要搞那些花里胡哨:

以上代碼相當于構造了一個十分小的合約“運行代碼”。前面我們說過,EVM 執行代碼時是按照自上而下的順序執行的,代碼中沒有其他入口點,始終從頂部 (也就是第一行 opcode ) 開始執行。而且我們編寫的代碼并沒有函數選擇器,也就是說,當外部賬戶調用該它時,無論傳遞給它什么樣的參數、什么樣的函數簽名, EVM 都只會從它的 [00] 處開始執行,老老實實地走到 [09],然后 return 給我們一個 0x20.

但這只是運行代碼,還記得本文開頭說的那三段字節碼嗎?是的,我們還差一個“運載火箭”(部署代碼),把這段運行代碼給發射出去:

部署代碼的結構基本沒怎么變,之前已有解析,此處就不羅嗦了,唯一的區別是把復制到內存的長度由 b6 改為 0a  : 608060405234801561001057600080fd5b50600a8061001f6000396000f3fe

然后把他們拼接到一起,記得部署代碼在前、運行代碼在后,最后我們把這段代碼發射出去就 OK了:

你將得到一個超級小巧、只有 10 個字節、無論傳遞什么參數都 只 會 返 回  42  的 “智能合約” (這么說看起來并不智能的樣子……)

全文完。

關于作者:

https://twitter.com/0xNezha

來源:bress

Bress

個人專欄

閱讀更多

金色早8點

Odaily星球日報

潘達看Web3

DeFi之道

區塊律動BlockBeats

比推 Bitpush News

Tags:以太坊ODECODECOD以太坊價格今日行情走勢分析Indinodecode幣的發行價

MEXC
區塊鏈:Web3咖啡館見聞:狂熱、暴富、落寞 欲望永不打烊_web3.0幣現價多少錢

走出五道口地鐵站,穿過酒吧一條街,經過一條林蔭小道,不遠處是一家咖啡館。它夾在電動車店和房產中介門店之間,灰色的墻面、黑色的logo、白色的店名,和四周閑適的氛圍,劃開一條硬朗的分割線.

1900/1/1 0:00:00
WEB:Web3 域名有價值嗎?從 OpenSea 下架 Twitterscan.nft 風波談起_WEB3

吳說作者 | @defioasis本期編輯 | Colin Wu近日 Twitterscan 頂住壓力開啟了其 .nft 的注冊和鑄造.

1900/1/1 0:00:00
ROLL:Celestia數據可用性_CEL

本文由CFG Labs 核心團隊和W3 Hitchhiker共同完成編譯,大部分內容截取于9月15日晚第十次Office Hour作者介紹:W3 Hitchhiker,一個獨立的加密研究團隊.

1900/1/1 0:00:00
NBS:EVM 深入探討 Part 2_nbs幣最新消息

點擊閱讀:EVM 深入探討 Part 1 導語 在第 1 部分中,我們探討了 EVM 如何通過被調用的合約函數知道需要運行哪個字節碼.

1900/1/1 0:00:00
CBD:支付系統:分布式賬本環境中的流動性節約機制_Ocean Swap Bridge

本文專注于分布式賬本技術及Stella項目的運行效果。分布式賬本技術(DLT)是一套記錄數據的工具,如資產持有量或金融交易,允許計算機網絡在沒有單一中央管理系統的情況下進行驗證和存儲更新.

1900/1/1 0:00:00
ETH:Tether、鏈下穩定幣和合成加密泡沫_eth怎么轉到交易所

這就是加密愛好者會告訴您的關于加密貨幣的未來前景。然而,正如目前的情況所示,如果穩定幣造成的一些短期問題沒有得到很好的解決,加密貨幣可能真的是在月球上使用的貨幣.

1900/1/1 0:00:00
ads