Findora優化其在EVM層的TPS
編者注:本文是根據Findora的多位工程師的意見撰寫的,并不代表一個人的努力。這是Findora優化其在EVM層的初步成果,不久還會有更多的優化。
介紹
Findora區塊鏈是UTXO和EVM分類帳的組合,通過稱為PrismTransfer的原子橋連接在一起。Findora的目標是通過擴展以太坊隱私來創建一個基于區塊鏈的內置隱私的新金融互聯網。并通過先進的ZK密碼學和SNAKRS來保護公鏈上的交易數據。
因此,雖然隱私是Findora的主要關注點,但可擴展性也必不可少——如果沒有足夠的帶寬,網絡就無法為多個生態系統提供隱私保護。
然而,雖然一些項目追求每秒10,000+筆的交易速度,但現實情況是許多項目并不需要如此高的TPS。絕大多數TVL存在于Ethereum和Bitcoin上,它們的TPS分別約為每秒15和6左右。
因此,高TPS是重要的但不是必要的,尤其是在剛開始。例如,Avalanche的理論TPS為4,500,但實際很少超過9TPS。
在過去的兩個月中,Findora開發團隊成功地將其EVM層的TPS提高了近4倍,達到了150左右——這足以承載它在未來將面臨任何負荷。
大部分優化來自:
并行化TendermintABCI
使用讀寫鎖代替唯一鎖
增強交易檢查邏輯
優化冗余序列化
本文將介紹實現這些優化的科學過程,并重點介紹一些突出的優化領域。希望通過分享我們在過去3個月進行的優化分析、執行和測試的技術細節,使其他使用EVM的團隊可以充分利用我們所作的工作,并復制和擴展我們的成果。
方法論概述
我們相信,測試和提高性能的最佳方法是使用科學的方法:測試環境、分析結果、部署修復程序,然后重復。因此,我們將優化過程分為5個步驟:
測試
測試結果收集
分析
Terawulf已為其核動力比特幣挖礦設施Nautilus提供50兆瓦的電力:4月21日消息,比特幣礦業公司Terawulf宣布全面部署其在核動力Nautilus Cryptomine設施中50兆瓦(MW)的份額。據該公司稱,該比特幣挖礦設施由100%核電供電,每千瓦時(kWh)的固定電力成本為0.02美元。Terawulf可以選擇再增加50兆瓦,并計劃在“未來階段”實施。此外,Terawulf計劃在2023年第二季度達到5.5 EH/s的運營挖礦能力。此前3月初消息,TeraWulf的核動力比特幣挖礦設施已開始運營。(Bitcoin.com)[2023/4/21 14:18:21]
結果分析
更新代碼并再次部署
通過簡化和去除冗余,我們縮短了交易時間,提高了效率。隱私交易比透明交易需要更多的計算能力。盡管網絡必須能夠承載足夠的負荷才能在現實世界的應用中使用,并且可擴展性是一個關鍵目標,但FindoraNetwork仍認為它的重要性次于隱私。
大部分TPS的優化來自快速累積的小改進。例如,團隊通過優化序列化和反序列化過程,減少數據庫讀取和組合功能,提高了大約10TPS。
其他改進,例如改進check_tx函數和刪除冗余內存分配,再次提高了TPS。
潛在的優化領域
總共有10點我們認為可以改進。不過,大多數優化來自以下6點:
改進了主界面中的deliver_tx和check_tx?
減少了數據存儲結構中的持久化操作的次數
優化需要持久數據調用的功能,減少調用次數
為deliver_tx和check_tx頻繁調用的接口優化Vault性能
優化了日志記錄流程
優化讀寫鎖功能
以下四種方法沒有多大成果。前三種是Tendermint的功能,我們團隊對此無所進展。最后一種并不如預期的那樣富有成效:
1.檢查新交易的過程
Web3PRC服務器的處理功能
以太坊Gas費飆升至357gwei:金色財經報道,據Etherscan最新數據顯示,以太坊Gas費目前已飆升至357gwei。[2023/3/11 12:56:38]
ABCIcheck_tx的處理功能
2.將交易傳輸到驗證器以及區塊鏈上的所有節點的傳輸速度。
ABCI的函數調用功能
3.優化依賴庫的性能
使用高性能替代庫或接口
調整了庫的編譯選項
優化交易速度的工具
在確定哪些地方可以提高性能之前,我們使用了兩個工具來測試網絡性能。大多數優化進來自消除冗余。這兩個工具是:
CLI工具用于模擬交易環境的
pprof-rs用于分析ABCI和Findora節點的CPU使用率
我們將詳細介紹如何部署以及使用它們。
CLI工具
我們編寫了CLI工具來模擬客戶端并方便測試。它允許我們進行交易、制作錢包、編寫腳本等,并且讓我們可以在基本不破壞網絡的情況下進行壓力測試。
通過Prism將原生FRA轉換為智能FRA,并發送到root帳戶
Root帳戶將FRA發送到多個地址,并保存到文件
并行執行以下操作:
隨機生成一批地址,并指定一個endpoint
獲取nonce源
生成一個EVM轉賬交易,并通過send_raw_transaction發送到端點。保存哈希
客戶端增加nonce,生成并提交交易,直到所有目標都發送一個交易。
如果交易失敗的原因不是“mempoolfull”引起的,則會獲得一個新的nonce并重新提交
為了減少服務器沒有響應的影響,在nonce的接口中加入了服務彈性的邏輯
為了減少服務器的“mempoolfull”錯誤和服務器壓力,增加了并行等待同步。
Pprof-rs和CPU分析
Nansen公布Huobi投資組合,目前持有33.1億美元資產:11月15日消息,據Nansen官方推特表示,Nansen官網已公布Huobi投資組合,Huobi目前持有33.1億美元資產。其中,HT占29.35%,USDT占23.08%,BTC占14.94%,TRX占14.65%,ETH占5.10%,其他代幣占12.88%。[2022/11/15 13:06:52]
“CPUProfiling”是指我們用來測試和調優Findora網絡性能的工具。我們提出了一個迭代過程,允許我們在不破壞網絡的情況下對網絡進行壓力測試,以查看哪些功能可以優化。
用于進一步研究和找出Findora瓶頸的主要工具是pprof-rs。Pprof-rs是一種流行的測試Rust程序CPU使用率的方法。
如何使用Pprof-rs
我們在abciappcrate中導入了pprof-rs,并啟用了火焰圖功能。pprof-rs被編譯成abcid。有了這個,分析器可以按指定的頻率對adcid中的操作上下文進行采樣。
在abcid過程中,我們主要使用以下接口進行分析。
1.使用ProfilerGuardBuilder啟用分析器,并將頻率設置為100。
2.將分析結果保存為火焰圖。
3.因為abcid是一個持久進程,所以分析器可以通過以下方法停止:
Pprof-rs的工作原理
分析器將按給定頻率暫停程序,并采樣程序的堆棧跟蹤。采樣數據存儲在哈希圖中。在采樣中,分析器掃描每個堆棧幀,并累積存儲在哈希圖中的計數。
然后,采樣數據可用于生成火焰圖或其他形式來表示網絡性能。
當ProfileGaurdBuilder啟動分析器時,它將向SIGPROF注冊一個信號處理程序和一個用于暫停主程序的計時器。當觸發SIGPRO時,將調用處理程序對堆棧跟蹤進行采樣。這個過程由backtracecrate來執行。
使用Pprof-rs分析Findora全節點
基于華為云的P2E鏈游Revoland將推出Staking功能:8月20日消息,據外媒報道,基于華為云的P2E鏈游Revoland宣布將推出Staking質押功能,旨在吸引更多有機用戶加入RevoLand生態,從而提高項目的可持續性。
此外,加密用戶可以通過參與Staking質押來管理RevoLand項目,Staking系統將從REVO的單一Token質押開始,然后是REVOLP的Token質押。此前報道,Revoland于今年六月完成1060萬美元種子輪和預售輪融資,天鴿互動等參投。(Globenewswire)[2022/8/21 12:37:55]
首先,了解我們的區塊鏈和Tendermint共識引擎的結構是很重要的。
在ETH全節點中,Tendermint進程通過socket與ABCI進程通信。ABCI應用程序默認注冊以下接口:
Begin_block
Check_tx
Deliver_tx
End_block
Commit
它還為Web3RPC服務器提供了以下接口,Web3客戶端可以通過這些接口執行測試:
eth_sendRawTransaction
https://ethereum.org/en/developers/docs/apis/json-rpc/#eth_sendrawtransaction?
eth_getTransactionCount
https://ethereum.org/en/developers/docs/apis/json-rpc/#eth_gettransactioncount?
eth_getTransactionReceipt
https://ethereum.org/en/developers/docs/apis/json-rpc/#eth_gettransactionreceipt?
該圖顯示了ETH全節點的基本工作流程。全節點是收集新交易并重放新交易的節點,是所有交易的入口和檢查點。通過對全節點的ABCI進行剖析,我們可以獲得關于鏈性能的完整數據。
BitKeep“借Gas費兌換服務”新增支持Fantom、AVAX-C、Heco和OKX Chain:8月16日消息,Web3多鏈錢包BitKeep“借Gas費兌換服務”新增支持Fantom、AVAX-C、Heco和OKX Chain,此前已支持Tron、BNB Chain和Polygon。[2022/8/16 12:29:03]
在分析abcid之前,我們將Tendermint的ABCI并行化為兩個線程,而不是單個線程。它允許全節點同時為新交易調用check_tx函數并重播新生成的塊。此次升級后,全節點的CPU平均分配。因此,每個區塊的交易數量在3000左右,減少了出塊時間。
我們還測試了只有一筆交易的區塊的時間成本。主要測試函數是:
begin_block
deliver_tx
commit
end_block
除deliver_tx函數外,其他函數僅在一個塊中被調用一次。當一個區塊中的交易較少時,調用這四個函數的計數很小很小而且很接近。
對于包含很多交易的區塊,除了deliver_tx,其他三個函數的時間成本都很小。
根據修改和測試結果,我們得出結論:check_tx和deliver_tx函數占用全節點的大部分CPU。
為了得出這個結論,我們在每個塊的開頭啟動分析器。然后我們保存分析火焰圖,并在下一個塊之前停止分析器,以免影響全節點的性能。為此,我們使用了兩個全局變量:
原子布爾變量用于確定是啟動還是停止分析器
一個變量用于存儲正在運行的profileGuard
pprof-rs不提供停止分析器的接口。我們通過轉移ProfileGuard的所有權來停止分析器并釋放數據。
在停止分析器之前,可以將采樣數據作為火焰圖文件存儲在分類帳目錄中。
出于測試目的,我們添加了兩個RPC。一個用于啟用/禁用分析器。
另一個用于檢索火焰圖文件中生成的分析數據存儲。
第1步:開始測試
我們的測試是由使用CLI工具調用feth的腳本來執行的。在選擇一個全節點進行測試后,我們通過子命令fund將FRA轉移到2000個測試賬戶:
fethfund—networkhttp://dev-qa01-us-west-2-full-001-open.dev.findora.org:8545?—amount2000—redeposit—load—count2000
然后,我們開始向全節點發送交易。每個帳戶的并行度、超時和交易計數都是可配置的。例如
feth—networkhttp://dev-qa01-us-west-2-full-001-open.dev.findora.org:8545?—max-parallelism300—timeout100—count10
第2步:收集測試結果
有四種方法可以收集測試數據并分析它們。
我們可以使用Blockscout手動監控測試結果和塊。這個過程讓我們可視化塊來評估性能。
我們從Web3RPC中獲取性能數據。首先,我們可以使用接口eth_getBlockByNumber來獲取目標塊。然后,我們可以通過交易數組的長度得到實際的交易數。只能從此接口檢索有效交易。對于區塊時間,我們可以通過相鄰塊的時間戳之間的差異來計算它。
TendermintRPC:與Web3RPC類似,我們使用curl、jq等工具來檢索交易數量和區塊時間。這個RPC為我們提供了打包在塊中的所有交易的數量。注意:Web3RPC和TendermintRPC有時都會出現“無響應”問題。
Tendermint日志:為了更方便地檢索、保存和分析測試數據,我們在feth中使用了子命令etl。有了這個,該命令可以解析fullnode的日志,并將其保存到redis數據庫中。如下圖所示,出塊時間、總交易數、有效交易都可以通過全節點重放出塊過程中產生的terdermint日志進行解析。
第3步:分析測試結果
一旦我們得到測試結果,我們就會對結果進行分析或可視化,以便我們可以迭代代碼。分析是其中一個步驟,我們可以發現是什么占用了CPU和時間,并尋找優化的方法。
我們在feth中添加了一個啟用分析器的子命令。例如:
在下一個塊中啟用分析器
fethprofiler—networkhttp://dev-qa01-us-west-2-full-001-open.dev.findora.org:8669–enable
生成火焰圖并停止分析器
fethprofiler—networkhttp://dev-qa01-us-west-2-full-001-open.dev.findora.org:8669?
這個火焰圖展示了一個CPU函數所花費的時長。時間越長,函數就越長,因此通過查看長條圖形,我們可以知道哪些過程需要優化。
第4步:重新部署代碼?
代碼更新后,我們使用Jenkins將其部署到測試環境中。
為優化Findora所做的更改
根據我們的測試,以下是我們已經實施或將要實施的一些更改,以提高Findora的EVM層TPS。
將內存池設置為8k
通過測試,我們發現為了提高全節點的穩定性并確保生成塊不會花費太長時間,內存池的最佳大小是8,000。我們希望盡快更新主網上的內存池。
并行TendermintABCI
并行化TendermintABCI以便可以同時執行check_yx和Deliver_tx,這是我們發現的另一個可改進之處。這也有助于防止堵塞時間過長。但這并不能顯著提高TPS,因為交易是均勻分布的。
減少序列化/反序列化
通過結合SDK中打包的帳戶中的一些函數來減少數據庫讀取和反序列化。
通過這種優化,TPS提高了大約10txn/s。
刪除不必要的檢查
函數check_tx和Deliver_tx使用相同的邏輯來處理交易,唯一的區別在于上下文。但是對于check_tx函數,它不需要PendingTransactions、emit、events等邏輯。因此,我們可以通過上下文將這兩個函數分開。TPS已提高到79.2txn/s。
重構SessionCache
在之前的執行中,cur和base之間用了大量的內存copy/allocation.deallocation來執行一個交易。
通過減少這些操作的次數,TPS達到了149txn/s。
避免打印冗余日志
我們刪除了數百個不必要的日志。這些日志可以重新打印用于調試,但不會在主網上自動打印。
未來優化點
根據火焰圖,我們在未來還可以做兩件事。
Recover_signer函數
secp256k1_ecdsa_recover函數在recover_signer函數中占用了大量時間。這個secp256k1_ecdsa_recover函數的核心部分是libsecp256k1:recover,它的crate接口花費的時間最多。
我們可以考慮優化這個庫,用另一個高性能庫替換它,或者減少調用。
適用于EVM的Findora后端
這部分占據了整個交易過程的很大一部分,但是我們仍然找不到優化的地方。未來我們可能需要對這部分進行更多的測試和分析。
結論
提高TPS是一個迭代過程,我們一直在尋找新的方法來擴容。雖然我們想要保持競爭力,但我們更愿意相信在Web3中合作才能使整個行業強大。因此,我們很樂意分享我們的優化過程,以幫助其他團隊,并獲得建設性的反饋。希望此次分享可以幫助到EVM環境中的其他團隊,以便他們提高自己的TPS。
來源:金色財經
什么是NFT中的刷單交易?刷單交易是一種市場操縱形式,市場參與者試圖通過重復買賣來影響價格,制造大量交易活動的表象.
1900/1/1 0:00:00DAO中除了「D」,「A」同樣重要。撰文:BenGiove編譯:AididiaoJP,ForesightNews去中心化自治組織在熊市當中艱難成長,繼續面臨著諸多挑戰.
1900/1/1 0:00:00幣安將支持Band Protocol(BAND)網絡升級:4月26日消息,據官方公告,幣安預計將于北京時間4月27日21:00暫停BAND代幣的充值、提現業務.
1900/1/1 0:00:00作者:RichardKim 本文由DeFi之道編譯 我在2018年開始投資加密游戲,因為我相信一旦開放,游戲經濟和虛擬世界將永遠不會再關閉.
1900/1/1 0:00:00歐元區公債收益率周四上漲,此前歐洲央行執委施納貝爾(IsabelSchnabel)稱,消費者價格在短期內仍可能加速上漲,從而加劇了通脹的焦慮。施納貝爾表示,自7月加息以來,歐元區通脹前景未改善.
1900/1/1 0:00:00距離結束8月份還有一個星期,下個月的開始伴隨著去年區塊鏈生態系統中最重要事件——以太坊合并“以太坊2.0”的期待.
1900/1/1 0:00:00