幾個月以前,我加入了 Turbo-Geth 團隊,開始主動給 Trubo-Geth 客戶端貢獻代碼。Turbo-Geth 客戶端是 Geth 客戶端的一個另類版本(當前仍在開發),其目標是做得比原有的客戶端運行速度更快、更高效。那么 Turbo-Geth 實現這個目標的辦法包括下面幾項:
進一步優化數據庫結構
在需要與狀態數據交互的場合,減少對數據庫的讀、寫操作
優化狀態樹操作的效率(有可能需要改變現有狀態樹的數據結構)
在本文中,我會著重指出 Turbo-Geth 和 Geth 在數據庫上的不同之處。主要的區別在于:
不同的數據庫(使用 Bolt,而非 LevelDB)
按桶(bucket)來細分數據庫
Optimism推出Law of Chains v0.1版本:7月26日消息,Optimism推出Law of Chains,為OP Stack超級鏈生態系統參與者提供開放的中立框架,旨在促進用戶保護、去中心化和經濟自治的核心原則。目前v0.1版本已開放供社區反饋,Optimism計劃在下一季將其正式引入Optimism治理,以及新鏈加入超級鏈生態的初始治理流程。[2023/7/26 15:59:01]
那么,本文的主要內容也就跟這兩點相關。
Bolt 和 LevelDB 其實非常相似,兩者都是 “鍵-值對”(key-value)存儲,設計目標都是為不需要完整數據庫服務器的項目提供簡單、快捷且可靠的數據庫。Geth 選用的數據庫是 LevelDB,而 Turbo-Geth 選用的是 Bolt。
FTX/Alameda對Voyager的優先索賠糾紛達4.45億美元:5月16日消息,現實世界資產(RWA)代幣化服務提供商Heimdall發推表示,由于美國國稅局(IRS)的壓力,FTX已經成為政府的加密貨幣稅收代收機構,損害了零售債權人的利益,其中FTX/Alameda優先索賠糾紛(4.45億美元)目前已占據了高達三分之一的Voyager應賠付資產份額,不知道FTX是否會放棄所有優先權行動。
此前報道,Voyager現擁有13.34億美元的資產,相當于客戶對Voyager資產索賠總價值的75.68%,客戶將獲得估計為其索賠金額35.72%的初步賠償。[2023/5/16 15:05:30]
但兩者也有一個關鍵區別:組織數據的方式。LevelDB 是一個 LSM (Log-Structured Merged-Tree)數據庫,而 Bolt 使用 bucket,而且每一個 bucket 都包含著一個 B+- Tree 結構。我們可以把一個 bucket 當作 “大數據庫里的一個小數據庫”。
Gensler將在FTX聽證會前向眾議院民主黨人作簡報:金色財經報道,美國證券交易委員會(SEC)主席Gensler將在周二舉行的民主黨成員專用的簡報會上發言,眾議院金融服務委員會的民主黨人正在與金融監管機構舉行一系列閉門簡報會,為下周舉行的關于FTX的聽證會做準備,美國證券交易委員會主席稱FTX的破產是加密貨幣行業 \"模式的一部分\",而Gensler將接受兩黨關于其機構是否可以采取更多措施來保護投資者的問題。(Coindesk)[2022/12/6 21:25:22]
那么,兩者之間的主要區別在于:LSM 數據庫是為重度添加操作(appending)和范圍掃描操作(range scanning)優化的,而不是為隨機讀取的性能優化的;為了提供一致性,它不允許同時對數據庫執行讀、寫操作。也是出于性能考慮,這種數據庫是沒有實現原子性的。Bolt 則反之,插入操作(inserting)速度較慢,但是隨機讀取速度較快,實現了原子性,而且可以同時對數據庫讀寫。
Murakami.Flowers將向持有者空投T恤,快照已于7月11日進行:7月26日消息,takashi murakami官方宣布將向Murakami.Flower持有者贈送T恤。快照已于北京時間2022年7月11日7:59進行。T恤領取時間截止北京時間2022年8月1日7:59。[2022/7/26 2:38:11]
我們再稍微解釋一下原子性:
原子性:“原子” 意味著不可分割。假設現在我們要給一個數據庫存儲多個哈希值,而其中一個在插入數據庫時失敗了,如果此時所有哈希值的操作都會同時撤銷,這就叫做原子性。Turbo-Geth 就有這樣的特性,只有所有哈希值的插入操作都成功時,這個操作才能成功。而沒有實現原子性的數據庫(比如 LevelDB)則意味著,必須使用一個 workaround 以安全地將數據插入數據庫。換句話來說,在這個點上,我們覺得 Bolt 更好,因為他在給數據庫添加數據時更安全。
如前所述,Turbo-Geth 是切分成多個 bucket 的。每個 bucket 都是大數據庫中的一個小數據,各自包含了一個 B+-Tree 結構。
下面便是 Turbo-Geth 數據庫在區塊高度 9,346,492 處的切分:
- Turbo-Geth 的 Archive 節點的數據區分(區塊高度為 9,346,492)-
Geth 客戶端的 Archive 大小(區塊高度 9346492): 3.7 TBParity 客戶端的 Archive 大小(區塊高度 9346492): 3.6 TBTurbo-Geth 客戶端的 Archive 大小(區塊高度 9346492): 652.62 GB每一個部分都存儲在一個 bucket 里面。其中主要部分的簡要解釋如下:
原象(preimage):哈希值與地址之間的管理,以及存儲位置哈希值與存儲位置之間的關聯
收據(receipt):交易收據
合約存儲內容的歷史(History of Storage):合約存儲內容的變更歷史
賬戶歷史(History of Accounts):賬戶的變更歷史
區塊頭:每個區塊的區塊頭
區塊體:每個區塊的區塊體
合約存儲內容(Contract Storage):就是合約存儲內容
ChangeSet:數據庫變更歷史
賬戶:賬戶
使用這么多 bucket ,是為了讓構成大數據庫的各 B+-Tree 樹高不至于太高,這樣跟數據庫的交互就會比較容易。換句話說,這是在使用多個 bucket 來提高讀取數據庫的性能。
在切換到 Bolt 之后,Turbo-Geth 在處理隨機鍵(比如交易哈希值)時遇到了一些問題,因為 Bolt 會在提交數據之前對這些鍵進行排序(sort),又因為這些哈希值都是隨機的,而且數量很多,所以產生了大量的排序需求,然后導致大量的寫入放大現象(write amplification,實際寫入的物理數據量是寫入數據量的多倍)。而 BadgerDB 使用 log-structured-merge(LSM)模式,似乎是一個更好的選擇。這個問題仍在研究當中,不過,我們已經實現了一個 workaround 來解決這個問題。
這里有一個圖表,顯示了 BadgerDB 和 BoltDB 在整體性能上的對比(感謝 Alexey Akhunov 制圖):
Turbo-Geth 客戶端通過下列(數據庫)手段來優化以太坊的性能:
使用多個 bucket,以更迅速地檢索某些數據片
使用 B+-Tree 而非 LSM
如果你想給我們捐贈,可以通過 Gitcoin。
Tags:GETETHGETHTURBITGET交易平臺靠譜嗎Ethereum Yieldtogetherbnb按不了tFUTUR價格
數據:4000枚BTC從未知錢包轉移到Gemini:金色財經報道,據Whale Alert數據,4000枚BTC從未知錢包轉移到Gemini.
1900/1/1 0:00:00著名的數字資產銀行商銀河數碼(Galaxy digital)創始人邁克諾沃格拉茨( Mike Novogratz)再次對比特幣(BTC)的價格做出 了預測.
1900/1/1 0:00:00大數據所能帶來的巨大商業價值,被認為將引領一場足以與20世紀計算機革命匹敵的巨大變革。大數據正在促生新的藍海,催生新的經濟增長點,正在成為企業競爭的新焦點.
1900/1/1 0:00:00以太坊社區反對ProgPow,在限制ASIC挖礦提議上存在爭議。這項提議可能導致以太坊整條鏈分裂,同時也可以決定非核心以太坊開發者能否左右治理決策.
1900/1/1 0:00:00近日,韓國金融服務委員會(Korean financial services commission,簡稱FSC)和首爾市政府宣布,計劃投資約1,600萬美元用以培訓數字金融領域專家,為期四年.
1900/1/1 0:00:002020年2月17日,嘉楠宣布與區塊鏈解決方案及數據中心服務提供商Northern Data AG達成戰略合作。本次合作的內容涵蓋AI、區塊鏈及數據中心運維等高性能計算領域.
1900/1/1 0:00:00