作者:七哥
來源:登鏈社區
編者注:原標題為《也許是國內第一篇把以太坊工作量證明從算法層講清楚的》
對于沒有把數學學會的同學來說,如果希望從算法層了解以太坊的工作量證明是非常困難的。一本黃皮書會難倒一大批吃瓜群眾。因此,本文將試圖使用圖文和盡量簡單的數學來解釋以太坊挖礦工作量證明,包括以太坊是如何對抗ASIC1、如何動態調整挖礦難度、如何校驗挖礦正確性的。
認識工作量證明PoW
工作量證明是一種對應服務與資源濫用、或是拒絕服務攻擊的經濟對策。一般是要求用戶進行一些耗時適當的復雜運算,并且答案能被服務方快速驗算,以此耗用的時間、設備與能源做為擔保成本,以確保服務與資源是被真正的需求所使用。
摘自維基百科
這種經濟性應對政策概念,是在1993年提,直到1999年才使用Proof-of-Work一詞。
ProofofWork,直接翻譯過來是工作量證明。這個詞的中文直接聽起來有點不知所云。實際上如果我跟你說結婚證明,離職證明,那你是不是首先想到的是一張上面印著一些東西的紙呢?別人看到這張紙就知道你的確結婚了,或者你的確從某單位離職了。工作量證明從語法上也是一個邏輯,也可以理解成一張紙,通過這張紙就可以證明你的確完成了一定量的工作。這就是工作量證明的字面意思。
那工作量證明有什么特點呢?我們拋開計算機,用現實世界的例子來說明。例如我上課不認真,老師罰我把《桃花源記》抄寫十遍,我用了兩個小時的勞動,最后給老師的就是一張紙,而老師要確認我的確付出了大量勞動,其實只需要看一眼就可以了。這個例子道出了POW機制的一大特點,那就是生成需要花費大量勞動,但是驗證只需一瞬間。另外一個工作量證明的例子可以是,老師給我出一道題,我給老師的運算結果,或者說就是最后的那個數字,就是我的工作量證明。回到計算機情形下,紙當然是不存在的,所以所謂的工作量證明就是花費了很多勞動而得到的一個數了。
再說說POW最早的用途。人們在使用電子郵件的時候會收到垃圾郵件的騷擾。如果沒有成本,那么發送一百萬封郵件的確是很輕松的事情了。所以,聰明的人就會想,如果讓每一封郵件發送時候,都有一個微小的成本,那么垃圾郵件就會被很大程度的遏制了。而POW就是為了服務這個目的產生的。基本過程就是郵件接收方會先廣播一道題出去,郵件發送方發郵件的時候必須附帶上這道題的答案,這樣郵件才會被接受,否則就會被認為是垃圾郵件。
摘自:https://zhuanlan.zhihu.com/p/42694998
北京優化“企業間存量非住宅買賣”流程 利用區塊鏈技術進行上鏈存證:北京市規劃和自然資源委員會聯合北京市住房和城鄉建設委員會、國家稅務總局北京市稅務局優化了“企業間存量非住宅買賣”業務審批流程。在信息安全方面,應用區塊鏈技術,將企業網上申報信息進行上鏈存證,實現網上申報信息“留證據、可追溯”;稅務部門將稅票信息進行上鏈存證,登記部門從鏈上直接獲取稅票,實現稅票信息可信共享。業務辦理完成后,登記人員將電子申請材料進行存檔,登記信息上鏈存證。信息上鏈為企業提供了安全可信的交易環境,確保企業在家“安全辦、放心辦”。(人民網)[2020/3/20]
挖礦
挖礦就是在求解一道數學方程。方程的多個可能的解被稱為解的空間。挖礦就是從中尋找一個解。不同于幾何方程,這個挖礦方程有如下特點:
1.沒有比窮舉法更有效的求解方法;
2.解在空間中均勻分布,每一次窮舉查找到解的概率基本一致;
3.解的空間足夠大,保證一定能夠找到解;
假設挖礦方程是:n=random(1,10),求n<D。
當D為10時,我們只需要運算一次就可以找到任意的n都滿足n<10,可當D=5,則平均需要兩次運算才能找到n<5,隨著D的減小,需要運算的次數就會增大。
這里的D就是通常說的挖礦難度,通過調整解空間中的符合要求的解的數量來控制求解所需要嘗試的次數,間接的控制產生一個區塊所需要的時間。使得可以調控和穩定區塊間隔時間。
當挖礦的人很多,單位時間內嘗試次數增多時,求解的速度也就更快,區塊挖出用時更短。此時則增大挖礦難度,增大平均嘗試次數,使得挖礦耗時上升。反之依然。
以太坊新區塊挖礦流程
通過父區塊可計算新區塊的挖礦難度,再求解挖礦方程。
挖礦工作量證明通過一個密碼學安全的nonce來證明“為了獲得挖礦方程解n,已經付出了一定量的計算”。工作量證明函數可以用PoW表示:
其中
1.?
動態 | ConsenSys 支持的 uPort 與普華永道合作為英國金融部門開發區塊鏈身份管理系統:由 ConsenSys 支持的基于以太坊的身份管理項目 uPort 已與普華永道建立合作伙伴關系,為英國金融部門開發基于區塊鏈的身份管理系統。uPort 表示正在探索如何簡便化身份驗證以改善客戶的注冊流程并降低金融公司的合規成本。普華永道高管 Mike Kennelly 表示,該項目開放了使用金融服務的渠道,有助于減少欺詐并推動更多競爭進入英國銀行生態系統。普華永道此前在報告中表示,銀行業的技術變革到 2030 年可能會為英國經濟帶來超過 346 億英鎊的增長。[2019/9/24]
是新的區塊頭,但nonce和mixHash均為空值;2.
?是區塊difficulty值。;3.
?是區塊mixHash值;挖礦方程算法返還的第一個參數值;4.
是區塊nonce值;挖礦方程算法返還的第二個參數值;5.d是一個計算mixHash所需要的大型數據集dataset;6.PoW是工作量證明函數,可以得到兩個值,其中第一個是mixHash,第二個是密碼學依賴于H和d的偽隨機數。
這個基礎算法就是挖礦方程Ethash。通過可以信任的挖礦方程求解,來確保區塊鏈的安全性。同時,挖出新塊還伴有區塊獎勵,所以工作量證明不僅提供安全保障,還是一個利益分配機制。
下面是挖礦工作量證明的計算過程:
大致流程如下:
1.根據父區塊頭和新區塊頭計算出
;2.在PoW開始時選擇一個隨機數作為Nonce的初始化值;3.將Nonce和作為挖礦方程Ethash的入參;4.執行Ethash將得到兩個返回值:mixHash和result;5.判斷result是否高于
動態 | 韓國區塊鏈聯合會聲明:政府只看到虛擬貨幣消極面是錯誤的:由韓國區塊鏈企業振興協會、韓國區塊鏈產業振興協會、韓國IoT區塊鏈技術研究協會等4個協會團體和高麗大學區塊鏈貨幣研究中心、東國大學區塊鏈研究中心等2個研究中心共同參與的“韓國區塊鏈聯合會”在當日發表了一份聯合聲明稱,現政府認為,區塊鏈是第四次產業革命的核心基礎技術之一,推進區塊鏈是正確的政策方向。但對于虛擬貨幣問題只表現出消極的一面,而將更多的積極因素排除在外,這是錯誤的政策。現政府對加密貨幣的法案計劃將使國內集團競爭力后退。[2019/3/25]
。如果是則nonce加1,繼續窮舉查找;否則,如果是則說明求解成功。返回mixHash和Nonce;6.兩個值記錄到區塊頭中,完成挖礦。
區塊難度difficulty
以太坊的挖礦難度記錄在區塊頭difficulty上,那么在它是如何動態調整的呢?
調整算法在以太坊主網有多次修改,即使以太坊黃皮書中的定義也和實際實現代碼也不一致,這里我以程序實現代碼來講解區塊難度調整算法。
其中有:
是創世區塊的難度值。難度值參數
被用來影響出塊時間的動態平衡。使用了變量而非直接使用兩個區塊間的時間間隔,是用于保持算法的粗顆粒度,防止當區塊時間間隔為1秒時只有稍微高難度情況。也可以確保該情況下容易導致到軟分叉。
-99的上限只是用來防止客戶端安全錯誤或者其他黑天鵝問題導致兩個區塊間在時間上相距太遠,難度值也不會下降得太多。在數學理論是兩個區塊的時間間隔不會超過24秒。
難度增量∈會越來越快地使難度值緩慢增長,從而增加區塊時間差別,為以太坊2.0的權益證明切換增加了時間壓力。這個效果就是所謂的“難度炸彈”或“冰河時期”。
動態 | 區塊鏈開發人員收入超過了六個月前的水平:據CCN消息,根據管理咨詢公司Janco Associates的調查報告,區塊鏈開發人員現在的收入超過了六個月前的水平。在過去六個月中,區塊鏈開發人員的年薪增加了4000多美元。區塊鏈開發人員的年薪中位數也遠高于其他軟件開發人員,約為132000美元。經驗豐富的開發人員年薪賺取更多,約17.6萬美元,尤其是當他們更換雇主時。[2019/1/13]
以太坊的設想是最終從PoW過度到PoS,為了給過度施加時間壓力,所以在區塊難度中預埋了一個難度炸彈∈,他是以2的指數級增長的。如果聽過“棋牌擺米”的數學故事,就應該清楚指數級增長是非常恐怖的。
最終,在拜占庭版本中,伴隨EIP-649,通過偽造一個區塊號
來延遲冰河時期的來臨。這是通過用實際區塊號減去300萬來獲得的。換句話說,就是減少∈和區塊間的時間間隔,來為權益證明的開發爭取更多的時間并防止網絡被“凍結”。
在君士坦丁堡版本升級中,以太坊開發者在視頻會議中表示,如果直接執行難度炸彈,那么難保以太坊能順利切換到PoS就有大量礦工離開,這很有可能極大的影響以太坊的安全性。因此,伴隨EIP-1234,再一次修改
到500萬來延遲冰河時期。
這個挖礦難度調整機制保證了區塊時間的動態平衡;如果最近的兩個區塊間隔較短,則會導致難度值增加,因此需要額外的計算量,大概率會延長下個區塊的出塊時間。相反,如果最近的兩個區塊間隔過長,難度值和下一個區塊的預期出塊時間也會變短。
挖礦方程Ethash
區塊鏈鼻祖比特幣,是PoW共識,已經穩定運行10年。但在2011年開始,因為比特幣有利可圖,市場上出現了專業礦機專門針對哈希算法、散熱、耗能進行優化,這脫離了比特幣網絡節點運行在成千上萬的普通計算機中并公平參與挖礦的初衷。這容易造成節點中心化,面臨51%攻擊風險。因此,以太坊需要預防和改進PoW。因此在以太坊設計共識算法時,期望達到兩個目的:
1.抗ASIC1性:為算法創建專用硬件的優勢應盡可能小,理想情況是即使開發出專有的集成電路,加速能力也足夠小。以便普通計算機上的用戶仍然可以獲得微不足道的利潤。2.輕客戶端可驗證性:一個區塊應能被輕客戶端快速有效校驗。
財新網專欄作家程實:以區塊鏈為核心技術基礎將優化信息流動:財新網專欄作家程實今日發表文章稱,本質而言,新經濟不是一種孤立、靜止的經濟形態,而是以新技術為基礎的、對傳統經濟金融體系進行的一場系統性大改造。其中包括信息流動的優化。以移動互聯網、物聯網、區塊鏈、量子通信為核心技術基礎,實現高效、安全、精準的信息傳輸,進而驅動各類要素資源突破傳統產業格局,實現跨界融合與混合經營。[2018/4/2]
在以太坊早期起草的共識算法是Dagger-Hashimoto,由Buterin和Dryja提出。但被證明很容易受到SergioLerner共享內存硬件加速的影響。所以最終拋棄了Dagger-Hashimoto,改變研究方向。在對Dagger-Hashimoto進行大量修改,終于形成了明顯不同于Dagger-Hashimoto的新算法:Ethash。Ethash就是以太坊1.0的挖礦方程。
介紹
這個算法的大致流程如下:
1.通過掃描區塊頭直到某點,來為每個區塊計算得到一個種子Seed。2.根據種子可以計算一個初始大小為16MB的偽隨機緩存cache。輕客戶端保存這個cache,用于輔助校驗區塊和生成數據集。3.根據cache,可以生成一個初始大小為1GB的DAG數據集。數據集中的每個條目(64字節)僅依賴于cache中的一小部分條目。數據集會隨時間線性增長,每30000個區塊間隔更新一次。數據集僅僅存儲在完整客戶端和礦工節點,但大多數時間礦工的工作是讀取這個數據集,而不是改變它。4.挖礦則是在數據集中選取隨機的部分并將他們一起哈希。可以根據cache僅生成驗證所需的部分,這樣就可以使用少量內存完整驗證,所以對于驗證來講,僅需要保存cache即可。
這里cache選擇16MB緩存是因為較小的高速緩存允許使用光評估方法,太容易用于ASIC。16MB緩存仍然需要非常高的緩存讀取帶寬,而較小的高速緩存可以更容易地被優化。較大的緩存會導致算法太難而使得輕客戶端無法進行區塊校驗。
選擇初始大小為1GB的DAG數據集是為了要求內存級別超過大多數專用內存和緩存的大小,但普通計算機能夠也還能使用它。數據集選擇30000個塊更新一次,是因為間隔太大使得更容易創建被設計為非常不頻繁地更新并且僅經常讀取的內存。而間隔太短,會增加進入壁壘,因為弱機器需要花費大量時間在更新數據集的固定成本上。
同時,緩存和數據集大小隨時間線性增長,且為了降低循環行為時的偶然規律性風險,數據大小是一個不超過上限的素數。每年約以0.73倍的速度增長,這個增長速率大致同摩爾定律持平。這仍有越過摩爾定律的風險,將導致挖礦需要非常大量的內存,使得普通的GPU不再能用于挖礦。因為可通過使用緩存重新生成所需數據集的特定部分,少量內存進行PoW驗證,因此你只需要存儲緩存,而不需要存儲數據集。
緩存和數據集大小
緩存c和數據集d的大小依賴用區塊的窗口周期Eepoch。
每過一個窗口周期后,數據集固定增長8MB(223字節),緩存固定增長128kb。為了降低循環行為時的偶然規律性風險,數據大小必須是一個素數。計算緩存大小公式:
計算數據大小公式:
其中,求素數公式如下:
這個素數計算是從不高于上限值中向下依次遞減2*64字節遞歸查找,直到x/64是一個素數。
生成種子哈希值
種子seed實際是一個哈希值,每個窗口周期更新一次。它是經過多次疊加Keccak256計算得到的。
第一個窗口周期內的種子哈希值s是一個空的32字節數組,而后續每個周期中的種子哈希值,則對上一個周期的種子哈希值再次進行Keccak256哈希得到。
生成緩存cache
緩存cache生成過程中,是將cache切割成64字節長的若干行數組操作的。
先將種子哈希值的Keccak512結果作為初始化值寫入第一行中;隨后,每行的數據用上行數據的Keccak512哈希值填充;最后,執行了3次RandMemoHash算法。該生成算法的目的是為了證明這一刻確實使用了指定量的內存進行計算。
RandMemoHash算法可以理解為將若干行進行首尾連接的環鏈,其中n為行數。
每次RandMemoHash計算是依次對每行進行重新填充。先求第i行的前后兩行值得或運算結果,再對結果進行Keccak512哈希后填充到第i行中。
最后,如果操作系統是Big-Endian(非little-endian)的字節序,那么意味著低位字節排放在內存的高端,高位字節排放在內存的低端。此時,將緩存內容進行倒排,以便調整內存存放順序。最終使得緩存數據在內存中排序順序和機器字節順序一致。
生成數據集
利用緩存cache來生成數據集,首先將緩存切割成n個16bytes大小的單元。在生成過程中時將數據集切割為若干個64bytes大小的數據項,可對每項數據mix并發生成。最終將所有數據項拼接成數據集。
1.在生成index行的數據時,先從緩存中獲取第index%n個單元的值u;
2.數據項mix長度64bytes,分割為4bytes的16個uint32。第一個uint32等于u^index,其他第i個uint32等于u+i;
3.用數據項mix的Keccak512哈希值覆蓋mix;
4.對mix進行FNV哈希。在FNV哈希時,是要從緩存中獲取256個父項進行運算。
1)確定第p個父項位置:FNV(index^p,mix)%n;2)再將FNV(mix,cache)的值填充到mix中;其中,FNV(x,y)=x*0x01000193^y;這里的256次計算,相當于mix的16個uint32循環執行了16次。
5.再一次用數據項mix的Keccak512哈希值覆蓋mix;
6.如果機器字節序是Big-Endian的,則還需要交換高低位;
7.最后將mix填充到數據集中,即dataset=mix;
注意,在FNV哈希計算中,初始大小1GB數據集累積需要約42億次次計算。即使并發計算,也需要一定的時間才能完成一次數據集生成。這也就是為什么在啟動一個geth挖礦節點時,剛開始時會看到一段“GeneratingDAGinprogress”的日志,直到生成數據集完成后,才可以開始挖礦。
Ethash挖礦方程求解
準備好數據集dataset就可以用于工作量證明計算。依賴nonce、h、dataset可計算出的一個偽隨機數N,工作量證明就是校驗N是否符合難度要求。工作量計算由挖礦方程Ethash定義。
上圖是Ethash的計算流程圖。說明如下:
1.首先將傳入的新區塊頭哈希值和隨機數nonce拼接后進行KEC512哈希,得到64字節的種子seed;2.然后初始化一個128字節長的mix,初始化時分割成32個4字節的單元;使用128字節的順序訪問,以便每次Ethash計算都始終從RAM提取整頁,從而最小化頁表緩存未命中情況。理論上,ASIC是可以避免的;3.mix數組的每個元素值來自于seed;mix=s;是seed的第0、4、8...60位的值;4.緊接著完成64次循環內存隨機讀寫。每次循環需要從dataset中取指定位置p和p+1上的兩個16字節拼接成32字節的m;然后,使用fnv(mix,m)去覆蓋mix;其中,i是循環索引、s是種子seed的前32字節、rows是表示數據集dataset可分成rows個128字節。5.然后壓縮mix。壓縮是將mix以每16字節分別壓縮得到8個壓縮項。每16字節又是4小份的fnv疊加哈希值fnv(fnv(fnv(m,m),m),m);6.拼接這8個壓縮項就得到mix的哈希值mixHash;7.最后將seed和mixHash進行KEC256哈希得到偽隨機數N;8.最終,返回這兩個參數:mixHash和N;
今日晚7點,巴比特產業大課第三期——「區塊鏈項目操盤手學習周」繼續開講。雄安區塊鏈實驗室副主任、中國計算機學會區塊鏈專委會副主任李軍以《歷史機遇下,雄安新區的區塊鏈布局》為主題進行分享.
1900/1/1 0:00:00文:互鏈脈搏 編者注:本文作了不改變作者原意的刪減。據互鏈脈搏統計,兩市已有超過200家上市公司在區塊鏈領域展開實際業務,有的做基礎技術,有的做產業應用,還有的正在研究.
1900/1/1 0:00:00文丨互鏈脈搏編輯部 耳熟能詳的星巴克、慶豐包子鋪都很可能在雄安新區最早使用央行數字貨幣。互鏈脈搏獨家獲悉,4月22日下午,雄安新區召開了法定數字人民幣試點推介會.
1900/1/1 0:00:00編者注:原標題為《G20:全球主要經濟體需要填補監管空白,避免Libra等穩定幣破壞金融穩定》20國集團本周二表示,全球主要經濟體需要填補其規則手冊中的空白.
1900/1/1 0:00:00國家發改委今天首次明確新型基礎設施的范圍,國家發改委相關負責人表示,初步研究認為,新型基礎設施是以新發展理念為引領,以技術創新為驅動,以信息網絡為基礎,面向高質量發展需要.
1900/1/1 0:00:00作者:LiangCHE 來源:比推bitpush.news據比推數據,市值最高的加密貨幣比特幣連日盤整,有分析師稱其正站在“懸崖邊沿”,面臨著下跌風險.
1900/1/1 0:00:00