買比特幣 買比特幣
Ctrl+D 買比特幣
ads
首頁 > PEPE幣 > Info

BERT:如何利用機器學習識別加密項目風險?_玩加密貨幣什么人最多

Author:

Time:1900/1/1 0:00:00

作者:PengtaiXu

翻譯:Sherrie

加密貨幣和監管的必要性

加密貨幣是一種存在于數字世界的交易媒介,依靠加密技術使交易安全。加密貨幣背后的技術允許用戶直接向他人發送貨幣,而不需要通過第三方,如銀行。為了進行這些交易,用戶需要設置一個數字錢包,而不需要提供身份證號碼或信用評分等個人細節,因此可以讓用戶偽匿名。

對于普通的加密貨幣用戶來說,這種匿名性可以讓他們放心,因為他們的個人信息或交易數據不會被黑客竊取。然而,這種交易匿名性的提高,也容易被犯罪分子濫用,進行洗錢、恐怖融資等非法活動。這種非法活動給區塊鏈錢包用戶以及加密貨幣實體都造成了巨大的損失。雖然金融行動特別工作組等監管機構已經在這些實體的監管中引入了標準化的指導方針,但由于每天都有大量的加密貨幣實體和交易發生,監控加密貨幣空間是一項具有挑戰性的任務。

解決方案

大咖零距離 | 面對312極端行情應該如何調整心態?:4月17日16:00,金色盤面邀請eos柚子公主做客金色財經《大咖零距離》直播間,將分享《面對312極端行情應該如何調整心態?》,敬請關注,欲觀看直播掃描下圖二維碼即可![2020/4/17]

圖片來源:?https://dribbble.com/shots/2723032-Needle-in-a-Haystack

因此,人們有興趣利用開源信息,例如新聞網站或社交媒體平臺,來識別可能的安全漏洞或非法活動。在與LynxAnalytics的合作中,我們已經致力于開發一個自動工具,以刮取開源信息,預測每篇新聞文章的風險分數,并標記出風險文章。這個工具將被整合到Cylynx平臺中,這是LynxAnalytics開發的一個工具,用于幫助監管機構通過使用各種信息源監控區塊鏈活動。

開源信息的數據獲取

我們確定了3類開源數據,這些數據可以提供有價值的信息,幫助檢測加密貨幣領域的可疑活動。這些類別是:

大咖零距離 | 如何通過消息面獲取市場暴利:2月19日16:00,金色盤面邀請數字貨幣正規軍TLAB Terry做客金色財經《大咖零距離》直播間,將分享《如何通過消息面獲取市場暴利》,敬請關注,欲進群觀看直播掃描海報二維碼報名即可![2020/2/19]

傳統的新聞網站,如谷歌新聞,它將報告重大的黑客事件。

加密貨幣專用新聞網站,如Cryptonews和Cointelegraph,它們更有可能報道小型實體和小型安全事件的新聞。

社交媒體網站,如Twitter和Reddit,在官方發布黑客新聞之前,加密貨幣所有者可能會在那里發布有關黑客的消息。

檢索文章和社交媒體帖子的內容,然后建立情緒分析模型。該模型為文章中提到的實體分配了一個風險活動的概率。

比特幣共識大會圓桌討論有關政府如何使用加密技術:今日比特幣共識大會召開,在有關政府如何使用加密技術的圓桌討論環節,德勤高級經理Wendy Henry表示,美國正著眼于能夠實現現代化的技術。這些技術例如區塊鏈技術,實際上可以作為連接的組織,人們必須弄清關于如何使用區塊鏈技術。linux基金會首席營銷官Jamie E. Smith表示,區塊鏈技術并非將房子燒毀一樣的革命,而是提供政府目前已經提供了的服務的更好版本。[2018/5/15]

情緒分析模型

我們嘗試了四種不同的自然語言處理工具進行情緒分析,即VADER、Word2Vec、fastText和BERT模型。在通過選定的關鍵指標對這些模型進行評估后,RoBERTa模型表現最佳,被選為最終模型。

圖片來源:?https://www.codemotion.com/magazine/dev-hub/machine-learning-dev/bert-how-google-changed-nlp-and-how-to-benefit-from-this/

新華網分析:區塊鏈如何帶來個人數據保護“革命”:新華網今晚發表文章《區塊鏈如何帶來個人數據保護“革命”》,文章表示大數據時代,個人的數據被認為是黃金般珍貴。個人數據泄漏令人擔憂,但絕大部分人不可能因為害怕數據被收集而切斷與互聯網的聯系,而現階段有責任保管個人信息的企業、學校、酒店、社交網站等往往擔責不力。專家們認為,區塊鏈技術作為一種帶有加密、信任、點對點、難篡改等特征的“中間件”,有望解決這個難題。

區塊鏈技術的出現令個人數據掌控權從互聯網公司轉移到用戶自己手中,使人人掌控自己的個人數據成為可能。通過它,用戶個人數據可以與個人數字身份證相關聯,用戶可以選擇數字身份證是匿名、化名或公開,還可以隨時隨地從任何設備訪問區塊鏈應用平臺,控制他們的互聯網個人數據。[2018/4/18]

RoBERTa模型對新聞文章或社交媒體帖子的文本進行處理,并為特定文本分配一個風險分數。由于該文本在數據收集過程中已經被標記為實體,我們現在已經有了加密實體的相關風險指標。在后期,我們將多個文本的風險分數結合起來,給出一個實體的整體風險分數。

韓國政府召開緊急會議 討論如何遏制加密貨幣投機:首爾12月13日電 韓國政府周三召集了相關部委的緊急會議,討論如何在當地投資者日益擔憂財務損失的情況下遏制加密貨幣投機。會議匯集了司法部,財政部,科學部和ICT部,金融服務委員會,韓國通信委員會,公平貿易委員會和國家稅務局的高級官員。比特幣和以太坊等加密貨幣近年來迅速普及。韓國是世界上最大的比特幣交易所之一,約有100萬人擁有最知名的數字貨幣。[2017/12/13]

RoBERTa原本是一個使用神經網絡結構建立的情感分析模型,我們將最后一層與我們標注的風險分數進行映射,以適應風險評分的環境。為了提高模型在未來文本數據上的通用性,我們進行了幾種文本處理方法,即替換實體、刪除url和替換hash。然后我們使用這個表現最好的模型進行風險評分。

風險評分

現在,每篇文章都有一個相關的來源,一個風險概率和一個計數,指的是文章被轉發、分享或轉發的次數。為了將這些風險概率轉換為加密貨幣實體的單一風險得分,我們首先將文章的概率值縮放到0到100的范圍內,并獲得每個來源的加權平均值,結合文章的風險得分和計數。加權平均數用于對計數較高的文章給予更大的重視,因為份額數量很可能表明文章的相關性或重要性。

在計算出各來源的風險得分后,我們對各來源的風險得分進行加權求和,得到綜合得分,公式如下:

傳統的新聞來源被賦予了更高的權重,因為這些來源更有可能報道重大的安全漏洞。

該解決方案的有效性

我們在2020年1月1日至2020年10月30日的174個加密貨幣實體的名單上測試了我們的解決方案,并將結果與該時間段內的已知黑客案例進行了比較。我們發現,我們的風險評分方法表現相當出色,在37個已知的黑客案例中識別了32個。我們還分析了我們的解決方案對單個實體的有效性。下圖顯示了Binance從2020年1月1日至2020年10月30日的風險評分。虛線紅線代表已知的黑客案例。從圖中我們觀察到,我們的解決方案報告了5個已知黑客中的4個黑客的風險得分增加。也有幾個峰值與已知黑客案例不一致。然而,這并不構成一個主要問題,因為對我們的模型來說,更重要的是識別盡可能多的黑客,減少未識別的黑客數量。

有趣的發現

在風險評分過程中,我們注意到,與規模較小的實體相比,規模較大的實體的風險評分往往有較大比例的假陽性記錄。這是因為大型實體被談論得更多,因此會有更多的負面帖子和虛假謠言,從而導致更高的不準確率。

另一個值得強調的有趣趨勢是,圍繞著黑客攻擊通常有幾個明顯的高峰。這是由于不同數據源的反應時間不同。社交媒體網站Twitter和Reddit通常是第一個看到高風險事件發生時的高峰,因為用戶會發帖提出他們觀察到的異常情況,比如一個實體的網站在沒有事先通知用戶的情況下宕機。官方消息一般是在官方聲明之后,稍后才會發布。

局限性

我們發現,我們的解決方案有兩個潛在的局限性,首先是需要不斷地維護收集器。網站設計可能會隨著時間的推移而改變,這些網站的刮擦器需要更新,以確保相關信息仍能被檢索到,從而達到風險評分的目的。

第二個限制是,驗證一篇文章是否已被正確地標記為加密貨幣實體是具有挑戰性的。例如,一篇報道Bancor可疑活動的文章可能也會因為一個不相關的事件提到Binance。我們的解決方案會錯誤地將新聞標記為兩個實體,并將Binance標記為風險,即使它不是文本中的關鍵主題。然而,這并不是一個主要的限制,因為我們只使用新聞文章的標題和摘錄來進行風險評分,這通常只包含文章的關鍵信息。

結語

我們的項目讓監管機構可以輕松挖掘開源信息,更好地識別加密貨幣領域發生的風險事件。我們提供了一個分析文章并預測風險分數的語言模型,以及根據實體和來源信息匯總這些分數的方法。這些方法都被編織成一個可以端到端運行的自動化流水線。將該項目整合到Cylynx平臺中,將對其現有功能進行補充,并為監管機構識別高風險加密貨幣實體提供巨大的幫助。

Tags:加密貨幣區塊鏈BERTERT玩加密貨幣什么人最多區塊鏈證據保全怎么操作Liberta FinancialERT幣

PEPE幣
ITF:信用上鏈 你的數據如何價值最大化?_BIT

近日,北京市人民政府印發《關于加快推進北京市社會信用體系建設構建以信用為基礎的新型監管機制三年行動計劃》的通知.

1900/1/1 0:00:00
DEF:他們拿到了DeFi第二波狂潮的門票!_DEFI

1月16-17日,巴比特DeFi投資實戰班·杭州專場在中國未來區塊鏈創新中心開班授課,2天時間里,來自全國各地的30余位學員接受了高密度的知識沖刷.

1900/1/1 0:00:00
穩定幣:金色早報 | Messari報告:中國仍然主導比特幣市場_xrp幣會漲到多少

金色早報|Messari報告:中國仍然主導比特幣市場 金色早8點 剛剛 22 頭條 ▌Messari報告:中國仍然主導比特幣市場Messari的最新報告指出,中國仍然主導比特幣市場.

1900/1/1 0:00:00
AMPL:OKEx Research:解析算法穩定幣的算法與人性較量_coinbasewallet錢包下載

加密貨幣領域最讓人贊嘆的地方在于其不斷的創新,而新年伊始開始興起的算法穩定幣,無疑是目前最具野心、最具天馬行空想象力的貨幣創新實驗---試圖拋棄傳統的人為操控,力求以算法本身,實現貨幣的穩定性.

1900/1/1 0:00:00
COI:比特幣再暴跌10%至三周低點 3萬美元能否守住何處是底?_OIN

FX168財經報社訊?周四,比特幣連續第二天下跌,24小時內的損失超過10%,使加密市場蒸發了數十億美元.

1900/1/1 0:00:00
比特幣:貝萊德入場比特幣,機構對加密貨幣的看法正發生改變_ERG

1月20日,管理著超過8.7萬億美元資產的全球最大資產管理公司貝萊德似乎已批準其旗下兩個相關基金——貝萊德全球分配基金公司和貝萊德基金投資比特幣期貨.

1900/1/1 0:00:00
ads