一夜之間,海外投資機構對于AI的關注度重回幾年前的高點,甚至蓋過了今年以來的Web3投資熱點。
那么AI與Web3的結合會有什么新火花?這篇CoinFund近期的深度研究文章向我們介紹了,AI+Web3有哪些用武之地。一起探索,一手抓住兩個學習要點。
簡單介紹
技術創新永無止境,人工智能尤其如此。在過去的幾年里,我們看到深度學習模型作為人工智能的先行者再次流行起來。這些由密集互連的節點層組成的模型也稱為神經網絡,這些節點相互傳遞信息,大致上模仿了人類大腦的構造。在2010年代初期,最先進的模型擁有數百萬個參數,用于特定情緒分析和分類的高度監督模型。當今最先進的型號,例如DreamStudio、GPT-3、DALL-E2和Imagen已經接近一萬億個參數,并且正在完成與人類工作相媲美的復雜甚至創造性的任務。以這篇文章的標題圖片或摘要為例,都是由人工智能制造的。我們才剛剛開始看到這些模型的社會和文化影響,因為它們塑造了我們學習新事物、相互互動和創造性地表達自己的方式。
然而,今天許多技術訣竅、關鍵數據集和訓練大型神經網絡的計算能力都是封閉的,并由谷歌和Meta等"科技巨頭?"公司把關。雖然GPT-NeoX、DALLE-mega和BLOOM等開源模型的復制品由StabilityAI、EleutherAI和HuggingFace等組織率先推出,但Web3有望進一步為開源人工智能提供更多動力。
FIS CBDC戰略負責人:隱私是數字英鎊的關鍵優先事項:7月4日消息,全球金融服務公司 FIS 的 CBDC 戰略負責人 Julia Demidova 表示,對于英國央行數字貨幣而言,隱私仍然是一個關鍵優先事項。有了 CBDC,央行和監管機構可以實現更大的透明度并提高交易的可見性,同時保護個人隱私。如果英格蘭銀行繼續推行數字英鎊,就需要采取適當的保障措施來尊重最終用戶的隱私。[2023/7/4 22:17:35]
“人工智能的Web3基礎設施層可以引入開源開發、社區所有權和治理以及普及的元素,從而在開發這些新技術時創造新的模型和效率。”
此外,Web3的許多關鍵用例將通過采用人工智能技術得到加強。從生成藝術NFT到元宇宙景觀,AI將在Web3中找到許多用例。開源AI符合Web3的開放、去中心化和民主化的精神,代表了科技巨頭提供的AI的替代方案,而科技巨頭不可能很快變得開放。
基礎模型
基礎模型是在大量數據集上訓練的神經網絡,用于執行通常需要智能人類行為的任務。這些模型已經創造了一些令人印象深刻的結果。
OpenAI的GPT-3、Google的LaMDA和Nvidia的Megatron-TuringNLG等語言模型具有理解和產生自然語言、總結和合成文本,甚至編寫計算機代碼的能力。
CFTC主席:需要根除加密貨幣中的欺詐和操縱行為:金色財經報道,CFTC主席Rostin?Behnam表示,需要根除加密貨幣中的欺詐和操縱行為。[2023/3/31 13:36:34]
DALLE-2是OpenAI的文本到圖像擴散模型,可以從書面文本中生成獨特的圖像。谷歌的人工智能部門DeepMind已經產生了競爭模型,包括PaLM,一個540B參數的語言模型,以及Imagen,它自己的圖像生成模型,在DrawBench和COCOFID基準上優于DALLE-2。Imagen不僅產生的效果更逼真還具有拼寫能力。
谷歌的AlphaGo?等強化學習模型已經擊敗了人類圍棋世界冠軍,同時發現了在該游戲三千年歷史中從未出現過的新策略和下棋技巧。
BigTech處于創新的最前沿,建立復雜基礎模型的競賽已經開始。盡管該領域的進步令人興奮,但有一個關鍵主題值得我們關注。在過去的十年中,隨著人工智能模型變得越來越復雜,它們也越來越不向公眾開放。
科技巨頭正在大力投資于生產此類模型并將數據和代碼作為專有技術保留下來,同時通過其模型訓練和計算的規模經濟優勢來保持其競爭護城河。對于任何第三方來說,生成基礎模型都是一個資源密集型過程,具有三個主要瓶頸:數據、計算和貨幣化。
在這個方向,我們看到了Web3在解決其中一些問題的早期進展。
Binance NFT市場集成OpenSea上部分NFT系列:11月16日消息,Binance NFT 市場宣布完成第一階段升級且已集成 OpenSea 上部分熱門 NFT 系列。在 OpenSea 上列出的,排名前 200 的 ERC-721 標準 NFT 已集成至 Binance NFT 市場。Binance 表示未來還將支持更多 NFT 市場和區塊鏈。此外,本次升級內容還包括對 NFT 系列和單個 NFT 的指標和數據可視化升級、優化充值和支付功能等。[2022/11/16 13:13:12]
數據集生產可以通過Web3所有權進行匯總
標記數據集對于構建有效模型至關重要。人工智能系統通過歸納數據集內的示例進行學習,并隨著時間的推移不斷改進訓練。然而,高質量的數據集匯編和標記需要專門的知識和處理,以及計算資源。專門的內部數據團隊來處理大型專有數據集和IP系統,以訓練他們的模型,并且幾乎沒有動力開放對其數據的生產或分發的訪問。已經有一些社區正在向全球研究者社區開放和訪問模型訓練。
1.CommonCrawl,一個十年互聯網數據的公共存儲庫,可用于一般培訓。
2.LAION是一個非營利組織,旨在向公眾提供大規模機器學習模型和數據集,并發布了LAION5B,這是一個58.5億經過CLIP過濾的圖像-文本對數據集,一經發布就成為世界上最大的公開訪問的圖像-文本數據集。
GAP為其NFT產品的設計進行眾籌:金色財經報道,時裝零售商GAP宣布推出Gap Logo Remix,同時開始其秋季活動。這家服裝公司正在發起NFT設計比賽,邀請藝術家提交他們對GAP標志的設計。客戶可以投票選出他們最喜歡的標志,三個最受歡迎的圖像將變成GAP NFT,設計也作為實體連帽衫出售。(ledgerinsights)[2022/9/9 13:20:14]
3.EleutherAI是一個分散的集體,發布了最大的開源文本數據集之一,稱為ThePile。ThePile是一個825.18GiB的英語語言數據集,用于使用22個不同數據源的語言建模。
目前,這些社區是以非正式的方式組織起來的,并大量依靠廣大志愿者的貢獻。為了激勵社區貢獻,代幣激勵可以作為一種機制來創建開源的數據集。?代幣可以根據貢獻來發放,比如標記一個大型的文本-圖像數據集;并且DAO的存在可以驗證此類激勵聲明。最終,大型模型可以從一個公共池中發行代幣,并且基于所述模型構建的產品的下游收入可以累積到代幣價值中。這樣一來,數據集貢獻者可以通過他們的代幣持有大型模型的股份,而研究人員將能夠在開放中對構建的資源進行貨幣化。編譯構建良好的開源數據集對于擴大大型模型的研究可訪問性和提高模型性能至關重要。可以通過增加不同類型圖像的大小和過濾器來擴展文本-圖像數據集,以獲得更精細的結果。非英語數據集將需要用于訓練非英語人群可以使用的自然語言模型。逐漸地,我們可以使用Web3更快、更公開地實現這些結果。
以太坊網絡GAS費跌至20以下:5月15日消息,據Ultrasound網站數據顯示,以太坊網絡GAS費用跌至20以下,一度觸及14,截止發稿為17。這意味著,以太坊網絡活躍度再次跌至階段性低點。[2022/5/15 3:17:09]
隨著時間的推移,計算將轉移到去中心化網絡訓練大規模神經網絡所需的計算是基礎模型中最大的瓶頸之一。在過去十年中,訓練AI模型的計算需求每3、4個月翻一番。在此期間,人工智能模型已經從圖像識別到使用強化學習算法,再到在戰略游戲中擊敗人類冠軍,以及利用轉化器訓練語言模型。例如,OpenAI的GPT-3有1750億個參數,訓練時間為3640petaFLOPS-day包括一天里每秒執行1015個神經網絡操作,或者總共大約1020個操作?)。在世界上最快的超級計算機上,這需要兩周時間,而標準筆記本電腦需要一千年以上的時間來計算。隨著模型規模的不斷增長,計算仍然是該領域發展的瓶頸。
AI超級計算機需要經過優化的特定硬件,以執行訓練神經網絡所需的數學運算,例如圖形處理單元(GPU)或專用集成電路(ASIC)。如今,針對此類計算優化的大多數硬件都由少數寡頭云服務提供商控制,例如GoogleCloud、AmazonWebServices、MicrosoftAzure和IBMCloud。
這是我們看到通過公共的、開放的網絡進行去中心化的計算分配的下一個主要交叉點。去中心化治理可用于資助和分配資源以培訓社區驅動的項目。此外,去中心化的市場模型可以跨地域公開訪問,這樣任何研究人員都可以訪問計算資源。想象一個通過發行代幣來眾籌模型訓練的賞金系統。成功的眾籌將為其模型獲得優先計算權,并在需求量大的地方推動創新。例如,如果DAO有很大的需求,要制作一個西班牙語或印地語的GPT模型系列是由OpenAI提出的非常強大的預訓練語言模型,這一系列的模型可以在非常復雜的NLP任務中取得非常驚艷的效果,例如文章生成,代碼生成,機器翻譯,Q&A等,而完成這些任務并不需要有監督學習進行模型微調。)以服務于更大范圍的人口,那么研究就可以集中在這個領域。
像GenSyn這樣的公司已經在努力推出協議,以激勵和協調替代、經濟高效和基于云的硬件訪問,以進行深度學習計算。隨著時間的推移,在我們共同探索人工智能的前沿,使用Web3基礎設施構建的共享、分散的全球計算網絡將變得更具成本效益,以擴展和更好地為我們服務。
開放獲取和產品協調
數據集和計算將使這篇論文變得可能:開源人工智能模型。在過去的幾年里,大型模型變得越來越私人化,因為制作這些模型所需的資源投資已經推動項目成為閉源的了。
以OpenAI為例。OpenAI成立于2015年,是一家非營利性研究實驗室,其使命是為全人類的利益生產通用人工智能,這與當時的人工智能領導者谷歌和Facebook形成鮮明對比。隨著時間的推移,激烈的競爭和資金壓力逐漸侵蝕了透明度和開源代碼的理想,因為OpenAI轉向營利性模式并與微軟簽署了10億美元的大規模商業協議。此外,最近的爭議圍繞著他們的文本到圖像模型DALLE-2,因為它的普遍審查制度.訪問這些模型的私人測試版對西方用戶具有隱含的地理偏見,這導致切斷全球大部分人口與這些模型的交互和通知。
這不是人工智能應該傳播的方式:由幾家大型科技公司看守、監管和保護。與區塊鏈的情況一樣,新技術應該盡可能公平地應用,這樣它的好處就不會集中在少數可以使用的人身上。人工智能的復合進展應在不同行業、地域和社區之間公開利用,共同發現最具吸引力的使用案例,并就人工智能的公平使用達成共識。保持基礎模型的開源可以確保防止審查,并在公眾視野下仔細監測偏見。
借助通用基礎模型的代幣模型,將有可能聚集更多的貢獻者,他們可以在發布代碼開源的同時將其工作貨幣化。像OpenAI這樣以開源論文為基礎建立的項目不得不轉向一個獨立的資助公司,以競爭人才和資源。Web3允許開源項目在經濟上同樣有利可圖,并進一步與由BigTech私有投資領導的項目競爭。此外,在開源模型之上構建產品的創新者可以放心地構建,因為底層人工智能是透明的。其下游效應將是新型人工智能用例的快速采用和上市。在Web3領域,這包括對智能合約漏洞進行預測分析的安全應用程序,可用于鑄造NFT和創建元界景觀的圖像生成器,可存在于鏈上以保留個人所有權的數字AI個性等等。
結論
人工智能是當今發展最快的技術之一,將對我們整個社會產生巨大影響。今天,該領域由BigTech主導,因為對人才、數據和計算的金融投資為開源開發創造了重要的護城河。Web3整合到AI的基礎設施層將是關鍵步驟,確保人工智能系統以公平、開放和可訪問的方式構建。我們已經看到開放模型在Twitter和HuggingFace等開放空間中采取快速、公共創新的位置,而加密貨幣可以推動這些努力超前發展。
以下是CoinFund投資團隊在AI和crypto的交叉點上所尋找的項目:
1.以開放式人工智能為核心的團隊
2.管理公共資源以幫助構建AI模型的社區
3.利用人工智能將創造力、安全性和創新帶入主流應用的產品
責任編輯:MK
北京時間10月18日,備受市場期待的Aptos正式上線主網Autumn。作為「Meta」系選手,Aptos誕生之初就吸引加密社區及VC關注,獲得a16z、FTXVentures等頂級機構支持.
1900/1/1 0:00:001986年,早期的互聯網供應商QuantumLink和娛樂公司LucasfilmGames發布了第一款MMO游戲名為:《Habitat》基于虛擬角色的社交世界.
1900/1/1 0:00:009月15日以太坊合并成功,從POW轉成了POS,以太坊開啟全新時代。但礦機算力還存在,部分礦機算力轉到了ETHW網絡上,繼續挖礦.
1900/1/1 0:00:00區塊鏈開始擴展時會發生什么?你會遇到數據可用性的問題。我們來分析一下它是什么,以及@CelestiaOrg是如何在可擴展數據層架構上進行創新的.
1900/1/1 0:00:00結構性產品將為DeFi帶來大規模應用,它們以相對較低的風險釋放出高收益的機會。結構性產品可以被定義為預先包裝好的投資產品,它們的回報與至少1種相關資產的價格行為相關,其中一些產品允許用戶對資產波.
1900/1/1 0:00:00隨著NFT市場的發展,很多大型項目去年的交易量達到了數十億美元,還有一些項目影響力不斷上升。他們當中的一部分已經吸引了Web3和傳統公司的大量關注.
1900/1/1 0:00:00