3月22日,玩家和AI從業者們又愛又恨的老黃,帶著他的新“核彈”來了。遺憾的是,這次的新“核彈”與玩家沒有太大關系,主要是針對企業和工業市場,與玩家有關的RTX40系估計最快也要等到9月份才會有消息。
好了,廢話不多說,讓我們看看老黃這次又拿了怎樣的“大寶貝”出來。首先是A100顯卡的接任者,新一代計算卡皇H100閃亮登場,H100采用全新的Hopper架構和臺積電最新的4nm工藝,各方面的參數對比上一代的A100都有明顯的提升。
英偉達的超級服務器芯片Grace也再度曝光,對比上一次給出的數據,此次曝光的Grace芯片性能有了驚人的提升,根據發布會的描述來看,英偉達似乎也走上與蘋果相同的道路,用更多的芯片拼裝成一顆處理器。
除了硬件方面的產品曝光和發布,英偉達在軟件領域同樣帶來了不少新東西,比如主打云端協作的OmniverseCloud,讓多名用戶可以在云端直接參與同一個媒體文件的編輯和渲染等工作。
此外英偉達還展示了不少基于虛擬現實環境的工業、交通模擬案例,還有一套由AI驅動的虛擬角色系統,該系統可以通過深度學習進行動作訓練,訓練結束后不需要額外的骨骼動作設計等操作就能夠依照指令做出對應動作,這下不僅是AI從業者狂喜,電影及游戲從業者也要狂喜。
英偉達Q2挖礦顯卡收入2.66億美元,低于預期的4億美元:顯卡制造商英偉達公布了今年二季度收益情況:Q2收入65億美元,凈利潤大約23.7億美元。盡管顯卡銷售帶動了營收增長,但是英偉達該季度挖礦顯卡業務未達4億美元營收預期,實際數據為2.66億美元。與去年同期相比,其數據中心和專業可視化平臺的收入分別增長了35%和156%,而游戲收入增長了85%。(Coindesk)[2021/8/19 22:24:38]
不得不說,老黃這次帶來的東西并不少,每一樣都能對AI等行業的發展帶來明顯的改變,下面我們就來詳細的看看英偉達到底都發布了什么吧。
H100與Grace
從去年開始,就有消息稱英偉達將會在今年發布新一代計算卡,并且將用上全新的Hopper架構。目前來看消息準確的,只不過當初大家猜測新一代計算卡將采用臺積電5nm工藝,但是如今看來英偉達選擇一步到位使用了最新的4nm工藝,雖然本質上是5nm+,但是在功耗方面則有著更好的表現,而且也可以集成更高的晶體管。
實際上,從H100的核心規格來看,也不難理解為什么英偉達最終選了4nm,高達800億的晶體管集成度,比上一代A100多了整整260億個,內核數量則是提高到了16896個,這是目前世界上內核數量最高的芯片核心,同時也是上一代100的2.5倍。
加密礦企Hive Blockchain與英偉達簽訂6600萬美元的GPU采購協議:金色財經報道,加密貨幣礦企Hive Blockchain已加入英偉達網絡云服務提供商計劃,并簽訂了總合同價值為6600萬美元的GPU采購協議。這些GPU將在2021年剩余的幾個月交付,交付量將每月增加。[2021/7/2 0:21:34]
夸張的內核參數提升帶來的性能提升也極為夸張,根據英偉達官方給出的數據,H100的浮點計算和張量核心運算能力將比上一代提升至少3倍,FP32高達60萬億次/秒,而上一代的A100為19.5萬億次/秒。
H100還將是首款支持PCIe5.0和HBM3,讓內存帶寬達到驚人的3TB/s,老黃表示只需要20張H100就可以處理目前全球的網絡流量,雖然聽起來很夸張,但是確實體現出了H100夸張的性能參數。
強大性能也伴隨著夸張的功耗,英偉達給出的H100功耗高達700W,作為對比上一代A100的功耗僅400W,不過用2倍的功耗換來3倍的性能提升,整體來說也不虧。
英偉達支持加密挖礦的部門預計第一季度銷售額將達到1.5億美元:英偉達(Nvidia)周一表示,該公司第一季度營收將超過此前預計的53億美元,這得益于市場對數據中心和加密貨幣挖礦芯片的強勁需求。英偉達表示,該公司支持加密貨幣挖礦的部門預計本季度銷售額將達到1.5億美元,高于此前預期的5000萬美元。英偉達首席財務官Colette Kress表示,預計今年大部分時間需求將繼續超過供應。(路透社)[2021/4/13 20:12:30]
H100還針對AI訓練等所要用到的模型進行針對性優化,為Transformer搭載了優化引擎,讓大模型的訓練速度可以提升至原來的6倍,極大的降低了大型AI模型等訓練所需要的時間,這個特性也與下面將會談到的AI虛擬角色系統相呼應。
在英偉達給出的測試數據中,訓練一個擁有1750億參數的GPT-3模型,時間將由原來的一周降低到僅需19小時,而一個擁有3950億參數的Transforme模型也僅需21小時就可以完成訓練,效率提升近9倍。
外媒:中國以太坊礦工破解英偉達GPU算力限制并非事實:一個匿名科技推特賬戶在3月10日發布的一張截圖顯示,中國的以太坊礦工找到一種使用自定義mod繞過“GeForce RTX 30系列顯卡限制以太坊挖礦”的方法。截圖顯示,RTX 3060 GPU達到了45 MH/s的正常算力,遠高于英偉達上個月宣布的50%算力限制。對此,The Block發文稱這并非事實,與其交談的中國以太坊礦工或礦池運營商都表示,沒有看到一個真正可以繞過RTX 3060 GPU限制的解決方案可提供超過40 MH/s的哈希率性能。此前消息,芯片巨頭英偉達(Nvidia)的高端顯卡RTX 3080 Ti和RTX 3070 Ti將配有以太坊挖礦限制功能,即顯卡算力不能全部用于挖礦。同時,英偉達未來生產的所有30系列高端顯卡,都將配置以太坊挖礦限制功能。(The Block)[2021/3/13 18:40:44]
雖然參數看起來十分美好,但是實際的性能表現如何還有待后續的實際測試結果來揭曉,至少從RTX30系和A100的經驗來看,最終的實際性能提升幅度可能在2倍-2.5倍之間,不太可能真的達到3倍,不過即使只有2倍提升也已經相當出色,至少在AI方面已經完全碾壓了AMD的計算卡。
動態 | 新增兩家律師事務所對英偉達公司因有關加密方面虛假聲明提起集體訴訟:據globenewswire消息,兩家律師事務所Kuznicki Law PLLC和Bragar Eagel&Squire宣布代表NVIDIA公司(納斯達克股票代碼:NVDA)股東因有關加密方面虛假聲明進行集體訴訟。其中Bragar Eagel&Squire截止日期為2月19日。此前美國Schall律師事務所宣布對英偉達(NVIDIA)公司提起集體訴訟。[2019/2/18]
而且,H100還引入了英偉達最新的NVIDIANVLink第四代互連技術,該技術能夠進一步提升多GPU串聯的效率,在英偉達給出的數據中,串聯后的I/O帶寬能夠擴展至900GB/s,比上一代提升了50%。
再來看看英偉達的新“玩具”Grace,這是英偉達為服務器業務準備的超級服務器芯片,此前就有過不少的曝光,這次則是有了更多的信息,同時還帶來了全新的系列產品。Grace芯片采用最新的ArmV9架構,英偉達以此為基準打造了兩款超級芯片——GraceHopper和GraceCPU超級芯片。
其中,GraceHopper由一個GraceCPU和一個Hopper架構的GPU的GPU組成,兩者將會形成一個完整的運算系統,只需要一顆芯片就可以搭建出一個強大的運算服務器,同時也可以將多個芯片串聯起來組成更龐大的運算陣列。
而GraceCPU超級芯片則是由兩顆GraceCPU組成,兩顆芯片通過NVIDIANVLink-C2C技術互連,組成一個內置了144個Arm核心并且擁有1TB/s內存帶寬的巨無霸級芯片。
說實話,英偉達的這顆GraceCPU超級芯片很難不讓人聯想到蘋果在春季發布會上發布的M1Ultra,同樣是基于Arm架構,同樣是由兩顆芯片組合而成,同樣也有著夸張的內存帶寬和性能表現。
顯然,芯片互聯拼裝技術已經成為行業的趨勢之一,AMD方面也曝光有采用類似技術的CPU正在研發中,最早將在2023年與大家見面。只能說如今單顆芯片的性能發展已經接近極限,接下來想要擁有更大的提升,或許將不得不借助類似的互聯技術進行芯片堆疊了。
不過,GraceCPU超級芯片的功耗并不低,英偉達官方給出的數據是500W,已經遠遠超過了傳統的x86架構CPU,當然,考慮到GraceCPU超級芯片的夸張性能:SPECrate跑分740分,較第二名提升60%,這個功耗也不是不能接受。
顯然,在Arm服務器領域,英偉達的野心是非常大的。
英偉達的虛擬世界
除了一堆高性能的硬件,英偉達此次也展出了不少的軟件示范案例,其中就包括使用H100等硬件來模擬一個虛擬現實環境,用以進行各種測試和模擬。在英偉達的示范中,未來的企業可以通過強大的英偉達硬件構建一個擬真的虛擬測試環境,并在其中測試自動駕駛、智能工廠的運作等。
通過虛擬測試環境的使用,研究者可以更輕松的測試自動駕駛面對各種突發狀況時的反饋,并且在測試中直接定位問題,降低整體的測試成本。此外,還可以構建一個1:1的“數字化工廠”提前模擬運行,尋找提高效率和找到可能出現的問題,降低工廠正式運行后出現問題的概率。
英偉達將這一套應用稱為“數字孿生”,能夠大幅度降低自動化工廠和自動駕駛等方面的研究及測試投入。
OmniverseCloud是英偉達新推出的一款云端創作服務,用戶通過OmniverseCloud可以在任意地點訪問和編輯大型3D場景,并且無須等待大量數據的傳輸,并且還可以讓用戶能夠直接在線協作共同搭建3D模型。
在過去,3D模型和3D場景的協同構建都需要在一個服務器上進行,而在OmniverseCloud推出后,相關創作者就可以通過任意支持OmniverseCloud的終端,直接用網絡訪問協作空間并參與其中,極大的提升了創作者的響應速度和工作自由。
另外,英偉達還為創作者們準備了第二個驚喜,一套由AI驅動的虛擬角色系統,該系統可以讓AI在短時間內完成訓練,學會各種指令所對應的動作。比如一個簡單的劈砍動作,在正常的制作流程中首先需要動作架構師通過對動作骨架的一步步調整,然后再放到場景中進行測試,整個流程需要耗費大量的時間,而且每個不同的動作都需要重新進行調試。
而在這套AI虛擬角色系統的幫助下,當你想要虛擬模型做出劈砍的動作,只需要一條指令,AI就會從已學習的動作中找出關聯動作并自動運行,直接節省了大量的時間和人力,對于游戲開發者和特效制作者而言,這個系統將讓他們能夠將更多的精力放在其它地方。
英偉達的此次發布會,雖然并沒有太多的提到元宇宙,但是從硬件到軟件都是未來構建元宇宙的基礎。目前元宇宙無法成為現實的原因主要是兩點,一個是硬件性能無法滿足我們的需要,另一個就是軟件領域尚不成熟,無法提供實時的擬真環境模擬,而這兩者是點亮元宇宙科技的基礎。
在此之前,我們首先需要的就是更強大的計算硬件及更智能的AI系統。英偉達的H100,虛擬現實環境及AI虛擬角色系統的出現,將讓我們朝著真正的元宇宙再邁進一大步。
LayerZero是一種在區塊鏈之間傳輸消息的協議。這些消息可以是交易,例如,代幣轉移或交換。Stargate則是建立在LayerZero上的橋梁和DEX.
1900/1/1 0:00:00“元宇宙”新概念的興起,正醞釀新一輪變革。隨著國外Facebook、微軟等企業押注元宇宙,網易、華為、字節跳動等國內巨頭也宣布相繼入局,元宇宙已成為下一個互聯網風口,吸引越來越多玩家的加入,看似.
1900/1/1 0:00:00我們從詳細的商業計劃開始。YugaLabs由四個朋友創立:Gargamel、Gordon、Tomato和Sass.
1900/1/1 0:00:00今日,突然曝出有多家數字藏品平臺公眾號被關閉,據元飛船不完全統計,涉及的平臺有ArtMeta元藝數、一點數藏、歸藏元宇宙、畫生Meta、元本空間、神達數藏、OneMeta、零號地球、iBox和諾.
1900/1/1 0:00:00圖源:LoganCraig2021年在很大程度上是由Layer-1的崛起決定的。繼以太坊在2020年夏天崛起后,Solana、Terra、Avalanche和Fantom等區塊鏈在網絡活動和其原.
1900/1/1 0:00:002022年比特幣大會“Bitcoin2022”即將在美國邁阿密舉行,會議時間為4月6日—9日,4天的比特幣2022會議將包括1天的會議的行業日和2天的主會日.
1900/1/1 0:00:00