來源:新智元
ChatGPT爆火之后,谷歌和微軟兩巨頭的AI大戰戰火,已經燒到了新的領域——服務器芯片。
如今,AI和云計算都成了必爭之地,而芯片,也成為降低成本、贏得商業客戶的關鍵。
原本,亞馬遜、微軟、谷歌這類大廠,都是以軟件而聞名的,而現在,它們紛紛斥資數十億美元,用于芯片開發和生產。
各大科技巨頭研發的AI芯片
ChatGPT爆火,大廠開啟芯片爭霸賽
根據外媒TheInformation的報道以及其他來源,這三家大廠現在已經推出或計劃發布8款服務器和AI芯片,用于內部產品開發、云服務器租賃或者二者兼有。
「如果你能制造出針對AI進行優化的硅,那前方等待你的將是巨大的勝利」,研究公司Forrester的董事GlennO’Donnell這樣說。
付出這些巨大的努力,一定會得到回報嗎?
答案是,并不一定。
英特爾、AMD和英偉達可以從規模經濟中獲益,但對大型科技公司來說,情況遠非如此。
英偉達黃仁勛:元宇宙能幫企業省下數十億美元:金色財經報道。英偉達首席執行官黃仁勛(Jensen Huang)在接受《瘋狂的金錢(Mad Money)》節目采訪時,黃仁勛描繪了一個互聯的虛擬現實世界,其超越了娛樂和商業的范疇,他表示,企業可以依靠元宇宙減少成本浪費,提高運營效率。
黃仁勛稱,“我們浪費了大量的東西來補償那些我們沒有進行模擬的事實。我們想在元宇宙中模擬工廠,模擬植物,模擬現實世界里的電網。”“這樣一來,我們可以減少浪費,這就是企業會因為元宇宙而獲得經濟收益的原因。他們會愿意購買這種人工智能能力,借此省下數十億美元。”(cnbc)[2021/11/21 7:02:44]
它們還面臨著許多棘手的挑戰,比如需要聘請芯片設計師,還要說服開發者使用他們定制的芯片構建應用程序。
不過,大廠們已經在這一領域取得了令人矚目的進步。
根據公布的性能數據,亞馬遜的Graviton服務器芯片,以及亞馬遜和谷歌發布的AI專用芯片,在性能上已經可以和傳統的芯片廠商相媲美。
亞馬遜、微軟和谷歌為其數據中心開發的芯片,主要有這兩種:標準計算芯片和用于訓練和運行機器學習模型的專用芯片。正是后者,為ChatGPT之類的大語言模型提供了動力。
此前,蘋果成功地為iPhone,iPad和Mac開發了芯片,改善了一些AI任務的處理。這些大廠,或許正是跟蘋果學來的靈感。
若英偉達交易失敗 高通有意投資Arm:6月14日消息,將于6月30日起接任首席執行官職位的高通總裁克里斯蒂亞諾· 阿蒙表示,如果軟銀決定讓芯片設計公司Arm上市而非將其出售給英偉達,該公司將與行業其他公司一起收購Arm的股份。
克里斯蒂亞諾· 阿蒙說,“如果Arm有獨立的未來,我認為你會發現,行業生態內的很多公司,包括高通,都有興趣投資Arm。”高通、谷歌和微軟等公司對英偉達收購Arm表示擔憂,稱這筆交易可能影響到Arm的獨立且會損害競爭。(金十)[2021/6/14 23:34:17]
在三家大廠中,亞馬遜是唯一一家在服務器中提供兩種芯片的云服務商,2015年收購的以色列芯片設計商AnnapurnaLabs,為這些工作奠定了基礎。
谷歌在2015年推出了一款用于AI工作負載的芯片,并正在開發一款標準服務器芯片,以提高谷歌云的服務器性能。
相比之下,微軟的芯片研發開始得較晚,是在2019年啟動的,而最近,微軟更加快了推出專為LLM設計的AI芯片的時間軸。
而ChatGPT的爆火,點燃了全世界用戶對于AI的興奮。這更促進了三家大廠的戰略轉型。
英偉達更新驅動升級RTX 3060挖礦限制器:4月30日消息,英偉達發布了GeForce 466.27驅動,更新描述中指出此次更新升級了RTX 3060的挖礦限制器,僅適用于5月中旬以后的產品。(中關村在線)[2021/4/30 21:14:00]
ChatGPT運行在微軟的Azure云上,使用了上萬塊英偉達A100。無論是ChatGPT,還是其他整合進Bing和各種程序的OpenAI軟件,都需要如此多的算力,以至于微軟已經為開發AI的內部團隊分配了服務器硬件。
在亞馬遜,首席財務官BrianOlsavsky在上周的財報電話會議上告訴投資者,亞馬遜計劃將支出從零售業務轉移到AWS,部分原因是投資于支持ChatGPT所需的基礎設施。
在谷歌,負責制造張量處理單元的工程團隊已經轉移到谷歌云。據悉,云組織現在可以為TPU和在其上運行的軟件制定路線圖,希望讓云客戶租用更多TPU驅動的服務器。
谷歌:為AI特調的TPUV4
早在2020年,谷歌就在自家的數據中心上部署了當時最強的AI芯片——TPUv4。
不過直到今年的4月4日,谷歌才首次公布了這臺AI超算的技術細節。
動態 | 英偉達第一季度收入好于預期 加密貨幣價格上漲使其加密業務有所改善:據Live Bitcoin News 5月20日消息,英偉達近期公布其第一季度收入,結果顯示好于預期。同時由于加密貨幣價格上漲,英偉達加密挖礦工具的銷售情況有所改善。[2019/5/20]
相比于TPUv3,TPUv4的性能要高出2.1倍,而在整合4096個芯片之后,超算的性能更是提升了10倍。
同時,谷歌還聲稱,自家芯片要比英偉達A100更快、更節能。對于規模相當的系統,TPUv4可以提供比英偉達A100強1.7倍的性能,同時在能效上也能提高1.9倍。
對于相似規模的系統,TPUv4在BERT上比A100快1.15倍,比IPU快大約4.3倍。對于ResNet,TPUv4分別快1.67倍和大約4.5倍。
另外,谷歌曾暗示,它正在研發一款與NvidiaH100競爭的新TPU。谷歌研究員Jouppi在接受路透社采訪時表示,谷歌擁有「未來芯片的生產線」。
微軟:秘密武器雅典娜
不管怎么說,微軟在這場芯片紛爭中,依舊躍躍欲試。
此前有消息爆出,微軟秘密組建的300人團隊,在2019年時就開始研發一款名為「雅典娜」的定制芯片。
動態 | 英偉達未受加密貨幣挖礦影響 第三季度仍將獲利:據CCN報道,盡管近期全球范圍內加密貨幣挖礦的利潤下滑,加密挖礦業正在經歷放緩,但英偉達(Nvidia)仍將在2018年第三季度獲利。據悉,英偉達的主要市場是游戲,該市場的顯卡銷售依舊強勁,該公司的數據中心芯片今年也表現不俗。很難確切地知道具體多少顯卡被用于游戲而非挖礦,但最近的數據表明,目前在世界上許多地方,開采一枚比特幣的成本實際上大于其價格,在其他一些地區的礦工也僅能獲得微薄的利潤。[2018/8/14]
根據最初的計劃,「雅典娜」會使用臺積電的5nm工藝打造,預計可以將每顆芯片的成本降低1/3。
如果在明年能夠大面積實裝,微軟內部和OpenAI的團隊便可以借助「雅典娜」同時完成模型的訓練和推理。
這樣一來,就可以極大地緩解專用計算機緊缺的問題。
彭博社在上周的報道中,稱微軟的芯片部門已與AMD合作開發雅典娜芯片,這也導致AMD的股價在周四上漲了6.5%。
但一位知情者表示,AMD并未參與其中,而是在開發自己的GPU,與英偉達競爭,并且AMD一直在與微軟討論芯片的設計,因為微軟預計要購買這款GPU。
亞馬遜:已搶跑一個身位
而在與微軟和谷歌的芯片競賽中,亞馬遜似乎已經領先了一個身位。
在過去的十年中,亞馬遜在云計算服務方面,通過提供更加先進的技術和更低的價格,一直保持了對微軟和谷歌的競爭優勢。
而未來十年內,亞馬遜也有望通過自己內部開發的服務器芯片——Graviton,繼續在競爭中保持優勢。
作為最新一代的處理器,AWSGraviton3在計算性能上比上一代提高多達25%,浮點性能提高多達2倍。并支持DDR5內存,相比DDR4內存帶寬增加了50%。
針對機器學習工作負載,AWSGraviton3比上一代的性能高出多達3倍,并支持bfloat16。
基于Graviton3芯片的云服務在一些地區非常受歡迎,甚至于達到了供不應求的狀態。
亞馬遜另一方面的優勢還表現在,它是目前唯一一家在其服務器中提供標準計算芯片和AI專用芯片云供應商。
早在2019年,亞馬遜就推出了自己的AI推理芯片——Inferentia。
它可以讓客戶可以在云端低成本運行大規模機器學習推理應用程序,例如圖像識別、語音識別、自然語言處理、個性化和欺詐檢測。
而最新的Inferentia2更是在計算性能提高了3倍,加速器總內存擴大了4倍,吞吐量提高了4倍,延遲降低到1/10。
在初代Inferentia推出之后,亞馬遜又發布了其設計的主要用于AI訓練的定制芯片——Trainium。
它對深度學習訓練工作負載進行了優化,包括圖像分類、語義搜索、翻譯、語音識別、自然語言處理和推薦引擎等。
在一些情況下,芯片定制不僅僅可以把成本降低一個數量級,能耗減少到1/10,并且這些定制化的方案可以給客戶以更低的延遲提供更好的服務。
撼動英偉達的壟斷,沒那么容易
不過到目前為止,大多數的AI負載還是跑在GPU上的,而英偉達生產了其中的大部分芯片。
據此前報道,英偉達獨立GPU市場份額達80%,在高端GPU市場份額高達90%。
20年,全世界跑AI的云計算與數據中心,80.6%都由英偉達GPU驅動。21年,英偉達表示,全球前500個超算中,大約七成是由自家的芯片驅動。
而現在,就連運行ChatGPT的微軟數據中心用了上萬塊英偉達A100GPU。
一直以來,不管是成為頂流的ChatGPT,還是Bard、StableDiffusion等模型,背后都是由每個大約價值1萬美元的芯片英偉達A100提供算力。
不僅如此,A100目前已成為人工智能專業人士的「主力」。2022人工智能現狀報告還列出了使用A100超級計算機部分公司的名單。
顯而易見,英偉達已經壟斷了全球算力,憑借自家的芯片,一統江湖。
根據從業者的說法,相比于通用芯片,亞馬遜、谷歌和微軟一直在研發的專用集成電路芯片,在執行機器學習任務的速度更快,功耗更低。
O’Donnell董事在比較GPU和ASIC時,用了這樣一個比較:「平時開車,你可以用普銳斯,但如果你必須在山上用四輪驅動,用吉普牧馬人就會更合適。」
然而盡管已經做出了種種努力,但亞馬遜、谷歌和微軟都面臨著挑戰——如何說服開發者使用這些AI芯片呢?
現在,英偉達的GPU是占主導地位的,開發者早已熟悉其專有的編程語言CUDA,用于制作GPU驅動的應用程序。
如果換到亞馬遜、谷歌或微軟的定制芯片,就需要學習全新的軟件語言了,他們會愿意嗎?
5月11日,全球第二大加密貨幣交易平臺、領先的Web3生態系統?OKX?與SignalPlus?正式達成深度合作,SignalPlus?將為?OKX?全球用戶提供高級期權交易工具.
1900/1/1 0:00:00"當利潤達到10%時,便有人蠢蠢欲動;當利潤達到50%的時候,有人敢于鋌而走險;當利潤達到100%時,他們敢于踐踏人間一切法律;而當利潤達到300%時,甚至連上絞刑架都毫不畏懼.
1900/1/1 0:00:00據ConsenSys官網3月15日報道,ConsenSys宣布完成了一輪4.5億美元的融資,使其估值超過70億美元.
1900/1/1 0:00:00概述 上期我們了解了利用tx.origin進行釣魚的攻擊手法,本期我們來帶大家了解一下如何識別在合約中隱藏的惡意代碼.
1900/1/1 0:00:00據《華爾街日報》報道,總部位于美國馬薩諸塞州的保險公司MassMutual已為其一般投資帳戶購買了價值1億美元的比特幣.
1900/1/1 0:00:00來源:法制日報 對AIGC監管的相關問題需要考慮四個方面,一是監管何時介入,需要考慮技術的負外部性導致的風險程度高低;二是監管對象的選擇,是選擇技術和服務本身.
1900/1/1 0:00:00