買比特幣 買比特幣
Ctrl+D 買比特幣
ads
首頁 > Bitcoin > Info

CHA:AI“百模大戰”打響,誰能稱王?_HAT

Author:

Time:1900/1/1 0:00:00

來源:《科創板日報》

記者張洋洋

“根據現在的反饋,任務性能測試上,包括ChatGPT在內,沒有一個大模型能夠全部達標。”這基本上是業內對雨后春筍般不斷涌現的人工智能大模型的共識。

ChatGPT推出后,基于大語言模型技術的同類型產品還在加快涌現。進入4月以來,從互聯網大廠,到A股上市公司,以及一眾創業公司,再加上高校科研院校,都先后發布各自的大模型,總數已經超過30家。

短短數月,多個模型競相涌現,各家模型實力究竟如何?國內大模型是否過剩了?行業終局,究竟是百花齊放,還是贏家通吃?在這場技術變革的討論聲中,大模型帶來的新能力里,哪些是最為關鍵的,最有可能帶來長期影響的?

AI大模型如雨后春筍任務性能測試還未有“滿分答卷”

據民生證券的統計,國內已有超30個大模型亮相,行業儼然一副“百模大戰”的場景。

根據《科創板日報》記者約訪的人工智能行業人士反饋來看,業內目前還沒有就具體模型給出直接的評判定論,但他們提供了一些維度,供外界做參考。

尼日利亞eNaira錢包數量已達1300萬個,年內交易價值增長63%:金色財經報道,由于現金短缺,尼日利亞人開始轉向該國央行數字貨幣(CBDC)。尼日利亞央行(CBN)行長Godwin Emefiele在新聞發布會上對記者說,自去年10月以來,eNaira錢包的數量增長了12倍多,達到1300萬個,今年的交易價值增長了63%,達到220億奈拉(合4800萬美元)。該國CBDC于2021年10月推出。(彭博社)[2023/3/22 13:19:46]

思必馳聯合創始人兼首席科學家、上海交通大學教授俞凱在接受《科創板日報》記者采訪時表示,一個必須要承認的事實是,現在的大模型,只有ChatGPT通過了通用性測試,國內大模型與之對比,均還存在差距。

俞凱告訴記者,衡量一個大模型實力,第一是可以基于任務的性能測試,即通過定義任務集的方式,去比較所有大模型在每個任務上面的完成度。這種性能測試與人類能力對齊,包括理解能力、推理能力、判斷能力等。根據現在的反饋,任務性能測試上,包括ChatGPT在內,沒有一個大模型能夠全部達標。

第二,從安全性角度去判斷,這一點更多的體現為大模型與人類價值觀的耦合程度。

第三,是模型運行角度,從工程特性去判斷。“這是一個特別重要的能力。”俞凱強調,如該大模型能夠接收多大的文本、回答反應的速度、運行的性能等。

Li.Fi呼吁Uniswap部署在BNB Chain上不要只通過一個跨鏈橋:2月6日消息,跨鏈DEX聚合協議 LI.FI 敦促 Uniswap 社區不要僅與一家橋接提供商一起部署在 BNB Chain 上。Uniswap 這么大的協議不應該只依賴一個跨鏈橋。并指出,沒有一個 AMB(任意消息傳遞橋)經過足夠的測試,可以被認為是 Uniswap 規模的項目目前可以完全依賴的強大而安全的解決方案。加密橋聚合器 Li.Fi 建議Uniswap應該開發一個強大的橋評估框架作為通用治理模型。然后可以將其作為以太坊改進協議進行推廣,為使用橋接器提供商的其他區塊鏈應用程序設定標準。[2023/2/7 11:50:49]

俞凱所言,側重于技術指標。當然,也有從資源稟賦層面作出判斷的。

大模型領域資深行業人士王鈞則告訴記者,做大模型對團隊要求非常高,資金、技術、工程、產品、商業化等多個方面都不能有短板,最終考驗的是:核心成員對大方向、大節奏有沒有真正想清楚,能不能獲取足夠多的資源和支持,能否吸引各方面的關鍵人才加盟,吸引了一群不同背景的牛人之后,能不能磨合好。

“其中最稀缺的是核心算法研究和平臺工程的技術人才,這方面整個華人圈子人數都不多。”王鈞強調。

MetaThaicoin(TAC)已經完成全新的DAO構建:據官方消息,MetaThaicoin宣稱,TAC已經完成在T生態上構建DAO基礎設施,將會在8月3日推出。TAC的DAO治理是擁有穩定資產支持的DEFI經濟,玩家可以通過質押TAC代幣DEFI挖礦,產出的礦稅用于DAO治理。形成一個閉環DAO治理經濟。同時MetaThaicoin還宣稱,希望能夠通過TAC DAO幫助到市場用心研發區塊鏈應用的項目,幫助大家能夠平穩度過瓶頸。[2022/7/31 2:49:58]

人才之爭,這在大模型市場的起勢階段已有十分鮮明的寫照。

“先發制人”的百度,派出的掌舵者是CTO王海峰,創業者團隊中,瀾舟科技的周明,銜遠科技的周伯文等,他們在人工智能行業的影響力已經無需多言。此前,高調官宣人工智能創業的王慧文,入局的第一步就是在其個人社交媒體平臺發英雄帖,重金招聘頂級研發人才。

“判斷做得好不好的標準,不能看各公司自己的宣傳,一些業界公認的評測基準當然也可以作為參考,但最重要的還是用戶的認可,用戶尤其是高頻或者付費用戶最多的才是最好的。”王鈞稱。

逼近了AGI核心產業應用“泛化性”才是關鍵

囿于各種商業原因,對于各公司大模型實際的數據、測試反饋指標、投入的資源情況,乃至用戶數據等,外界很難全然知曉,那么對其實力情況,也很難去做全然科學的判斷。

哈薩克斯坦AIFC投資部副主任:哈薩克斯坦仍舊是礦工的理想選擇:1月25日消息,就哈薩克斯坦目前挖礦現狀,AIFC(阿斯塔納國際金融中心)投資部副主任Arman Batayev表示,從今年1月1日開始,加密貨幣挖礦業務已經正式開始在該國交稅,稅率為$0.0023/kwt。然而,目前該國內并非所有礦機都在運作,因為哈薩克斯坦正在經歷枯水期,預計到3月之后才會好轉,因此部分礦工正在向俄羅斯遷移。幾周前,哈薩克斯坦經歷了暴亂,但Arman仍然認為這個國家是礦工的理想選擇,主要是由于低廉的電費以及寒冷的氣候。不過,他認為新的電力投資是哈薩克斯坦最需要改善的方面,這在過去30年都沒有任何改變,而大量礦工的到來更是揭露了這一現狀。(巴比特)[2022/1/25 9:11:45]

但記者注意到,受訪者們均提到了一個顯性的評測角度,那就是“用戶反饋”,如回答的反應速度、準確性、可用性、上下文連貫邏輯等。這也是為何,每逢一個大模型新品推出,用戶第一時間會去關注回答是否會“翻車”。

就國內當下幾個代表性大模型,《科創板日報》記者此前均有過實際體驗,結合多位用戶的使用反饋,目前大模型整體呈現如下特征:

ChatGPT-4是一個多模態大型語言模型,支持圖像和文本輸入,以文本形式輸出,在“模擬人類”的文本輸出方面,以及用戶規模上,綜合實力領先。

分析 | Seachain.io: 法幣交易所成交額近4天持續上升 ETH數據無明顯波動信號:根據Searchain.io數據分析:昨日ETH市場較前日相比活躍度有所增長。大額轉賬5000-10000和10000+的數量均有所增長,大戶活動較前日活躍程度增加。昨日法幣交易所成交額與前日相比有明顯增長,近四天一直呈增長狀態。普通交易所和合約交易所成交額變化不大。根據數據分析,ETH市場投資者參與度整體呈小幅上升趨勢,但并無明顯波動信號。

投資有風險,入市須謹慎。

本資訊不作為投資理財建議。[2018/11/14]

相比之下,國內大模型種類多樣,能力各有千秋,目前更注重探索產業應用,用于解決產業技術壁壘問題。

在中文語義方面,國內包括文心一言、千義通問等各模型理解能力有高有低,并未明顯拉開距離。在對刁鉆中文語句的理解方面,因國內大模型的訓練數據主要來自中文語料庫,相比于ChatGPT主要來自英文語料庫,國產大模型因而會更勝一籌。

但也有個例。復旦大學邱錫鵬教授團隊發布國內首個類ChatGPT模型MOSS,其英文回答水平比中文高,原因在于,英文作為科研主流語言,在學術界和工業界中得到廣泛應用,積累了大量高質量的語料數據,且相較中文數據,英文數據開源程度高。

另外,MOSS在設計時考慮了人類的倫理道德準則,不會產生有偏見或可能有害的回答,這在一定程度會避免一些潛在的法律風險和商業倫理問題。這一點上,ChatGPT則沒有明確地處理。

大模型測評聲仍在此起彼伏。但俞凱坦言,目前去評判各模型能力如何以及好壞,其實不是合適的時間點。

在他看來,現在已經面世的大模型,變革在于,基本都已實現思維鏈的涌現能力,逼近了AGI最核心的部分,業界現在更關注大模型是否有足夠的“泛化性”,即廣泛使用,但從產業角度而言,國內大模型的用戶量級也還未達到泛在化。

“在未達到廣泛的通用性之前,以通用性的標準去做評判,還是需要慎重。”俞凱強調。

大模型并未過剩先發者未必就是"王者"

多個模型短期內同時涌向市場,也有觀點提出,現在需要這么多大模型嗎?換句話說,大模型現在過剩了嗎?

行業普遍認為,盡管現在這么多大模型出現,但還遠達不到過剩的程度。

王鈞認為,大模型對廠商的技術、資金、實力要求,目前只能說現在的產品剛剛能夠用得上。

俞凱表示,未來的行業AI應用范式將從一個通用模型變成一簇通用模型,大模型會分化,如按照領域區分,按功能區分,結合具體行業具體場景。現在來看,非常專業的精深大模型還沒出來,這些會在今后不斷涌現。

達觀數據創始人兼CEO陳運文在接受《科創板日報》記者采訪時也表示,大模型賽道目前國內是處于探索趕超階段,技術本身也還不成熟,未來還有很大的成長空間,“就像現在的飲料品牌一樣,如果拉長時間線來看,今天的大模型數量其實并不多。”

那么在未來,行業的終局,究竟是百花齊放,還是贏家通吃?

俞凱和陳運文均表示,未來將會是百花齊放的狀態,原因就在于現在正處于起步階段,未來大模型在每個行業里面生長出來的產品形態都會不一樣,而面向不同的行業,也將會出現垂直行業的應用模型。

王鈞則表示,大模型的高門檻決定了這是少數玩家才能做的事情,未來不會是百花齊放的姿態,但究竟會不會像搜索引擎一樣一家獨大,還是操作系統只有兩三家的局面,亦或是云計算多家發展的格局,“現在沒法判斷,還是有些變量。”

多位資深業內人士告訴《科創板日報》記者,在人工智能大模型上,OpenAI只是暫時一個暫時領先的“先發者”,微軟綁定OpenAI后確實取得了一定的競爭優勢,但要看到谷歌、亞馬遜、Meta等也正在奮起直追。未來到底哪家公司能夠攜AI大模型取得類似蘋果今天一樣的全球市場地位,目前還極難判斷。先發者并不是最后王者的案例太多太多,以中國互聯網發展為例,最先出發的是新浪、搜狐、網易,但后面真正切得大蛋糕的卻是騰訊、阿里和字節等。

要更多地關注和深入思考AI的應用場景

無論是詫異ChatGPT的驚人表現,還是對“百模大戰”的思考,今日種種關于大模型的討論,本質無外乎這場技術革命給人類帶來的機會和挑戰。

但在網易有道CEO、計算機科學博士周楓看來,在這場技術風潮討論中,還有一個問題沒有被充分討論,那就是大模型帶來的新能力中,哪些是最為關鍵的,最有可能帶來長期影響的。

周楓認為,與之前眾多的自然語言處理技術相比,大語言模型至少具有三項根本性新能力:涌現能力、作為基座模型支持多元應用的能力、支持對話作為統一入口的能力。

周楓表示,涌現能力之所以重要,不僅因為它們是大模型出現后才有的新能力,而且由大模型涌現出來的,多數是非常重要的能力。例如,常識推理能力一直是AI領域的重大難題,而大模型的出現使得常識推理取得了重大進展。再比如,一旦‘推理‘能力涌現,“思維鏈提示”策略就可以用來解決多步推理的難題。“因此,涌現能力的出現,是大模型帶來的一項根本性變化”。

在基座模型方面,周楓說到,大型模型不僅可以縮短每個具體應用的開發周期,減少所需人力投入,也可以基于大模型的推理、常識和寫作能力,獲得更好的應用效果。因此,大模型可以成為AI應用開發的大一統基座模型,這是一個一舉多得、全新的范式,值得大力推廣。

本輪讓大語言模型真正火爆的契機,是基于對話聊天的ChatGPT。周楓表示,雖然之前的聊天機器人存在各種問題,但大型語言模型的出現再次讓聊天機器人這種交互模式可以重新想像。未來或將涌現出很多類似的以對話形態讓助手完成各種具體工作的項目。

“這三項能力在學術界已經被廣泛討論,甚至被視為常識,但是在產業界和產品團隊中卻缺乏足夠的關注。”周楓稱,“這些大模型技術的特點已經改變了我們對業務和產品規劃的思考方式,也會改變很多產品的經濟模型。因此,產品經理和業務負責人需要更多地關注和深入思考這些新能力的應用場景。”

俞凱也認為,在這場技術變革,除了技術層面的參數量級,資源層面的算法、算力、數據、人才資金等的討論,更需要關注的是,除大語言模型之外,其他與人工智能體系相關的東西。

這些就包括對語言的理解,對對話式人工智能的理解,以及對多模態人工智能的理解等。這些不僅是單獨算法的問題,還關涉業務,訓練策略,以及對人工智能技術歷程的理解。

Tags:CHACHATGPTHATHealth care chainchat幣下架gpt幣團隊Hat Swap City

Bitcoin
CAST:重塑聯系:去中心化社交網絡全景解析_0xCASH

作者:STEVENSHI編譯:Kxp,Blockbeats本報告重點研究了去中心化社交協議的發展,深入探討了其優勢與挑戰,同時分析了一系列DeSoc協議的架構設計.

1900/1/1 0:00:00
CRY:對話ABCDE Capital聯創BMAN:若Crypto是樹 我們會投樹根和樹葉_CryptoKnitties

去年6月,BMAN宣布他與火幣聯合創始人杜均合作,推出了一個4億美元的基金,該基金將專注于Web3建設者。新基金的名稱是ABCDE,代表「以區塊鏈為中心的發展生態系統」.

1900/1/1 0:00:00
DEFI:以太坊的睡后收入:從經典質押到DeFi期權_ETH

在以太坊生態系統中,有多種策略可幫助ETH投資者實現睡后收入。本文總結了三種主要策略:經典質押、DeFi積木和DeFi期權金庫,以及它們的風險和回報.

1900/1/1 0:00:00
COIN:MEME幣實操指南:如何用工具找到下一個爆發的迷因幣?_OIN

作者:serp1337.eth?|NFTDegenMeme無疑是近日最熱板塊,以PEPE、WOJAK為首的Meme幣輪番暴漲,但對于多數加密人士而言,每次都是后知后覺.

1900/1/1 0:00:00
Chain:用ChatGPT分析美聯儲鷹鴿!摩根大通構建了一款“新神器”_DNP chain

來源:財聯社 編輯瀟湘 在美聯儲下周即將召開5月議息會議之際,摩根大通推出了一款由人工智能驅動的最新模型,旨在破譯美聯儲對外釋放的信息,并發現潛在的交易信號.

1900/1/1 0:00:00
WEB3:張烽:以NFT為切入口 叩響傳統企業Web3化的大門_BNB

隨著數字時代的來臨,Web3化成為社會熱議的焦點,也是企業最希望尋求突破的一個訴求,如何擁抱Web3,借力進行數實融合,并且取得階段性的成效?圍繞這個話題,日前.

1900/1/1 0:00:00
ads