買比特幣 買比特幣
Ctrl+D 買比特幣
ads
首頁 > Gate.io > Info

MAG:橫跨6種模態 Meta開源AI模型ImageBind 為虛擬世界打開大門_imagecash

Author:

Time:1900/1/1 0:00:00

來源:《科創板日報》

編輯宋子喬

當地時間5月9日,Meta宣布開源了一種可以將可以橫跨6種不同模態的全新AI模型ImageBind,包括視覺、溫度、文本、音頻、深度信息、運動讀數。目前,相關源代碼已托管至GitHub。

何為橫跨6種模態?

即以視覺為核心,ImageBind可做到6個模態之間任意的理解和轉換。Meta展示了一些案例,如聽到狗叫畫出一只狗,同時給出對應的深度圖和文字描述;如輸入鳥的圖像+海浪的聲音,得到鳥在海邊的圖像。

Stader Labs將于5月2日推出ETHx第二階段測試:4月30日消息,流動性質押協議 Stader Labs 發推稱,以太坊流動性質押代幣 ETHx 的第一階段測試已于 4 月 28 日結束,第二階段測試將于 5 月 2 日開始。Stader 的以太坊流動性質押方案需要用戶最少需要提供 4 ETH 來參與質押,Stader 會將用戶存入的資金分配給許可質押池、無需許可的質押池以及采用分布式驗證器技術(DVT)的質押池。[2023/4/30 14:35:43]

Createra公布Createra Genesis Land總供應量和玩法:2月2日消息,游戲元宇宙項目Createra發推表示共有2500個Genesis Land,其中600個留給團隊和投資者。若第一年土地占用率超過80%,則會增加Genesis Lands的總供應量,若沒有達到,將繼續維持在2500個。并且,Genesis Land分為SSS/SS/S/A/B/C等級,未來的獎勵將根據等級授予。此外,Createra將在2月初發布新功能,Bundle。如果你有3個以上相鄰的土地,你將能夠組合土地來創建捆綁包并使用徽標對其進行自定義。有關自定義更多的功能和收益情況,將在該功能上線后公布。[2023/2/3 11:44:13]

而此前的多模態AI模型一般只支持一個或兩個模態,且不同模態之間難以進行互動和檢索。ImageBind無疑具有突破性意義,Meta稱,ImageBind是第一個能夠同時處理6種感官數據的AI模型,也是第一個在沒有明確監督的情況下學習一個單一嵌入空間的AI模型。

交易員現在認為美聯儲加息周期最早在今年結束:6月23日消息,隔夜利率掉期互換市場走勢表明,交易員們開始放棄關于FOMC將在2022年12月之后繼續加息的任何預期。歐洲美元走勢意味著,美聯儲2023年甚至可能會實施單次幅度為50個基點的降息。最新數據表明,美聯儲2022年剩余時間里的加息空間為175個基點。這可以被解讀為,在美聯儲發加息行動調整為不那么激進之前,還存在進行一次75個基點加息的空間。(金十)[2022/6/24 1:27:58]

ImageBind能做到這些,核心方法是把所有模態的數據放入統一的聯合嵌入空間,無需使用每種不同模態組合對數據進行訓練

先利用最近的大型視覺語言模型它將最近的大規模視覺語言模型的零樣本能力擴展到新的模態,它們與圖像的自然配對,如視頻-音頻和圖像-深度數據,來學習一個聯合嵌入空間。

而以圖像/視頻為中心訓練好AI后,對于原始數據中沒有直接聯系的模態,比如語音和熱量,ImageBind表現出涌現能力,把他們自發聯系起來。

有行業觀察者已經迫不及待地將ImageBind于元宇宙聯系在一起。

正如Meta的研究團隊所說,ImageBind為設計和體驗身臨其境的虛擬世界打開了大門。該團隊還表示,未來還將加入觸覺、語音、嗅覺和大腦功能磁共振信號,進一步探索多模態大模型的可能性,“人類可使用多種感官學習、了解世界,借助ImageBin,機器離人類又近了一步”。

值得注意的是,Meta還表示,ImageBind可以利用DINOv2強大的視覺功能進一步提高其能力。DINOv2是Meta開源的計算機視覺領域的預訓練大模型,同樣與Meta的元宇宙愿景密不可分,MetaCEO扎克伯格此前強調,DINOv2可以極大地加持元宇宙的建設,讓用戶在元宇宙中的沉浸體驗更出色。

盡管ImageBind目前只是研究項目,沒有直接的消費者用戶或實際應用。但可以想象的是,隨著ImageBind模型逐步完善,AI應用場景將進一步拓展,元宇宙建設也將更進一步。

比如當ImageBind融入虛擬現實設備,使用者能獲得更沉浸式的體驗,玩家進入游戲后不僅能感受游戲場景的溫度,還能感知物理層面上運動。

國盛證券分析師劉高暢此前大膽預測,1-5年內,隨著多模態的發展帶來AI泛化能力提升,通用視覺、通用機械臂、通用物流搬運機器人、行業服務機器人、真正的智能家居會進入生活。未來5-10年內,結合復雜多模態方案的大模型有望具備完備的與世界交互的能力,在通用機器人、虛擬現實等領域得到應用。

Tags:MAGEBINMAGINDimagecashChainBingMAG價格PEPELINDA幣

Gate.io
LANC:通道網絡中的再平衡(Rebalancing)算法加速思路_ecell幣價格

繼上一次關于支付網絡中路由問題的全面研究之后,熱愛研究的Nervos小伙伴Shor對通道網絡中的再平衡算法又做了詳細的研究。本文中,我們會介紹通道網絡中的Rebalance問題.

1900/1/1 0:00:00
ROB:元宇宙第一股Roblox,日活近七千萬創新高,代幣銷售額破7億美元_Blox

來源丨元宇宙簡史 作者丨元宇宙簡史編輯部 作為元宇宙的先驅之一,Roblox在2023年第一季度取得了令人矚目的成績.

1900/1/1 0:00:00
COI:MemeCoin革命:用最戲謔的方式 講最動聽的故事_FRZSSCOIN幣

來源:Coinmonks加密貨幣的世界在不斷發展和擴大,每天都有新的代幣被創造。MemeCoins是當下最熱門的成員之一,它是幽默+加密的獨特而有趣的組合.

1900/1/1 0:00:00
MET:真假元宇宙:一邊生猛,一邊清醒,一邊戰栗_元宇宙

一場假裝張揚的腦洞:饑渴時,誰遞給你一杯“可樂”,你又動了誰的“奶酪”? 作者|九月 編輯?|甲小姐 審核?|劉景豐 來源:甲子光年 過去一年,科技圈什么關鍵詞最熱? “元宇宙”或是其一.

1900/1/1 0:00:00
比特幣:BRC-20炒作終將落幕 比特幣擴容迫在眉睫_primordialplanetcoin

來源:Bankless編譯:比推BitpushNewsMaryLiuMemecoin(模因幣)熱潮正在蔓延!一種稱為BRC-20的新代幣類型吸引了開發人員.

1900/1/1 0:00:00
ETF:巴比特午間要聞一覽_CETF幣

1.彭博社ETF分析師:Valkyrie申請在美國推出1.25倍杠桿比特幣期貨ETF2.《經濟學人》DeFi主題封面NFT以99.

1900/1/1 0:00:00
ads