改名Meta之后,Facebook的元宇宙愿景正在一點點實現。這一次,Facebook把目光投在了元宇宙社交上。
Meta發布語音處理模型XLS-R
近日,Meta正式發布XLS-R——一套用于各類語音任務的新型自監督模型。據悉,XLS-R由海量公共數據訓練而成(數據量是過去的十倍),能夠將傳統多語言模型的語言支持量增加兩倍以上。目前,XLS-R共支持128種語言。
Meta認為,語音交流是人們最自然的一種交互形式。“隨著語音技術的發展,我們已經能夠通過對話同自己的設備及未來的虛擬世界直接互動,由此將虛擬體驗與現實世界融為一體。”
保險巨頭Tokio Marine將在元宇宙中提供服務:金色財經報道,雖然游戲、社交和科技公司率先將元宇宙作為一個概念來接受,但其他公司現在也正在進入可用的元宇宙平臺。日本最大的財產和意外傷害保險集團Tokio Marine宣布將開始在元宇宙中提供保險服務。該公司將于1月在數字世界中提供保險和其他類型的保單,雇用將以化身表示的真實職員。[2023/1/1 22:18:58]
這與扎克伯格此前宣稱的“公司業務將以元宇宙優先”不謀而合。此前,扎克伯格曾概述了他建立“元世界”的計劃:一個建立在我們自己的數字世界之上的數字世界,包括虛擬現實和增強現實。“我們相信元宇宙將會接替移動互聯網”。
而XLS-R作為元宇宙社交中必不可少的一環,可以幫助母語不同的人在元宇宙無障礙對話。
Animoca Brands聯創:Meta在元宇宙領域的百億美元投資還遠遠不夠:10月21日消息,Animoca Brands聯合創始人兼CEO Yat Siu在接受訪談時表示,Meta公司在元宇宙領域的百億美元投資還遠遠不夠。Meta構造的元宇宙平臺將一半的價值據為己有,這在一定程度上阻礙了平臺用戶的交易,Meta將不得不花更多的錢來激勵人們進入其平臺。(TechCrunch)[2022/10/21 16:34:16]
值得一提的是,為了通過單一模型實現對多種語言的廣泛語音理解能力,Meta對XLS-R進行了微調,使其獲得語音識別、語音翻譯及語言識別等功能。據介紹,XLS-R在BABEL、CommonVoice以及VoxPopuli語音識別基準測試,CoVoST-2的外語到英文翻譯基準測試,以及VoxLingua107語言識別基準測試中都取得了不錯的成績。
新加坡律政部第二部長:婚禮、政府服務以及法律服務或將可在元宇宙上進行:7月29日消息,新加坡律政部第二部長Edwin Tong在TechLaw Fest 2022上發言,他認為即使是高度個性化、親密的活動,如結婚儀式,也可以在元宇宙上進行。Tong稱:“這不是不可想象的,除了婚姻登記,其他政府服務很快就可以通過元宇宙在線訪問。”關于元宇宙上的法律服務,部長補充說:“沒有理由不能對法律服務進行同天的處理。新冠疫情已經向我們證明,即使是曾經被認為是身體接觸、高度接觸的解決爭端過程也可以幾乎完全在線舉行。相信這樣一個綜合平臺將使整個爭議解決過程更加便捷、高效,并與世界其他地區的發展同步。”(Cointelegraph)[2022/7/29 2:45:46]
為了盡可能降低功能訪問門檻,目前,Meta與HuggingFace聯手發布了模型本體,并通過fairseqGitHubrepo全面開放。
完美世界:公司在元宇宙方面的工作,會分階段逐步推進實現:3月15日消息,完美世界(002624.SZ)在投資者互動平臺表示,公司立足內容優勢,逐步落地元宇宙相關布局。舉例來說,元宇宙需要極為扎實的技術實力以及技術累積,完美世界是業內少有的涉足過各類技術、各種引擎、并有能力自研引擎的游戲公司。此外,包括《幻塔》在內,公司有多個開放世界的項目,開放世界很容易向元宇宙貢獻內容,這些都是公司的先發優勢。公司在元宇宙方面的工作,會分階段逐步推進實現。[2022/3/15 13:56:48]
試用地址:https://huggingface.co/spaces/facebook/XLS-R-2B-22-16
XLS-R工作原理
據介紹,XLS-R在wav2vec2.0訓練集上接受了超過43萬6千小時的公開語音錄音訓練,從而實現了對語音表達的自監督學習方法。這樣的訓練量已經達到去年發布的當時最強的模型XLSR-53的10倍。利用從會議記錄到有聲讀物的多種語音數據來源,XLS-R的語言支持范圍擴展到128種,涵蓋的語種量達到前代模型的近2.5倍。
作為Meta打造的有史以來最大模型,XLS-R中包含超過20億個參數,性能遠高于其他同類模型。Meta表示,事實證明,更多參數能夠更充分地體現、數據集中的各類語種。此外,Meta還發現,規模更大的模型在單一語言預訓練方面的性能也同樣優于其他較小模型。
Meta在四種主要多語言語音識別測試中對XLS-R做出評估,發現它在37種語言上獲得了超越以往模型的效能。具體測試場景為:BABEL中選取5種語言,CommonVoice中選取10種語言,MLS中選取8種語言,以及VoxPopuli上選取14種語言。
BABEL上的單詞錯誤率基準測試結果。XLS-R較前代模型實現了顯著改進。
此外,Meta還評估了語音翻譯模型,即將錄音資料直接翻譯成另一種語言。為了打造一套能夠執行多種任務的模型,Meta同時在CoVoST-2基準測試的數個不同翻譯方向上對XLS-R進行了微調,使其能夠在英語與多達21種語言之間實現內容互譯。
在使用XLS-R對英語以外的其他語言進行編碼時,獲得了顯著的效能提升,這也是多語言語音表達領域的一次重大突破。據Meta介紹,XLS-R在低資源語言學習中實現了顯著改進,例如印尼語到英語的翻譯,其中BLEU準確率平均翻了一番。BLEU指標的提升是指模型給出的自動翻譯結果與處理同一內容的人工翻譯結果間重合度更高,代表著模型在改進口語翻譯能力方面邁出了一大步。
以BLEU指標衡量的自動語音翻譯準確率,其中較高值表示XLS-R從高資源語言(例如法語、德語)、中資源語言(例如俄語、葡萄牙語)或低資源語言(例如泰米爾語、土耳其語)語音記錄翻譯至英語時的準確率。
Meta認為,XLS-R證明擴大跨語言預訓練規模可以進一步提高低資源語言的理解性能。它不僅提高了語音識別率,同時也將由外語到英語的語音翻譯準確率提高了一倍以上。
“XLS-R是我們朝著以單一模型理解多種不同語言(語音)目標邁出的重要一步,也代表著我們在利用公共數據推進多語言預訓練方面做出的最大努力。我們堅信這是一條正確的探索方向,將讓機器學習應用更好地理解所有人類語音、并促進后續研究,大大降低語音技術在全球范圍內、特別是服務匱乏社群中的使用門檻。我們將不斷開發新方法,通過低監督學習拓展模型的語言理解能力、逐步使其覆蓋全球7000多種語言,實現算法的持續更新。”Meta提到。
https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/
壬寅虎年將至,圍繞虎元素的主題藝術藏品也成為2022年開年的熱門話題。老虎威風凜凜,在生肖中象征吉祥、辟邪,也一直是年俗文化中的熱門之選.
1900/1/1 0:00:00一個家境普通、資質平平的普通人如何逆天改命,從社會底層躍升到高階?這是從古至今,人類歷史、文學、電影都在講述的故事。戰爭、修仙、變異、奇緣、高人相助……總之,要有一段奇跡之旅.
1900/1/1 0:00:00最近,Cryptovo主辦了一次明星云集的圓桌會議,與會者包括DigiByte的聯合創始人HansKoning、CryptoCorner的主持人O.J.Jordan、CitizenCosmos的.
1900/1/1 0:00:00NFT的熱度在2021年不斷升溫,OpenSea作為最早的NFT交易市場之一,壟斷了90%以上的交易份額。不可否認,OpenSea在構建整個NFT生態系統方面提供了很多幫助,但它存在各種問題.
1900/1/1 0:00:00創作者經濟是什么? 如果Facebook、Instagram、Twitter或TikTok由其用戶擁有和運營.
1900/1/1 0:00:00金色周刊是金色財經推出的一檔每周區塊鏈行業總結欄目,內容涵蓋一周重點新聞、礦業信息、項目動態、技術進展等行業動態。本文是其中的新聞周刊,帶您一覽本周區塊鏈行業大事.
1900/1/1 0:00:00