由AI作畫應用Midjourney生成的繪畫作品《太空歌劇院》在今年9月美國科羅納州博覽會上獲得藝術比賽一等獎,吸引了不少人的眼球。今年以來連續好幾個AIGC領域的項目獲得了不錯的融資,到底AIGC有什么特別之處?本文將對AIGC近來的發展作一個梳理介紹。
美國科羅納州博覽會獲獎藝術作品《太空歌劇院》
什么是AIGC?
互聯網內容生產方式經歷了PGC——UGC——AIGC的過程。PGC是專業生產內容,如Web1.0和廣電行業中專業人員生產的文字和視頻,其特點是專業、內容質量有保證。UGC是用戶生產內容,伴隨Web2.0概念而產生,特點是用戶可以自由上傳內容,內容豐富。AIGC是由AI生成的內容,其特點是自動化生產、高效。隨著自然語言生成技術NLG和AI模型的成熟,AIGC逐漸受到大家的關注,目前已經可以自動生成文字、圖片、音頻、視頻,甚至3D模型和代碼。AIGC將極大的推動元宇宙的發展,元宇宙中大量的數字原生內容,需要由AI來幫助完成創作。
內容生產方式演變過程
AIGC底層技術突破
底層技術的突破使AIGC商業落地成為可能,傳統AI繪畫技術采用生成對抗網絡,但GAN生成的圖片結果輸出不穩定,分辨率低。直到2021年OpenaAI團隊開源了其深度學習模型CLIP,以及今年7月出現的去躁擴散模型Diffusion,兩者相互結合,讓AI自動生成文字和圖片的質量得到了質的提升。
Diffusion是一種去噪擴散模型,工作原理是對圖像逐步施加噪點,直至圖像被破壞變成完全的噪點,然后再逆向學習從全噪點還原為原始圖像的過程,而AI所看到的是全是噪點的畫面如何一點點變清晰直到變成一幅畫,通過這個逆向過程來學習如何作畫。
Voyager將總計價值約940萬美元的加密貨幣轉移到Coinbase:金色財經報道,據PeckShieldAlert監測,Voyager將總計價值約940萬美元的加密貨幣(3000枚ETH、2000億枚SHIB、約230萬枚MANA、93.2萬枚SAND、13.5萬枚APE和約100萬枚BAT)轉移到Coinbase,并在過去24小時內從Coinbase收到約2100萬枚USDC此外,Voyager轉賬了200枚BTC(約580萬美元),其中一部分資金(約10.3枚BTC)已在過去24小時內存入Binance Deposit。[2023/8/14 16:24:37]
CLIP是OpenAI在2021年初發布的用于匹配文本和圖像的神經網絡模型,是近年來在多模態研究領域的杰出成果,它一方面對文字進行語言分析,另一方面對圖形進行視覺分析,不斷調整兩個模型內部參數,達到文字和圖像高度匹配的效果。
在AI生成文字方面,目前AI已經可以作詩、寫郵件、寫廣告、劇本和小說。在今年,采用AIGC技術的虛擬人度曉曉寫作高考作文,在不到1分鐘的時間,完成了40多篇文章,獲得專家打分48分的成績,擊敗了75%的考生。目前OpenAI的GPT-3模型是AI生成文字中最成熟的模型,最近有一些項目把GPT-3模型商業化,包括自動寫郵件的OthersideAI,自動寫廣告文案的Copy.ai和Jasper.ai,在用戶數量上突飛猛進,并獲得了大筆的融資,就在11月16日知識管理和內容協作平臺Notion也發布了其文字自動生成產品NotionAI,并開始Alpha版本測試,NotionAI也是基于GPT-3模型開發。
在AI生成圖片方面,今年AI作畫水平突飛猛進,其背后的算法模型也在不斷迭代,年初推出的DiscoDiffusion只能生成粗糙的圖片,4月OpenAI發布的DALL-E2代已經可以生成完整的人像和圖片,到8月StabilityAI發布的StableDiffusion模型取得質的突破,已經可以生成可以媲美專業畫師的作品,生成圖片的效率也從年初的數小時到現在的幾分鐘甚至數十秒。
SushiSwap將集成Core,為其跨鏈功能提供DeFi服務:8月1日消息,SushiSwap將與不斷發展的區塊鏈協議Core集成,利用該協議獨特的共識機制,為其跨鏈功能提供廣泛的DeFi服務,基于該協議構建的去中心化應用程序可以訪問SushiSwap的流動性池、跨鏈交換及其去中心化交易所(DEX)聚合器。SushiSwap與ArcherSwap、IceCreamSwap和OpenEx一起成為在Core網絡上運行的主要DeFi協議。SushiSwap用戶還將受益Core協議促進的進一步跨鏈功能。[2023/8/2 16:12:40]
AI生成圖片技術演變
在AI生成音頻方面,10月11日,AI播客Podcast.ai生成的一段關于喬布斯和美國知名主持人喬·羅根之間的20分鐘訪談播客在科技圈廣為流傳,在播客中喬布斯談到自己的大學時代、對計算機、工作狀態和信仰的看法,整個播客聽起來毫無違和感,基本做到以假亂真。
由AI生成的喬·羅根采訪喬布斯播客
在AI生成視頻方面,目前AI生成視頻的算法模型還未成熟,也還沒出現一家獨大的局面。9月底Meta公布了AI制作視頻工具Make-A-Video,Google也緊接著發布了ImagenVideo和Phenaki。Make-A-Video具有文字轉視頻、圖片轉視頻、視頻生成視頻三種功能。僅僅通過文本描述,Phenaki就可以生成一段情節連貫的視頻。10月9日B站上的UP主“秋之雪華”公布了全球首個AI繪圖、AI配音的動畫《夏末彌夢》的DEMO,其畫面精美程度不輸專業畫師的作品。
AI動畫《夏末彌夢》DEMO
但PANews觀看該DEMO后發現,動畫中人物幾乎是靜態的,只是在場景切換時換了個另一張圖,由此可以看出目前AI生成視頻中動畫的過度和連貫性技術還不是很成熟,因為AI生成視頻需要多個AI模型來配合完成。
Yuga Labs已為“Otherside”主題飲料申請商標:3月5日消息,根據美國專利局披露信息顯示,Yuga Labs已為以旗下元宇宙項目“Otherside”為主題的飲料申請了商標。
據悉,Yuga Labs一直在為The Otherside的發布做準備,而在一年前的Otherside預告片中就展示過一款名為“Don’t Drink Me”的飲料,本次申請的商標中也有該字樣,目前商標涵蓋范圍包括啤酒類、能量飲品、不含酒精的飲料、軟飲料、水果汁、蘇打水、蘋果酒等。(uspto)[2023/3/5 12:43:31]
AI生成視頻技術模型
從技術上看,視頻是把多張圖片有邏輯和連貫的組合在一起。由文字生成視頻,首先要生成多張圖片,然后還要把這些圖片有邏輯和連貫性的組合起來,因此難度比文字生成圖片高了很多,如果一旦像文字生成圖片那樣能夠高效率的生成高品質視頻,將對內短視頻、影視、游戲、廣告等內容生產行業帶來重大影響,不僅提升視頻制作的效率和成本,還能幫助設計師產生更多的靈感和創意,讓視頻內容行業變得更加豐富和繁榮。
在AI生成3D方面,以往的“3D建模”需要利用三維制作軟件通過虛擬三維空間構建出具有三維數據的模型,技術要求比較高,需要懂美術、熟悉3DMAX和Maya等軟件,還需要大量的時間去人工繪制。但UCBerkeley的幾個博士后發表的論文神經輻射場技術可以把全景相機拍攝的視頻自動渲染為3D場景,減少了人工3D建模的過程,NeRF技術在2020年的ECCV(歐洲計算機視覺國際會議)提出,并在2021年的ACM獲了榮譽提名獎。著名VR科技博主RobertScoble?7月在他的Twitter發布了這個視頻,他用NeRF技術渲染Insta360全景相機所拍視頻后得到的3D場景,效果令人驚嘆,預計會有相關項目將NeRF技術進行商業落地嘗試,對于這點非常值得期待。
AIGC領域重要項目
今年加入AI作畫賽道的公司越來越多,今年分別出現了MidJourney、DALL-E2、StableDiffusion、Tiamat、百度文心等多家AI作畫公司,以及JasperAI、CopyAI這樣的AI文字項目。
MakerDAO通過支持將GNO添加為抵押資產的民意投票:據官方消息,MakerDAO現已通過支持將GnosisDAO治理代幣GNO添加為抵押資產的民意投票,之后會發起執行投票。[2022/11/25 12:34:01]
從融資角度來看,目前AIGC有3個商業化的方向:
◎第一個方向是通過AI生成文字,比如自動寫郵件和廣告營銷文案,這要歸功于OpenAI的GPT-3AI語言模型,目前大多數AI生成文字類項目都使用該模型。
◎第二個方向是利用AI作圖,主要技術是結合多模態神經語言模型CLIP和圖像去躁擴散模型Diffusion,僅僅提供一些關鍵詞描述就可以自動生成圖片。
◎第三個方向是AIGC的底層技術模型開發,OPENAI和StableAI是這個方向的龍頭,也是融資金額最大的。
預計接下來AIGC的熱門方向可能是用AI生成視頻和動畫,這就看Meta、Google的AI視頻模型能不能解決視頻的連貫性和邏輯性問題,或其他公司提出更好的解決方案。
AIGC領域熱門項目
OpenAI/GPT-3,?OpenAI是由馬斯克和Y-CombinatorCEOSamAltman于2015年成立的一個非營利組織,但2019年馬斯克離開了OpenAI,緊接著微軟注資10億美元將其變為營利性公司,并與微軟的云計算平臺Azure展開合作。最近微軟正在對OpenAI進行新一輪的投資進行后期談判,目前估值已經達200億美金。GPT-3是OpenAI于2020年5月推出的自然語言處理模型,支持用戶僅輸入一些關鍵詞就能生成一封郵件、文章或新聞,甚至是小說,它是目前最成熟的自然語言生成技術NLG之一。今年4月OpenAI還推出了DALL-E2項目,允許用戶通過文本生成圖像,成為目前主流的三大AI作畫應用之一。
StableAI/StableDiffusion,10月17日英國的StabilityAI宣布以10億美元的估值完成1.01億美元融資,此次融資由Coatue和Lightspeed領投。消息稱StabilityAI正準備下一輪10億美金的融資,本輪融資Google可能會參與,如果投資成功,相信Google將會和StableAI深度合作。StabilityAI成立于2020年,由去中心化組織EleutherAI支持開發,其理念是“AIbythepeople,forthepeople”。StableAI主要研AI生成圖片、音頻、視頻和3D的模型,其研發的開源AI作圖模型StableDiffusion在2022年8月一經推出就立刻吸引了大家的眼球,在StableDiffusion的DreamStudio測試版網站中只要輸入文字描述,它就能生成一副可以媲美專業畫師的圖片,StableDiffusion是開源產品,一些AIGC項目對其進行了二次開發,退出了包括圖像、語言、音頻、視頻、3D、生物AI等模型。
報告:美國SEC的加密貨幣指導擾亂了銀行的加密項目促使銀行重新考慮:金色財經報道,路透社援引知情人士的講話報道稱,美國證券交易委員會(SEC)發布的關于貸方應如何對待客戶數字資產的指導正在擾亂銀行的加密項目。
根據本周五發布的報告,將代表客戶持有的加密貨幣計入負債對銀行來說尤其苛刻,因為他們需要持有現金以匹配資產負債表上的負債。
美國銀行(USB)告訴路透社,它正在暫停新的加密客戶的吸收,直到它評估“不斷變化的監管環境”,而投資銀行紐約梅隆銀行(BK)拒絕評論其加密項目的狀態。
報告中引用了一家希望在美國提供加密托管服務的未具名歐洲銀行稱,根據新的指導方針,這樣做的成本“高得驚人”。
此前3月份,美國證券交易委員會表示,所有作為加密貨幣托管人的美國上市公司都應將其加密貨幣風險敞口作為負債而非資產負債表上的資產,并向投資者披露與這些負債相關的風險。美國證券交易委員會的指南稱,與其他資產相比,貸方對加密資產的托管存在獨特的技術、法律和監管風險。(CoinDesk)[2022/9/16 7:02:04]
由stablediffusion生成的圖片
Midjourney:Midjourney是一款可以和StableDiffusio以及DALL-E2媲美的AI繪畫工具。Midjourney是部署在Discord上的應用,在Discord里輸入文字,一分鐘就可以生成對應的圖片,目前其官方Discord已經擁有140萬用戶,其免費版本能生成的圖片數量有限,超出數量需要付費訂閱,如果想體驗一下Midjourney作圖可以查看這個教程。
由Midjourney生成的圖片
OthersideAI:OthersideAI主打利用AI自動回復郵件,底層技術采用OpenAI的GPT-3協議,OthersideAI曾獲得MadronaVentureGroup領投的260萬美金種子輪融資,MadronaVentureGroup曾參投過Amazon的早期種子輪融資。OthersideAI的操作非常簡單,只要輸入郵件內容的關鍵要點,它就可以為生成一封完整的郵件。
CopyAI:Copy.ai?是一個通過AI來寫作廣告和營銷文案的創業公司,它可以幫助用戶幾秒鐘內生成高質量的廣告和營銷文案,主打ToB商業場景,它的底層技術也是采用OpenAI的GPT-3協議。目前Copy.ai的用戶包括像微軟、Ebay這樣的大公司。Copy.ai曾獲得CraftVentures領投的290萬美金種子輪,A輪融資1100萬美金,由WingVentureCapital領投,紅杉資金及TigerGlobal跟投。
JasperAI:Jasper.ai?成立于2020年,通過AI幫企業和個人寫營銷推廣文案以及博客等各種文字內容,其底層技術也是GPT-3。Jasper.ai10月以15億美金估值完成了1.25億美元的A輪融資,由InsightPartners領投,Coatue、BVP以及IVP跟投。今年1月推出第一個版本后,很快受到歡迎,短時間內獲得了數百萬美元的收入。
Play.ht?:Play.ht?是一個AI文本轉換語音應用,在今年9月發布了第一個語音模型Peregrine,包含數千種說話的聲音,可以學習人類的語氣、音調和笑聲。再進生成采訪喬布斯播客的Podcast.ai就是采用Play.ht語音模型,它通過大量采集網絡上關于喬布斯的錄音,然后進行訓練,最終生成假喬布斯的聲音,相似度非常高。
NotionAI:?剛剛于本月16日公布的NotionAI是知名知識管理和內容協作平臺Notion基于OpenAIGPT-3模型開發的AI文字生成工具。目前NotionAI的功能包括自動撰寫文章、廣告文案和播客;通過頭腦風暴為用戶提供創意建議;自動檢查文字拼寫和語法錯誤;自動翻譯文章;目前NotionAI以白名單的形式開放Alpha版本測試。相信NotionAI的加入將會進一步推動AI生成文字走向普及。
AIGC如何助推元宇宙發展
雖然元宇宙的終極形態還無法確定,但可以肯定的是元宇宙將極大擴展人類的存在空間,在我們邁向元宇宙的過程中,需要大量的數字內容來支撐,單靠人工來設計和開發根本無法滿足需求,AIGC正好可以解決這個問題。游戲將是元宇宙中最先落地的場景,元宇宙和游戲有一個共同點,都是為用戶提供高度的真實感和沉浸式體驗,我們可以拿AIGC在游戲中的應用來說明其將如何主推元宇宙發展。
AIGC技術在游戲中的應用
開發游戲周期長和成本高,通常需要花費幾年時間和上千萬資金,好在AIGC可以極大提高游戲的開發效率,具體來說,游戲中的劇本、人物、頭像、道具、場景、配音、動作、特效、主程序未來都可以通過AIGC生成。根據AIGC在文字和圖像方向的推進速度,以上應用在五到十年之內應該可以實現。
紅杉資本在最近的研究報告中也指出,到2030年文本、代碼、圖像、視頻、3D、游戲都可以通過AIGC生成,并且達到專業開發人員和設計師的水平。
圖片來源:紅杉資本
除了游戲之外,虛擬人也是元宇宙的一個重要落地場景,AIGC同樣也會促進虛擬人賽道的發展。
虛擬人是圍繞一個虛擬的人設,為其設計聲音、形象、動作、性格以及活動場景,其本質和游戲相似度很高。虛擬人注重一個人在虛擬世界的表演和功能性,游戲注重多個人在虛擬世界中的交互體驗。游戲是一出戲,虛擬人也是在演一出戲,戈夫曼擬劇理論中的“人生如戲”一語道破了現實世界、虛擬世界的本質。
AIGC在Web3方向的應用
AIGC聽起來這么好,那跟Web3會有什么關系?最近聽說Web3的基金都在看AIGC方向的項目,我想大概有這幾個方向值得關注。
Gamefi開發引擎:在傳統游戲中應用最廣的開發引擎是Unity和Unreal,但在Web3中,游戲的開發范式也許會因AIGC帶來許多變革,因此將需要一個采用AIGC技術的Gamefi開發引擎。里面的人物、場景、動畫均用AIGC設計,游戲中的主程序和區塊鏈部分也可以通過AIGC代碼生成功能完成,如果這些都能實現,設計Gamefi游戲或者元宇宙場景將變得非常高效,這一套開發引擎將會具有極高的價值。目前看到RCTAI是運用人工智能為游戲行業提供完整解決方式的一個項目,但其在多大程度上采用了AIGC技術,還不得而知,不過已經有一款Gamefi游戲MirrorWorld是基于RCTAI來開發的,有興趣的朋友可以進一步了解。
開發Gamefi游戲:退而求其次,如果一套AIGC全集成的Gamefi開發引擎還太遙遠,那采用各個廠商提供的AIGC工具來開發Gamefi游戲也會極大的提高效率,比如用AIGC來生成游戲劇本、設計人物、生成動畫這些都幾乎都會很快實現,特別在AI生成視頻和3D場景技術一旦成熟之后Gamefi游戲開發效率將會突飛猛進。
算力和數據共享:訓練AIGC模型需要海量的數據和強大的算力,這導致成本非常巨大,AIGC行業龍頭StabilityAI為了訓練其StableDiffusion模型,在AWS中運行了包含4000多個NvidiaA100GPU的集群,運營成本高達數千萬美元。如果能通過去中心化方式發行Token激勵用戶提供訓練模型所需的數據,就可以很好的解決AIGC生成中的版權問題。另外也可以通過發行Token的方式,激勵用戶提供訓練模型所需要的大量算力,分散算力成本,實現成本共擔,利益共享。
結語
今年7月李彥宏在百度世界大會上判斷,AIGC將分為三個發展階段:“助手階段”——“協作階段”——“原創階段”。“未來十年,AIGC將顛覆現有內容生產模式。可以實現以十分之一的成本,以百倍千倍的生產速度,去生成AI原創內容。”
在最近的研究報告中,紅杉資本的兩位合伙人也認為:“AIGC目前已經擁有更好的模型,更多的數據,更好的算力,預計殺手級應用該要出現了”。
對于以上判斷,我們傾向于認同,AIGC的出現意味著創作者將從繁冗的基礎性工作中解脫出來,把更多的精力放到創意表達上,這是未來內容創作行業,甚至是人類工作方式的整體趨勢。
責任編輯:Kate
2022年的加密行業發生了太多大事,這里就不一一細說了,一次次的失敗和崩盤只會增加業內人士對crypto未來前景的質疑,降低人們對crypto的信心.
1900/1/1 0:00:00開源世紀新質押池即將上線,開源世紀是OSC的質押平臺,社區一直在尋求更多的STAKING機會,平臺積極落地生態.
1900/1/1 0:00:002022年10月10日,歐洲議會委員會通過了《加密資產市場監管法案》,歐洲議會還對《資金轉移條例》進行了投票。接下來MiCA法案一旦通過并實施,將對歐盟的加密監管具有里程碑式的意義.
1900/1/1 0:00:00這是白話區塊鏈的第1797期原創?作者|老牛出品|白話區塊鏈對于存儲區塊鏈資產的錢包,還有不少人沒搞懂,尤其是地址、公鑰、密碼、私鑰、助記詞、Keystore等專有名詞,讓人一頭霧水.
1900/1/1 0:00:00簡介 11月13日,ElonMusk為Twitter進行了1000多次RPC來呈現用戶的主頁時間線而道歉。乍一看,如此大量的RPC似乎很荒謬.
1900/1/1 0:00:00像世界各地的數百萬人一樣,我在全球大流行病期間進入了Web3。雖然我是一個書呆子,但我從來不是一個技術愛好者,而隔離是一個向自己證明我也可以學習技術的絕佳機會.
1900/1/1 0:00:00