圍繞OpenAI推出的第二代DALL-E 2系統的討論一直處于兩極分化的狀態,甚至在其推出了幾個月后依舊如此。
有用戶認為這是一項可以重新定義藝術的突破性創新,而批評者則將其視為人工智能圖像生成器給創意產業帶來厄運的開始。
然而毫無疑問的是,DALL-E 2為我們創造和消費藝術開辟了新的可能性和挑戰。本文詳細介紹了AI圖像生成器DALL-E 2的用法和缺點。
DALL-E 2是一款人工智能圖像生成器,它可以根據自然語言的文本描述創建圖像和藝術形式。換句話說,它是一個根據文本生成圖像的人工智能系統。
2021年1月,OpenAI推出了DALL-E模型,DALL-E 2是其升級版。“DALL-E”這個名字源于西班牙著名藝術家Salvador Dalí和廣受歡迎的皮克斯動畫機器人“Wall-E”的組合。
2022年7月,DALL-E 2進入測試階段,可供白名單中的用戶使用。同年9月28日,OpenAI取消了白名單的要求,推出了任何人都可以訪問并且使用的開放測試版。
Michael Saylor :比特幣是十年來最具顛覆性的力量:金色財經報道,MicroStrategy 首席執行官Michael Saylor表示,我們認為比特幣是十年來最具顛覆性的力量。MicroStrategy 董事長兼首席執行官 Michael Saylor 加入“Squawk on the Street”,討論加密貨幣的狀況、公司的軟件業務和第四季度業績,由于比特幣仍然是核心資產,這些業績未能達到預期。(CNBC)[2022/2/3 9:28:28]
與最初的DALL-E一樣,DALL-E 2也是一種語言生成模型,它使用文本提示來創建原始圖像。
盡管和之前DALL-E具有的120億個參數的模型不同,DALL-E僅僅具有大約35億個參數,但DALL-E 2生成的圖像分辨率是DALL-E的四倍,這是一次令人印象深刻的升級。同時,DALL-E 2在真實感和字幕匹配方面似乎也做得更好。
聽起來,DALL-E 2很有未來感,可能會讓新用戶望而生畏,但它使用起來非常簡單。我們不進行詳細介紹,僅通過迷你教程為大家提供快速概覽。
首先,登陸DALL-E 2的官網并創建一個帳戶,如果您此前已經擁有OpenAI的帳戶,登陸即可。需要注意的是,系統會要求您提供電子郵件和電話號碼以進行驗證。
推特CEO:以太坊或者其他技術無法單獨做到顛覆大型科技公司:針對關于推特賬戶應該支持錢包地址來存儲NFT的討論,有網友評論稱,“大型科技公司(Big Tech)害怕以太坊。以太坊顛覆大型科技公司。”
對此,推特CEO Jack Dorsey回復稱,“顛覆大型科技公司正是我所需要和想要的。然而,沒有任何一項技術能夠單獨做到這一點。”
據此前報道,網友Brandon Jacoby在推特中表示,Twitter上的每個賬戶都應該有一個錢包地址來存儲NFT。用戶可以選擇他們錢包中的任何NFT作為他們的頭像。這將成為展示/傳播的最大驗證層之一。加密初創公司nocodepros.co創始人st.表示,感覺這件事對ETH生態系統的好處比對推特的好處多。對此,推特CEO Jack Dorsey表示同意,而且Twitter上的每個賬戶都能鏈接到一個閃電錢包。
此外,Jack Dorsey最近發布Twitter新功能的屏幕截圖,其中包括一條將以太坊稱為騙局的推文。雖然有人認為這條抨擊以太坊的推文可能是巧合地出現在Dorsey的截圖上,但其澄清說,這并非巧合。[2021/8/13 1:53:52]
一旦帳戶準備就緒,我們就可以開始生成圖像。用戶最多提供400個字符的描述性文本,AI藝術生成器將對其進行處理。根據測試,我們可以從文本提示中得到許多原創且有趣的結果。
福布斯專欄作家:去中心化的區塊鏈網絡正準備顛覆人才市場:福布斯專欄作家Roomy Khan刊文表示,新興的區塊鏈和加密技術正在促進去中心化的點對點 (P2P) 數據網絡,從而消除對中央控制的需求并降低聚合-分銷商平臺的價值。區塊鏈網絡通過去中心化協議運行,驗證和記錄保存活動通過外包給平臺的網絡用戶來分散和自動化,從而消除了中央控制實體。
區塊鏈和人工智能 (AI) 可以將按需勞動力的人才獲取提升到一個新的水平。通過豐富的全球 P2P交互,區塊鏈和加密技術應用程序已準備好顛覆人才市場并滿足后大流行世界中零工經濟的需求。[2021/6/28 0:10:30]
比如,我們輸入“狼群在滿月時嚎叫”就收到了如下的結果。
輸入“一個3D渲染的羅馬士兵正在休息”則獲得了以下的圖像。
DALL-E 2為AI圖像生成器的質量提供了新的基準。它與之前的同類產品相比,能夠更好地理解文本描述。
Peter Schiff:盡管比特幣突破4萬美元,但并未顛覆任何事物:Euro Pacific Capital首席執行官、比特幣反對人士Peter Schiff在推特上宣稱,盡管比特幣價格突破了4萬美元的歷史新高,但它不能被稱為“顛覆性技術”,因為它沒有顛覆任何事物。中央銀行和政府都沒有喪失任何權力,而且無論比特幣價格漲多高情況還是如此。但Schiff認為,如果金價飆升至1萬美元,法幣體系則很容易崩潰。(U.Today)[2021/1/9 15:44:40]
其卓越的自然語言理解能力可以更嚴格地控制圖像的風格、主題、角度、背景、位置和概念,并獲得更高質量的圖像和令人印象深刻的藝術形式。
那么讓我們來看看DALL-E 2的工作原理。
要了解AI圖像生成器的工作原理,我們首先需要了解CLIP、先驗模型和解碼器擴散模型(unCLIP)。
什么是CLIP?CLIP指的是對比語言圖像預訓練,是DALL-E 2架構中最關鍵的模塊。
該訓練基于用戶可以用自然語言教計算機不同圖像之間如何相互關聯,并由文本和圖像編碼器這兩個神經網絡組成。
文本和圖像編碼器都接受了大量不同的圖像文本對集合的訓練。該模型分析這些圖像-標題對以創建稱為文本/圖像嵌入的矢量表示。換句話說,CLIP充當文本(輸入)和圖像(輸出)之間的橋梁。
聲音 | 金固股份副總裁徐笑天:區塊鏈會對整個社會的運轉方式產生顛覆性的影響:12月3日,2019CAN大會——“萬物互鏈·區塊鏈與全球經濟新格局”大型峰會在杭州召開,金固股份副總裁徐笑天在會上表示,學術界對于區塊鏈評價甚高,大家都認識到,區塊鏈不僅是對金融行業,對于整個社會的運轉方式都會產生顛覆性的影響,它將帶來新一次的互聯網革命。而在金固股份專注的汽車后市場行業,區塊鏈理念和技術能夠從源頭解決汽車后市場行業鏈條不透明難題。區塊鏈能夠促進產業鏈條信息的公開透明,形成完整流暢的信息流,確保參與各方及時發現系統運行過程中存在的問題并解決問題,進而提升產業鏈的整體效率。同時,區塊鏈所具有的數據不可篡改和時間戳的存在性證明的特質能很好地運用于解決產業鏈體系內各參與主體之間的糾紛,實現輕松舉證與追責,進而根除產業鏈內產品流轉過程中的假冒偽劣問題。[2019/12/4]
先驗模型采用標題/CLIP文本嵌入,并以此為基礎生成CLIP圖像嵌入。
unCLIP則是使用CLIP圖像嵌入生成圖的原始CLIP模型的逆模型。DALL-E 2通過先驗模型和unCLIP模型來創建輸出。
下圖大致概述了其基本過程。
如圖所示,unCLIP模型創建了圖像的“心理”表示。基于此,創建了原始圖像。
這些“心理再現”保留了語義一致的核心特征和特點,例如“動物、物體、顏色、風格和背景等關鍵要素”。然而,因為擴散學習是變化的,每一次輸出的圖像也會有所不同。
請注意,上文只是DALL-E 2工作原理的簡要表述,實現的技術細節和數學更加復雜,我們就不在這里贅述。如果您對DALL-E 2的技術規格感興趣,可以參看OpenAI在今年早些時候發表的論文《Hierarchical Text-Conditional Image Generation with CLIP Latents》。
只要用戶給出精確和具有描述性的文本提示,就可以通過AI藝術生成器得到多個高質量的圖像,甚至在幾秒鐘的時間里實現畫家或數字藝術家需要數小時甚至數天才能達到的質量水平。
用戶可以免費查看所有這些視覺創意,無需支付場地費,也無需向創意人員和模特支付工資。
然而這也對我們的內容創作經濟帶來了一定的影響。
DALL-E 2使用自己對主題、風格、調色板和所需概念意義的“理解”,生成相應的圖像。
每個圖像最多可以產生四個變體。每一個都與原作的外觀、感覺和意義相呼應,但又具有自己獨特的風格。
您也可以在DALL-E 2中編輯圖像,無需任何照片編輯經驗。與Adobe Photoshop不同,使用DALL-E進行編輯非常簡單。
例如,用戶想要在火星上行走的宇航員的肖像中添加一只狗,只需要輸入“在宇航員身后放一只狗”。同樣,用戶還可以要求程序通過放大和縮小來更改圖像的視圖框架,直到獲得所需的結果。而就DALL-E 2的功能而言,這些只是冰山一角。
同時,根據設計,該系統無法生成涉及、血腥或元素的內容。也就是說,該程序有其合理的局限性和缺點。
DALL-E 2的輸出質量很大一部分取決于用戶提供的文本提示的質量,文本越具體,獲得所需輸出的機會就越高。然而,該系統有一些內在的局限性。
例如,當前它還不具有很精確組合性,盡管似乎會隨著時間的推移而改善。這意味著DALL-E 2通常無法有意義地合并多個對象或對象屬性,例如形狀、方向和顏色。
同時在一些意料之外的情況下,有一些相對簡單的文本,程序也可能無法充分執行。
例如,我們輸入文本“一百只打扮成羅馬士兵的青蛙在沙漠中行進”。即使我們嘗試了多種提示變體,結果也不盡如人意。
另一個例子是當我們嘗試相當簡單的提示時,如“霸王龍騎著獨輪車在艾菲爾塔前”。不知道為什么,程序拒絕畫獨輪車,取而代之的是自行車。而當我們從提示中刪除“Eifel Tower”,產生預期圖像則沒有任何阻礙。
這些只是DALL-E 2局限性的幾個例子。更令人擔憂的問題本質上很復雜,可能會對公司及其用戶造成嚴重不良影響。
OpenAI限定DALL-E 2不創建公眾人物和名人的圖像。事實上,它完全拒絕生成包含真實面孔或真人的圖像,這是朝著防止濫用該程序邁出的重要一步。
隨著DALL-E 2越來越受歡迎,版權侵權也可能成為一個大問題。OpenAI堅持認為,用戶“獲得了將他們使用DALL-E創建的圖像商業化的全部權利,包括轉載、銷售和商品化的權利。”
然而,人工智能藝術生成器依賴于分析、學習人類藝術家的作品來創造藝術。因此,不能排除潛在的侵犯知識產權法的可能性,無論是否有意。
DALL-E 2完美嗎?作為一項正在完善的項目,答案是否定的。
但是,正如機器學習的本質一樣,隨著時間的推移,該程序正變得越來越聰明,也越來越有能力。從純技術的角度來看,DALL-E 2是AI技術演進的一大進步。
人們普遍認為人工智能系統在創意領域實際上無法超越人類,至少不會很快。但是DALL-E 2已經使這個論點受到了沖擊。
然而盡管OpenAI已經采取了一系列措施來預測和防止DALL-E 2的潛在濫用,但這并非萬無一失。在沒有任何道德界限的情況下可以使用的AI系統將在多久后出現?需要我們保持警惕。
無論如何,我們都需要密切關注這個新興行業。因為AI藝術生成器及其背后的技術只會在未來的歲月里變得更加普遍。
元宇宙之心
企業專欄
閱讀更多
金色財經
金色財經 子木
金色早8點
去中心化金融社區
虎嗅科技
CertiK中文社區
區塊律動BlockBeats
深潮TechFlow
念青
Odaily星球日報
Tags:DALALL區塊鏈NAIDALIPolkally區塊鏈域名選什么后綴好Shiba Floki Trillionaire
我花了些時間研究了哪些NFT項目受FTX事件的影響比較嚴重,又有哪些項目沒有受到波及。研究結果喜憂參半.
1900/1/1 0:00:00前幾日FTX創始人SBF承諾將發布文章復盤FTX為何崩潰。16日至17日他陸續發布32條推特,講述FTX發生了什么、FTX現狀以及一些反思。因部分推文極短且無什么含義,金色財經對推文有刪減.
1900/1/1 0:00:00貢獻者:DAOctor @DAOrayaki審核者:Shaun @DAOrayaki原文:The Grants Ecosystem在牛市中.
1900/1/1 0:00:00一個 FTX 員工的自述截圖在社區傳播,我們確認了它大部分的真實性,文章經過編譯,來源于AutismCapital推文 圖片來源:由無界版圖AI工具生成 全文如下: 我是接近 FTX 情況的消息.
1900/1/1 0:00:00過去一周,幣安大戰FTX,一場能夠載入幣圈史冊的事件爆發,引發了全球各行業的關注。而兩個交易所的戰火蔓延整個行業,也由此引發了整個行業的“信任危機”,用戶對于交易所的信任度下降至歷史冰點.
1900/1/1 0:00:001.十五張圖看懂 2022 年加密VC的投資變化2022 年,加密 VC 向 Crypto 初創公司投去了總計 300 億美元的資金,這一數值與 2021 年的 310 億美元非常接近.
1900/1/1 0:00:00