買比特幣 買比特幣
Ctrl+D 買比特幣
ads
首頁 > BTC > Info

ALL:顛覆想象的AI繪畫:Dall-E 2使用指南_OPEN

Author:

Time:1900/1/1 0:00:00

圍繞OpenAI推出的第二代DALL-E2系統的討論一直處于兩極分化的狀態,甚至在其推出了幾個月后依舊如此。

有用戶認為這是一項可以重新定義藝術的突破性創新,而批評者則將其視為人工智能圖像生成器給創意產業帶來厄運的開始。

然而毫無疑問的是,DALL-E2為我們創造和消費藝術開辟了新的可能性和挑戰。本文詳細介紹了AI圖像生成器DALL-E2的用法和缺點。

什么是DALL-E2?

DALL-E2是一款人工智能圖像生成器,它可以根據自然語言的文本描述創建圖像和藝術形式。換句話說,它是一個根據文本生成圖像的人工智能系統。

2021年1月,OpenAI推出了DALL-E模型,DALL-E2是其升級版。“DALL-E”這個名字源于西班牙著名藝術家SalvadorDalí和廣受歡迎的皮克斯動畫機器人“Wall-E”的組合。

2022年7月,DALL-E2進入測試階段,可供白名單中的用戶使用。同年9月28日,OpenAI取消了白名單的要求,推出了任何人都可以訪問并且使用的開放測試版。

美國銀行:DeFi可能比比特幣更具顛覆性:金色財經報道,美國銀行認為去中心化金融(DeFi)可能比比特幣更具顛覆性。美國銀行表示,比特幣是被談論最多的加密貨幣,但以太坊(區塊鏈)具有更多功能,包括在托管DeFi方面比比特幣更靈活。[2021/3/19 18:58:55]

與最初的DALL-E一樣,DALL-E2也是一種語言生成模型,它使用文本提示來創建原始圖像。

盡管和之前DALL-E具有的120億個參數的模型不同,DALL-E僅僅具有大約35億個參數,但DALL-E2生成的圖像分辨率是DALL-E的四倍,這是一次令人印象深刻的升級。同時,DALL-E2在真實感和字幕匹配方面似乎也做得更好。

如何使用DALL-E2?

聽起來,DALL-E2很有未來感,可能會讓新用戶望而生畏,但它使用起來非常簡單。我們不進行詳細介紹,僅通過迷你教程為大家提供快速概覽。

首先,登陸DALL-E2的官網并創建一個帳戶,如果您此前已經擁有OpenAI的帳戶,登陸即可。需要注意的是,系統會要求您提供電子郵件和電話號碼以進行驗證。

一旦帳戶準備就緒,我們就可以開始生成圖像。用戶最多提供400個字符的描述性文本,AI藝術生成器將對其進行處理。根據測試,我們可以從文本提示中得到許多原創且有趣的結果。

現場 | 中國資產證券化論壇主席孟曉蘇:區塊鏈會成為不動產資產交易的顛覆性技術:金色財經現場報道,12月1日,在三亞舉辦的海南國際離岸創新創業示范區建設暨區塊鏈?數字資產交易技術創新高端論壇上,中國資產證券化論壇主席孟曉蘇演講表示,國際動向上,資產證券化迅速向“資產通證化”演進,我國資產證券化一直是引入信用基礎,而非資產基礎,區塊鏈和資產通證化會成為不動產資產交易的顛覆性技術,在流動性、份額等方面更適合不動產資產證券化。[2019/12/1]

比如,我們輸入“狼群在滿月時嚎叫”就收到了如下的結果。

輸入“一個3D渲染的羅馬士兵正在休息”則獲得了以下的圖像。

DALL-E2的工作原理是什么?

DALL-E2為AI圖像生成器的質量提供了新的基準。它與之前的同類產品相比,能夠更好地理解文本描述。

聲音 | 王永利:網絡加密幣不可能顛覆取代法定貨幣體系:以“防范金融風險,維護金融安全”為主題的首屆北京金融安全論壇在北京召開。中國銀行原行長王永利表示:“表示像比特幣、以太幣網絡加密幣不可能顛覆取代法定貨幣體系,只要國家存在就不可能取代它。它的定位應該是網絡社區的專用幣,或者叫商圈幣。像飯菜票、飯菜卡、商場的購物卡、電商平臺上的積分或者token,這些東西都是在法定貨幣體系下在一定范圍里面賦予特殊權利義務的一種專用幣或者代幣,它是有價值的,但是一旦給它定位為是一種社區幣或者商圈幣的話,就必須要有一定的流通范圍約束,而不能隨便出了這個圈自由流通,否則就是在挑戰法定貨幣的地位,影響法定貨幣的監管,那么監管一定會來約束。”[2018/12/5]

其卓越的自然語言理解能力可以更嚴格地控制圖像的風格、主題、角度、背景、位置和概念,并獲得更高質量的圖像和令人印象深刻的藝術形式。

那么讓我們來看看DALL-E2的工作原理。

要了解AI圖像生成器的工作原理,我們首先需要了解CLIP、先驗模型和解碼器擴散模型。

什么是CLIP?CLIP指的是對比語言圖像預訓練,是DALL-E2架構中最關鍵的模塊。

動態 | 報告:區塊鏈技術具有顛覆行業的潛力:據newelectronics消息,Digital Catapult的一份報告顯示,分布式賬本技術(DLT)對英國企業存在潛在影響,并且作為一個繁榮的生態系統活躍于各個領域,有助于為處于不同發展階段的英國公司和眾多行業應用程序降低成本,實現更高效的公共服務并改善供應鏈的可追溯性。總得來說,區塊鏈技術具有顛覆行業的真正潛力,而英國有機會在這一市場奪回領先地位。Digital Catapult首席執行官Jeremy Silver表示,需要采取積極措施提高對多個行業DLT技術的理解,以實現英國經濟更廣泛的利益。Silver說:“要做到這一點,就需要鼓勵進一步采用這項技術,我們必須去除神秘感,斬斷炒作,并教育金融服務部門以外的組織應對DLT的各種應用,以及考慮如何幫助其降低創新風險。”[2018/11/26]

該訓練基于用戶可以用自然語言教計算機不同圖像之間如何相互關聯,并由文本和圖像編碼器這兩個神經網絡組成。

文本和圖像編碼器都接受了大量不同的圖像文本對集合的訓練。該模型分析這些圖像-標題對以創建稱為文本/圖像嵌入的矢量表示。換句話說,CLIP充當文本和圖像之間的橋梁。

聲音 | 周平:區塊鏈的產生不是對互聯網的顛覆:據人民網消息,中國電子技術標準化研究院軟件工程與評估中心主任周平昨日指出,云構建了基礎設施,大數據解決了基礎數據問題,未來經濟需要新型基礎設施,這是屬于區塊鏈的機會。但是,區塊鏈的產生不是對互聯網的顛覆,也不是把互聯網從信息互聯網變為價值互聯網。[2018/10/24]

先驗模型采用標題/CLIP文本嵌入,并以此為基礎生成CLIP圖像嵌入。

unCLIP則是使用CLIP圖像嵌入生成圖的原始CLIP模型的逆模型。DALL-E2通過先驗模型和unCLIP模型來創建輸出。

下圖大致概述了其基本過程。

如圖所示,unCLIP模型創建了圖像的“心理”表示。基于此,創建了原始圖像。

這些“心理再現”保留了語義一致的核心特征和特點,例如“動物、物體、顏色、風格和背景等關鍵要素”。然而,因為擴散學習是變化的,每一次輸出的圖像也會有所不同。

請注意,上文只是DALL-E2工作原理的簡要表述,實現的技術細節和數學更加復雜,我們就不在這里贅述。如果您對DALL-E2的技術規格感興趣,可以參看OpenAI在今年早些時候發表的論文《HierarchicalText-ConditionalImageGenerationwithCLIPLatents》。

使用DALL-E2可以做什么?

只要用戶給出精確和具有描述性的文本提示,就可以通過AI藝術生成器得到多個高質量的圖像,甚至在幾秒鐘的時間里實現畫家或數字藝術家需要數小時甚至數天才能達到的質量水平。

用戶可以免費查看所有這些視覺創意,無需支付場地費,也無需向創意人員和模特支付工資。

然而這也對我們的內容創作經濟帶來了一定的影響。

DALL-E2使用自己對主題、風格、調色板和所需概念意義的“理解”,生成相應的圖像。

每個圖像最多可以產生四個變體。每一個都與原作的外觀、感覺和意義相呼應,但又具有自己獨特的風格。

您也可以在DALL-E2中編輯圖像,無需任何照片編輯經驗。與AdobePhotoshop不同,使用DALL-E進行編輯非常簡單。

例如,用戶想要在火星上行走的宇航員的肖像中添加一只狗,只需要輸入“在宇航員身后放一只狗”。同樣,用戶還可以要求程序通過放大和縮小來更改圖像的視圖框架,直到獲得所需的結果。而就DALL-E2的功能而言,這些只是冰山一角。

同時,根據設計,該系統無法生成涉及、血腥或元素的內容。也就是說,該程序有其合理的局限性和缺點。

DALL-E2的局限性

DALL-E2的輸出質量很大一部分取決于用戶提供的文本提示的質量,文本越具體,獲得所需輸出的機會就越高。然而,該系統有一些內在的局限性。

例如,當前它還不具有很精確組合性,盡管似乎會隨著時間的推移而改善。這意味著DALL-E2通常無法有意義地合并多個對象或對象屬性,例如形狀、方向和顏色。

同時在一些意料之外的情況下,有一些相對簡單的文本,程序也可能無法充分執行。

例如,我們輸入文本“一百只打扮成羅馬士兵的青蛙在沙漠中行進”。即使我們嘗試了多種提示變體,結果也不盡如人意。

另一個例子是當我們嘗試相當簡單的提示時,如“霸王龍騎著獨輪車在艾菲爾塔前”。不知道為什么,程序拒絕畫獨輪車,取而代之的是自行車。而當我們從提示中刪除“EifelTower”,產生預期圖像則沒有任何阻礙。

這些只是DALL-E2局限性的幾個例子。更令人擔憂的問題本質上很復雜,可能會對公司及其用戶造成嚴重不良影響。

OpenAI限定DALL-E2不創建公眾人物和名人的圖像。事實上,它完全拒絕生成包含真實面孔或真人的圖像,這是朝著防止濫用該程序邁出的重要一步。

隨著DALL-E2越來越受歡迎,版權侵權也可能成為一個大問題。OpenAI堅持認為,用戶“獲得了將他們使用DALL-E創建的圖像商業化的全部權利,包括轉載、銷售和商品化的權利。”

然而,人工智能藝術生成器依賴于分析、學習人類藝術家的作品來創造藝術。因此,不能排除潛在的侵犯知識產權法的可能性,無論是否有意。

總結

DALL-E2完美嗎?作為一項正在完善的項目,答案是否定的。

但是,正如機器學習的本質一樣,隨著時間的推移,該程序正變得越來越聰明,也越來越有能力。從純技術的角度來看,DALL-E2是AI技術演進的一大進步。

人們普遍認為人工智能系統在創意領域實際上無法超越人類,至少不會很快。但是DALL-E2已經使這個論點受到了沖擊。

然而盡管OpenAI已經采取了一系列措施來預測和防止DALL-E2的潛在濫用,但這并非萬無一失。在沒有任何道德界限的情況下可以使用的AI系統將在多久后出現?需要我們保持警惕。

無論如何,我們都需要密切關注這個新興行業。因為AI藝術生成器及其背后的技術只會在未來的歲月里變得更加普遍。

Tags:ALLDAL區塊鏈OPENALLIN價格DAL價格區塊鏈的未來發展前景論文Open Sesame

BTC
以太坊:2022 以太坊大事記_DAN

撰文:Stephanie/Franci,ECN我們挑選了9個最值得記錄下來的事件與話題,加以梳理與總結,希望能幫助大家在回顧2022時帶來一些記憶點.

1900/1/1 0:00:00
XETH:上海升級在即 如何科學地獲取ETH Staking收益?_ETH

原文作者:CapitalismLab上海升級在即,流動性質押賽道火熱。上海升級后由于開啟了unstake,也會大大降低stETH等de-peg的幅度和風險,適合更多用戶參與.

1900/1/1 0:00:00
OIN:項目周刊 | 以太坊網絡2022年總交易量較比特幣網絡高出338%_3X Short Dogecoin Token

金色周刊是金色財經推出的一檔每周區塊鏈行業總結欄目,內容涵蓋一周重點新聞、行情與合約數據、礦業信息、項目動態、技術進展等行業動態。本文是項目周刊,帶您一覽本周主流項目以及明星項目的進展.

1900/1/1 0:00:00
FTX:債權人必看 FTX索賠申請指南_SBLAND Vault (NFTX)

本文來自crypto-news-flash,原文作者:PaulAde盡管目前處理FTX破產案件的法院并未規定提交申索賠請的截止日期,但提交索賠申請越早越好.

1900/1/1 0:00:00
NFT:金色Web3.0日報 | Coinbase與Kava團隊達成合作并上線其原生代幣KAVA_DEFI

DeFi數據 1、DeFi代幣總市值:420.27億美元 DeFi總市值及前十代幣數據來源:coingecko2、過去24小時去中心化交易所的交易量35.

1900/1/1 0:00:00
Crypto2022: 莊家操盤往事

前FTX的headoftrade,即刻@octopuuus,在播客中提到一個我感興趣的視角是做市商機構視角,“莊家操盤往事lol”.

1900/1/1 0:00:00
ads