全球快播：新一代梗圖之王，居然是它

來(lái)源：36kr時(shí)間：2022-06-28 08:47:11

新一代梗圖之王，也可以是個(gè) AI。

最近我完全迷上了一個(gè)推特賬號(hào)。

【資料圖】

上面發(fā)的全都是些描述十分離譜，卻、又有一種獨(dú)特風(fēng)格的梗圖。

比如“懷孕的婦女將投石車(chē)瞄準(zhǔn)最高法院”：

“達(dá)斯·維達(dá)偷走一輛獨(dú)輪車(chē)的監(jiān)控畫(huà)面”：

還有“蜘蛛俠和古埃及”：

很難用文字來(lái)描述這些圖片，有多么的離譜卻又傳神了。自從我每天開(kāi)始轉(zhuǎn)發(fā)這個(gè)賬號(hào)，網(wǎng)友們都驚訝于我哪兒找來(lái)的這么多梗圖……

這個(gè)賬號(hào)，就是“奇怪的 Dall-E mini 生成圖片” (Weird Dall·E Generations @weirddalle)。

在這個(gè)梗圖橫行網(wǎng)絡(luò)，人們已經(jīng)不能好好說(shuō)話的年代，@weirddalle 成為了最新、最時(shí)髦，也最“古靈精怪”的梗圖來(lái)源。它今年2月才注冊(cè)，現(xiàn)在粉絲數(shù)量已經(jīng)快要突破百萬(wàn)了。

然而，很多人其實(shí)并不知道，這個(gè)賬號(hào)的背后，并非一位腦洞清奇和高產(chǎn)的畫(huà)手，而是一個(gè)在最近已經(jīng)火出天際的神經(jīng)網(wǎng)絡(luò)項(xiàng)目：DALL·E mini.

一個(gè)免費(fèi)公開(kāi)的項(xiàng)目，讓所有人都變成“靈魂畫(huà)手”

近兩年，超巨大參數(shù)量規(guī)模的語(yǔ)言模型，是進(jìn)展最迅猛的一個(gè)創(chuàng)新方向。包括 OpenAI 的GPT-3、谷歌的 LaMDA 等，處理起各種各樣的語(yǔ)言類(lèi)任務(wù)，效果非常強(qiáng)大。

這些科技公司還在專(zhuān)門(mén)研究一個(gè)具體的語(yǔ)言任務(wù)：根據(jù)文字描述生成圖片。在這個(gè)任務(wù)方向上，OpenAI 的 DALL·E、谷歌的Imagen，以及 MidJourney 模型，都是非常知名的項(xiàng)目。

但是這些知名項(xiàng)目都是不公開(kāi)或半公開(kāi)的。比如 DALL·E 2，OpenAI 只給數(shù)量極其有限（大約幾百人）的外部開(kāi)發(fā)者和研究人員開(kāi)放了使用權(quán)限。于是，家住美國(guó)休斯頓的開(kāi)發(fā)者 Boris Dayma 決定，照著 DALL·E 2 的樣子自己做一個(gè)小規(guī)模的免費(fèi)版本出來(lái)，讓大家玩?zhèn)€夠。

這個(gè)項(xiàng)目，就是后來(lái)的 DALL·E mini。

Boris Dayma圖片來(lái)源：本人

這個(gè)項(xiàng)目本來(lái)是 Dayma 拿來(lái)參加 Hugging Face 挑戰(zhàn)賽的，因?yàn)樾Ч麑?shí)在太棒，又是開(kāi)源免費(fèi)使用的，沒(méi)過(guò)半年它就成功破圈，進(jìn)入了主流社會(huì)的視野。

至于為什么一個(gè)出于愛(ài)好性質(zhì)，由個(gè)人開(kāi)發(fā)者做出來(lái)的圖片生成模型，能夠和 OpenAI 的 DALL·E 一代不相上下，在于這個(gè)小項(xiàng)目用了三個(gè)圖片-描述平行數(shù)據(jù)庫(kù)，分別為300萬(wàn)、1200萬(wàn)和1500萬(wàn)張圖片，其中1500萬(wàn)的這個(gè)數(shù)據(jù)庫(kù)正好是 OpenAI 的 YFCC100M 數(shù)據(jù)子集。

現(xiàn)在，大家正在瘋狂地使用 DALL·E mini 進(jìn)行創(chuàng)作輸出。粉絲們甚至在 Reddit 上專(zhuān)門(mén)建立了一個(gè)subreddit社區(qū)，目前已經(jīng)有超過(guò)8萬(wàn)名用戶(hù)，在一個(gè)尋常的周四晚上，都有超過(guò)一千人同時(shí)在線：

在這個(gè) subreddit 里，各式各樣腦洞清奇的作品更是層出不窮：

有強(qiáng)迫模型生成 PPT 藝術(shù)字的：

有用它來(lái)偽造歷史照片的：

圖注：《星戰(zhàn)》角色佳佳賓克斯在紐倫堡受審

雖然名字有點(diǎn)像，功能也基本一樣，但 DALL·E mini 除了名字和訓(xùn)練數(shù)據(jù)庫(kù)之外，跟 OpenAI 的 DALL·E 完全沒(méi)有任何關(guān)系。也是因?yàn)樗罱鼘?shí)在太火，搞得 OpenAI 有意見(jiàn)了，Dayma 只好把自己的項(xiàng)目名稱(chēng)改成了 Craiyon（https://www.craiyon.com/）

聽(tīng)說(shuō)此事之后，粉絲們還做了一張梗圖，嘲笑 OpenAI 那邊還在控制測(cè)試權(quán)限，這邊 DALL·E mini 早就給全網(wǎng)玩嗨了……

Dayma 在本周三透露，目前 DALL·E mini 后臺(tái)正在面臨巨大的算力和流量壓力，每天要處理大約500萬(wàn)次生成指令。他表示 “ 做了這么一個(gè)怪怪的但是能用的東西出來(lái)，反而大家都挺喜歡的的 ”，自己還是挺開(kāi)心。

更重要的是，把過(guò)去只有少數(shù)“AI 特權(quán)人士”才擁有工具，交到每一個(gè)普通網(wǎng)民的手上，才是正確的事情。

Dayma 在接受英國(guó)媒體“i”采訪時(shí)指出，那些能夠使用類(lèi)似圖片生成模型的 AI 精英們，通常只會(huì)把讓他們自己感到滿(mǎn)意的生成結(jié)果發(fā)出來(lái)，這容易讓其它看熱鬧的人誤以為這些模型已經(jīng)非常厲害了，然而實(shí)際情況可能并非如此。所以他才會(huì)搗鼓出 DALL·E mini 這個(gè)小玩意，讓所有人都能用上，“這樣大家才能真正明白這些模型到底水平如何。”

無(wú)所不能的語(yǔ)言模型，終于染指了藝術(shù)創(chuàng)作

2020年，OpenAI 的研究者揭開(kāi)了 GPT-3 模型的蓋頭，當(dāng)時(shí)的論文題為“Language Models are Few-Shot Learners”，直接點(diǎn)出了超大語(yǔ)言模型在多種非訓(xùn)練任務(wù)上具備強(qiáng)大的快速學(xué)習(xí)/掌握能力。

而在語(yǔ)言模型基礎(chǔ)之上，面向圖片生成這一專(zhuān)門(mén)任務(wù)方向而調(diào)試訓(xùn)練出的結(jié)果，像 DALL·E、DALL·E mini、Imagen、Midjourney 等的圖片生成模型，更是展示出了令人驚訝的“藝術(shù)創(chuàng)作”能力。

2022年6月的一個(gè)星期一下午，傳媒巨頭赫斯特旗下時(shí)尚雜志《COSMO》位于紐約市的編輯開(kāi)了一個(gè)視頻電話會(huì)。會(huì)議的目的是為該雜志的6月刊設(shè)計(jì)一個(gè)封面，但和往常不同的是，位于西海岸的 OpenAI 員工也參與到了會(huì)議里。《COSMO》的編輯們震驚于 OpenAI 在 AI 藝術(shù)創(chuàng)作上取得的驚人進(jìn)展，決定邀請(qǐng)這家公司一同在傳媒行業(yè)做一件從未發(fā)生過(guò)的事情：

讓 DALL·E 2 來(lái)設(shè)計(jì)一本頂級(jí)時(shí)尚雜志的整版封面。

封面，對(duì)于傳媒人來(lái)說(shuō)是頂禮膜拜的一種存在，時(shí)尚媒體更是如此。對(duì)于一本時(shí)尚雜志，封面濃縮了編輯部的社交關(guān)系能力和藝術(shù)審美水準(zhǔn)，讓人一眼即可領(lǐng)略本期內(nèi)容的精華，和雜志本身的積淀。而當(dāng)《COSMO》讓 AI 來(lái)設(shè)計(jì)封面的決定在業(yè)界傳開(kāi)之后，難免有人詰問(wèn)：是否傳媒創(chuàng)意行業(yè)也江郎才盡，將要和其它很多藍(lán)白粉領(lǐng)工作一樣，最終難免讓位給 AI？

如果僅從這次視頻會(huì)議的工作效率來(lái)看，肯定的答案似乎是顯而易見(jiàn)的：DALL·E 2 以平均每次輸入20秒的用時(shí)，就可以根據(jù)編輯輸入的字句，生成對(duì)應(yīng)的圖片，而且一次可以出六版，相比人工畫(huà)師，效率簡(jiǎn)直高出天際了。

只是，這些圖片都令人不甚滿(mǎn)意。

最終，六位參會(huì)者不斷地打磨和迭代輸入的文本，又經(jīng)過(guò)了一整夜之后，DALL·E 2 才終于生成了令所有人都滿(mǎn)意的封面結(jié)果。

輸入語(yǔ)句: "從下往上的廣角拍攝，一個(gè)有著健美女性身材的女性宇航員，在火星上和無(wú)限的宇宙背景中中大搖大擺地走向相機(jī)，采用合成波風(fēng)格 (synthwave)，"圖片來(lái)源：COSMO 雜志

采用 DALL·E 2 “outpainting”功能，根據(jù)初始生成的圖片，不斷在邊緣處進(jìn)行“補(bǔ)完”，最終生成一張連貫的圖片圖片來(lái)源：OpenAI/COSMO 雜志

在今天，DALL·E 2、DALL·E mini、MidJourney、Imagen 在生成視覺(jué)藝術(shù)上的確展現(xiàn)出極大的潛力。但如果你仔細(xì)想，它更大的意義，其實(shí)在于為那些“空有靈感”卻沒(méi)有視覺(jué)創(chuàng)作技藝的人，也即互聯(lián)網(wǎng)上的每個(gè)你和我，賦予了一件強(qiáng)大的工具。

DALL·E 項(xiàng)目產(chǎn)品經(jīng)理 Joanne Jang 表示，OpenAI 最終肯定還是希望能夠?qū)?DALL·E 2 商業(yè)化的，但希望在藝術(shù)生成的這個(gè)方向上，把它做成一個(gè)創(chuàng)作者的工具，而不是替代品。

沒(méi)有任何工具應(yīng)該替代創(chuàng)作者本人的藝術(shù)理解和表達(dá)對(duì)創(chuàng)作產(chǎn)物所造成的影響。但是，當(dāng)文字生成圖片技術(shù)進(jìn)一步普及過(guò)后，難免出現(xiàn)大批入門(mén)級(jí)創(chuàng)作者淪為模型的“操作員”，過(guò)度依賴(lài)工具。

參與了《COSMO》封面項(xiàng)目的數(shù)字藝術(shù)家 KarenCheng 認(rèn)為，AI的采用確實(shí)會(huì)對(duì)各行各業(yè)造成深遠(yuǎn)影響，讓很多人失去工作，

“不過(guò)與此同時(shí)，創(chuàng)意將會(huì)迎來(lái)一次爆發(fā)，新的工種也將被創(chuàng)造出來(lái)，那種可能性是今天的我們所無(wú)法想象的?！?/strong>

未注明來(lái)源圖片均來(lái)自于推特賬號(hào) @weirddalle 以及所引用的用戶(hù)，版權(quán)屬于原作者。

關(guān)鍵詞：語(yǔ)言模型時(shí)尚雜志藝術(shù)創(chuàng)作

責(zé)任編輯：FD31

上一篇：

下一篇：

99国内免费在线_无码有码日韩人妻_国产成_人_综合_亚洲_漂亮人妻被强中文字幕久久_手机看片福利永久国产影集

全球快播：新一代梗圖之王，居然是它

一個(gè)免費(fèi)公開(kāi)的項(xiàng)目，讓所有人都變成“靈魂畫(huà)手”

無(wú)所不能的語(yǔ)言模型，終于染指了藝術(shù)創(chuàng)作

精彩圖集(熱圖)