繼GPT-4之后,Midjourney V5上線。網(wǎng)友紛紛試玩,畫出了一對中國情侶,視覺炸裂,碾壓人類畫師。
昨天,由Midjourney V5畫的一對中國情侶在網(wǎng)上引起軒然大波。
許多人紛紛驚呼:人類畫師別活了。
(資料圖片)
有人不相信這是Midjourney之作,也親手體驗了一把。在輸入以下的promot后,畫風(fēng)瞬間驚艷了。
「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」
在GPT-4發(fā)布后,Midjourney也更新了V5,不僅繪圖更逼真,而且prompt更靈敏。
最重要的是,一直被詬病的「AI 不會畫手指」,Midjourney V5都拿捏了。
還有滿屏的電影質(zhì)感,除了OMG,還是OMG。
甚至有網(wǎng)友驚呼:模特不存在了!
從Midjourney的V1到V5,就可以看到AIGC這一年來的進化速度有多快。
最新V5版的圖像質(zhì)量更高、輸出更多樣化、有更廣泛的風(fēng)格、支持無縫紋理、有更寬的縱橫比、有更好的圖像提示,以及更寬的動態(tài)范圍……
激動的心,顫抖的手,國內(nèi)網(wǎng)友紛紛上手實操了一波。
先上手的寫真圖:
雖然V5能夠畫出5根手指,但是在手指的細節(jié)上,還是差點意思。
比如試著讓Midjourney V5給梵高的房間拍個照:
Midjourney V5在畫中國美女的神態(tài)時,把控也是非常到位。
V5還能拿捏中國古典風(fēng)格的美,畫出了亭亭玉立的美人,細節(jié)顆粒度拉滿。
還有網(wǎng)友用GPT-4+Midjourney V5創(chuàng)作了電影「杭州重生」,連豆瓣上介紹頁都P出來了,看起來還真是那么回事兒。
在2022年12月,譚木匠舉辦了一場梳子比賽,人類設(shè)計師設(shè)計的梳子如下:
網(wǎng)友黃仲生用V5試了一波,并驚訝地發(fā)現(xiàn)「麻瓜」在AI面前完全不能打。
當(dāng)別人反饋說上面的梳子太美,只能用來收藏,網(wǎng)友又整了一波日??捎玫氖嶙?。
還有給小朋友用的梳子
在國外,有網(wǎng)友直接用Midjourney V5畫出了The Matrix的電影質(zhì)感,讓人瞬間懷疑這是不是電影里的截圖。
并且獻上了prompt:
「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」
還有網(wǎng)友 嘗試用「民宅火災(zāi)現(xiàn)場微笑女孩」經(jīng)典meme讓Midjourney創(chuàng)作「城堡火災(zāi)現(xiàn)場微笑洛基」。
來看下這炸裂的效果。
網(wǎng)友還開腦洞把「北京屋頂情侶」圖加上洛基元素。
還有個搞笑版的,龍卷風(fēng)來了,老太太騎著電驢在「狂飆」。
亞洲人的臉部特征也是做的非常逼真。
旅行博主都不用出門,直接在家調(diào)教Midjourney就可以了。
還有網(wǎng)友拿V4和V5做了對比圖,通過輸入一張圖,還有文字提示,V4生成的圖片在光照下物體陰影處理方面無法與V5相比。
再來一張眼睛特寫圖:
通過對V3、V4、V5這三個版本輸入相同提示、相同設(shè)置,對其輸出圖片進行了對比。
在V5這個版本中,波光粼粼的水面,還有魚兒在水中游的倒影,已經(jīng)達到了以假亂真的程度。
但是如果沒有提供有關(guān)環(huán)境的文本的提示,比起V4,V5默認生成了更加真的環(huán)境。
網(wǎng)友迫不及待地讓V5來復(fù)刻一下王家衛(wèi)「藍莓之夜」的電影風(fēng)格,發(fā)現(xiàn)V5在處理玻璃的反射方面做得更逼真了。
以及各種真假難辨的作品:
反派氣質(zhì)拉滿的馬斯克:
「貓戴VR」:
最新升級的V5,相較于前一版有什么改進,一位研究員就他們之間的對比做了一張表:
1. 密鋪(--tileargument)
在創(chuàng)建模式時使用。此前V3有這一參數(shù),然而在V4中暫時終止使用,V5版本重新上線。
比如輸入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」,生成如下的圖:
2. 長寬比(--arargument )
在V4中,只能有不高于1:2或不寬于2:1的自定義縱橫比。而在V5中,你可以自定義比率與任何「寬度: 長度」比,如下是自定義比例的演示:
這一點升級,意味著什么?
現(xiàn)代電影中常見的最寬縱橫比2.39:1都能夠?qū)崿F(xiàn),你可以制作電影巨幕,人人都能成為導(dǎo)演!
V5生成2.4:1電影畫幕
3. 圖像權(quán)重可以自定義(-- iwargument)
圖像提示中的權(quán)重現(xiàn)在可以輸入自定義值。你可以決定輸入圖像對最終生成的圖像的影響程度。
如下,在Midjourney V5中,輸入一張圖和一句文本提示。
通過自定義不同權(quán)重,2、1、0.5生成了不同的圖片。
輸入的提示如下:「/imagine http://imgur.com/romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」
4. less opinionated
「less opinionated」意味著,在V4中,只需要編寫較少的文本提示,Midjourney便會輸出更具創(chuàng)造性的圖像。
但V5不是這樣的,你可能需要輸入更多的形容詞,并給出更多的細節(jié),比如風(fēng)格或情緒,輸出圖像應(yīng)該是什么樣子。如果沒有更多描述,Midjourney就會輸出一個默認風(fēng)格,比如「攝影」風(fēng)格。
這一點升級,可以讓人們通過文本提示能夠更精準(zhǔn)地把控Midjourney輸出的內(nèi)容。也意味著,在輸入文本和輸出圖像之間有「更多的內(nèi)聚力」。
以上4點升級是官方博客中提到,但是最讓人意想不到的是Midjourney V5能夠畫出「5個手指和腳趾」!
另外,V5已經(jīng)在更真實的圖像/照片上進行了微調(diào),因此可以看到在輸出窗戶反射和透過玻璃的圖片上更加真實。
最后來一個測試題:
下面4張圖,只有一張是真人,其他都是Midjourney V5畫的,猜猜真人是哪一張?
https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295
https://twitter.com/mranti/status/1637326003927396352?s=46&t=iBppoR0Tk6jtBDcof0HHgg
關(guān)鍵詞: