免费爱碰视频在线观看,九九精品国产屋,欧美亚洲尤物久久精品,1024在线观看视频亚洲

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      【新智元導讀】Midjourney強敵來了!谷歌定制大師StyleDrop,將一張圖片作為參考,不論多復雜的藝術風格都能復刻。

      谷歌StyleDrop一出,瞬間在網(wǎng)上刷屏了。

      給定梵高的星空,AI化身梵高大師,對這種抽象風格頂級理解后,做出無數(shù)幅類似的畫作。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      再來一張卡通風,想要繪制的物體呆萌了許多。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      甚至,它還能精準把控細節(jié),設計出原風格的logo。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      StyleDrop的魅力在于,只需要一張圖作為參考,無論多么復雜的藝術風格,都能解構再復刻。

      網(wǎng)友紛紛表示,又是淘汰設計師的那種AI工具。

      StyleDrop爆火研究便是來自谷歌研究團隊最新出品。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      論文地址:https://arxiv.org/pdf/2306.00983.pdf

      現(xiàn)在,有了StyleDrop這樣的工具,不但可以更可控地繪畫,還可以完成之前難以想象的精細工作,比如繪制logo。

      就連英偉達科學家將其稱為「現(xiàn)象級」成果。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      「定制」大師

      論文作者介紹道,StyleDrop的靈感來源Eyedropper(吸色/取色工具)。

      同樣,StyleDrop同樣希望大家可以快速、毫不費力地從單個/少數(shù)參考圖像中「挑選」樣式,以生成該樣式的圖像。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      一只樹懶能夠有18種風格:

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      一只熊貓有24種風格:

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      小朋友畫的水彩畫,StyleDrop完美把控,甚至連紙張的褶皺都還原出來了。

      不得不說,太強了。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      還有StyleDrop參考不同風格對英文字母的設計:

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      同樣是梵高風的字母。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      還有線條畫。線條畫是對圖像的高度抽象,對畫面生成構成合理性要求非常高,過去的方法一直很難成功。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      原圖中奶酪陰影的筆觸還原到每種圖片的物體上。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      參考安卓LOGO創(chuàng)作。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      此外,研究人員還拓展了StyleDrop的能力,不僅能定制風格,結合DreamBooth,還能定制內(nèi)容。

      比如,還是梵高風,給小柯基生成類似風格的畫作:

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      再來一個,下面這只柯基有種埃及金字塔上的「獅身人面像」的感覺。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      如何工作?

      StyleDrop基于Muse構建,由兩個關鍵部分組成:

      一個是生成視覺Transformer的參數(shù)有效微調,另一個是帶反饋的迭代訓練。

      之后,研究人員再從兩個微調模型中合成圖像。

      Muse是一種基于掩碼生成圖像Transformer最新的文本到圖像的合成模型。它包含兩個用于基礎圖像生成(256×256)和超分辨率(512×512或1024×1024)的合成模塊。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      每個模塊都由一個文本編碼器T,一個transformer G,一個采樣器S,一個圖像編碼器E和解碼器D組成。

      T將文本提示t∈T映射到連續(xù)嵌入空間E。G處理文本嵌入e∈E以生成視覺token序列的對數(shù)l∈L。S通過迭代解碼從對數(shù)中提取視覺token序列v∈V,該迭代解碼運行幾步的transformer推理,條件是文本嵌入e和從前面步驟解碼的視覺token。

      最后,D將離散token序列映射到像素空間I??偟膩碚f,給定一個文本提示t,圖像I的合成如下:

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      圖2是一個簡化了的Muse transformer層的架構,它進行了部分修改,為的是支持參數(shù)高效微調(PEFT)與適配器。

      使用L層的transformer處理在文本嵌入e的條件下以綠色顯示的視覺token序列。學習參數(shù)θ被用于構建適配器調優(yōu)的權重。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      為了訓練θ,在許多情況下,研究人員可能只給出圖片作為風格參考。

      研究人員需要手動附加文本提示。他們提出了一個簡單的、模板化的方法來構建文本提示,包括對內(nèi)容的描述,后面跟著描述風格的短語。

      例如,研究人員在表1中用「貓」描述一個對象,并附加「水彩畫」作為風格描述。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      在文本提示中包含內(nèi)容和風格的描述至關重要,因為它有助于從風格中分離出內(nèi)容,這是研究人員的主要目標。

      圖3則是帶反饋的迭代訓練。

      當在單一風格參考圖像(橙色框)上進行訓練時,StyleDrop生成的一些圖像可能會展示出從風格參考圖像中提取出的內(nèi)容(紅色框,圖像背景中含有與風格圖像類似的房子)。

      其他圖像(藍色框)則能更好地從內(nèi)容中拆分出風格。對StyleDrop進行好樣本(藍色框)的迭代訓練,結果在風格和文本保真度之間取得了更好的平衡(綠色框)。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      這里研究人員還用到了兩個方法:

      -CLIP得分

      該方法用于測量圖像和文本的對齊程度。因此,它可以通過測量CLIP得分(即視覺和文本CLIP嵌入的余弦相似度)來評估生成圖像的質量。

      研究人員可以選擇得分最高的CLIP圖像。他們稱這種方法為CLIP反饋的迭代訓練(CF)。

      在實驗中,研究人員發(fā)現(xiàn),使用CLIP得分來評估合成圖像的質量是提高召回率(即文本保真度)的有效方式,而不會過多損失風格保真度。

      然而從另一方面看,CLIP得分可能不能完全與人類的意圖對齊,也無法捕捉到微妙的風格屬性。

      -HF

      人工反饋(HF)是一種將用戶意圖直接注入到合成圖像質量評估中的更直接的方式。

      在強化學習的LLM微調中,HF已經(jīng)證明了它的強大和有效。

      HF可以用來補償CLIP得分無法捕捉到微妙風格屬性的問題。

      目前,已有大量研究關注了文本到圖像的擴散模型的個性化問題,以合成包含多種個人風格的圖像。

      研究人員展示了如何以簡單的方式將DreamBooth和StyleDrop結合起來,從而使風格和內(nèi)容都能實現(xiàn)個性化。

      這是通過從兩個修改后的生成分布中采樣來完成的,分別由風格的θs和內(nèi)容的θc指導,分別是在風格和內(nèi)容參考圖像上獨立訓練的適配器參數(shù)。

      與現(xiàn)有的成品不同,該團隊的方法不需要在多個概念上對可學習的參數(shù)進行聯(lián)合訓練,這就帶來了更大的組合能力,因為預訓練的適配器是分別在單個主題和風格上進行訓練的。

      研究人員的整體采樣過程遵循等式(1)的迭代解碼,每個解碼步驟中采樣對數(shù)的方式有所不同。

      設t為文本提示,c為無風格描述符的文本提示,在步驟k計算對數(shù)如下:

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      其中:γ用于平衡StyleDrop和DreamBooth——如果γ為0,我們得到StyleDrop,如果為1,我們得到DreamBooth。

      通過合理設置γ,我們就可以得到合適的圖像。

      實驗設置

      目前為止,還沒有對文本-圖像生成模型的風格調整進行廣泛的研究。

      因此,研究人員提出了一個全新實驗方案:

      -數(shù)據(jù)收集

      研究者收集了幾十張不同風格的圖片,從水彩和油畫,平面插圖,3D渲到不同材質的雕塑。

      -模型配置

      研究人員使用適配器調優(yōu)基于Muse的StyleDrop 。對于所有實驗,使用Adam優(yōu)化器更新1000步的適配器權重,學習速率為0.00003。除非另有說明,研究人員使用StyleDrop來表示第二輪模型,該模型在10多個帶有人工反饋的合成圖像上進行訓練。

      -評估

      研究報告的定量評估基于CLIP,衡量風格一致性和文本對齊。此外,研究人員進行了用戶偏好研究,以評估風格一致性和文本對齊。

      如圖,研究人員收集的18個不同風格的圖片,StyleDrop處理的結果。

      可以看到,StyleDrop能夠捕捉各種樣式的紋理、陰影和結構的細微差別,能夠比以前更好地控制風格。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      為了進行比較,研究人員還介紹了DreamBooth在Imagen上的結果,DreamBooth在Stable Diffusion上的LoRA實現(xiàn)和文本反演的結果。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      具體結果如表所示,圖像-文本對齊(Text)和視覺風格對齊(Style)的人類評分(上)和CLIP評分(下)的評價指標。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      (a) DreamBooth,(b) StyleDrop,和 (c) DreamBooth + StyleDrop的定性比較:

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      這里,研究人員應用了上面提到的CLIP分數(shù)的兩個指標——文本和風格得分。

      對于文本得分,研究人員測量圖像和文本嵌入之間的余弦相似度。對于風格得分,研究人員測量風格參考和合成圖像嵌入之間的余弦相似度。

      研究人員為190個文本提示生成總共1520個圖像。雖然研究人員希望最終得分能高一些,但其實這些指標并不完美。

      而迭代訓練(IT)提高了文本得分,這符合研究人員的目標。

      然而,作為權衡,它們在第一輪模型上的風格得分有所降低,因為它們是在合成圖像上訓練的,風格可能因選擇偏見而偏移。

      Imagen上的DreamBooth在風格得分上不及StyleDrop(HF的0.644對比0.694)。

      研究人員注意到,Imagen上的DreamBooth的風格得分增加并不明顯(0.569→0.644),而Muse上的StyleDrop的增加更加明顯(0.556→0.694)。

      研究人員分析,Muse上的風格微調比Imagen上的更有效。

      另外,在細粒度控制上, StyleDrop捕捉微妙的風格差異,如顏色偏移,層次,或銳角的把控。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      網(wǎng)友熱評

      要是設計師有了StyleDrop,10倍速工作效率,已經(jīng)起飛。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      AI一天,人間10年,AIGC正在以光速發(fā)展,那種晃瞎人眼的光速!

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      工具只是順應了潮流,該被淘汰的已經(jīng)早被淘汰了。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      對于制作Logo來說這個工具比Midjourney好用得多。

      Midjourney勁敵來了! 谷歌StyleDrop王牌「定制大師」引爆AI藝術圈

      參考資料:

      https://styledrop.github.io/

      鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權歸原作者所有,如有侵權請聯(lián)系管理員(admin#wlmqw.com)刪除。
      用戶投稿
      上一篇 2023年6月4日 18:12
      下一篇 2023年6月4日 18:58

      相關推薦

      • 日本電視劇收視率歷史排名(電視劇收視率歷史排名)

        收視率最高的電視劇排行榜前十名 1、但是《還珠格格》卻是我童年中我最喜歡看的電視劇。每到夏天的時候總會去看,好像如果這個夏天沒有看這個電視劇,夏天好像就沒有到來??梢娺@部電視劇對于…

        2024年1月24日
      • 液壓機械缸鍛造廠家品質好的有哪些值得推薦?

        液壓機是一種以液體為工作介質的重要機械設備,其核心功能是傳遞能量,實現(xiàn)各種工藝流程。除了在鍛壓成形方面的應用,液壓機還廣泛應用于矯正、壓裝、打包、壓塊和壓板等領域。根據(jù)工作介質的不…

        2024年1月24日
      • 湖南暴雪已致1萬多人受災

        據(jù)@湖南氣象 ,22日7時至23日7時,湘中、湘南出現(xiàn)大到暴雪,長沙(瀏陽)、株洲(醴陵、茶陵)等13個縣市區(qū)出現(xiàn)大暴雪,郴州(北湖區(qū))、株洲(荷塘區(qū))出現(xiàn)特大暴雪;全省23個縣市…

        2024年1月24日
      • 落馬貪官退贓像“割肉”,詢問能不能少交點

        “就像割我身上的肉一般,會讓我痛不欲生。” 24日,中央紀委國家監(jiān)委網(wǎng)站發(fā)布了針對云南省文山州住房和城鄉(xiāng)建設局原黨組成員、副局長李慶明嚴重違紀違法案的剖析。信奉金錢至上的李慶明惜財…

        2024年1月24日
      • 中國gdp排行榜城市(中國gdp排行榜)

        中國各省gdp排名 1、根據(jù)查詢國家統(tǒng)計局官網(wǎng)信息顯示,2023年各省排名,廣東:GDP為1243667億。江蘇:GDP為116362億。山東:GDP為83099億。浙江:GDP為…

        2024年1月24日
      • SK-II大中華區(qū)季度銷售額暴跌34%,寶潔:日本核污水排海是主因

        財聯(lián)社1月24日訊(編輯 卞純)全球日用消費品巨頭寶潔公司(ProcterGamble)周二表示,在截至12月底的第二財季,其高端護膚品牌SK-II在大中華區(qū)的銷售額下降了34%,…

        2024年1月24日
      • 呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退

        呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退 原標題: 呼和浩特白塔機場通報“保潔員占母嬰室吃飯”:涉事人已被辭退 央視網(wǎng)消息:據(jù)@呼和浩特白塔國際機場 消息,呼和浩…

        2024年1月24日
      • 退休職工舉報局長被判刑,被舉報人卻提級退休把人看懵了

        文|龍之朱 又見錯抓錯判上了熱搜。 據(jù)媒體報道,從2016年3月起,安徽宿州市碭山縣農(nóng)機局退休職工李平實名向紀檢部門舉報局長王超經(jīng)濟問題,均石沉大海。 2017年7月,李平夫婦及親…

        2024年1月24日
      • 6寸蛋糕用5斤車厘子店家道歉

        【#6寸蛋糕用5斤車厘子店家道歉#:客服能力不足,多報了2斤車厘子】#遇到商家虛假宣傳你會怎么辦# 近日,有網(wǎng)友發(fā)帖稱做六寸蛋糕需要5斤車厘子引熱議。 1月22日,涉事店家就“6寸…

        2024年1月24日
      • 格蘭芬多院徽簡筆畫(格蘭芬多院徽)

        哈利波特的霍格沃茨學校分別是哪些學院? 1、《哈利波特》電影中的霍格沃茨學院,一共分為四個學院,分別是:格蘭芬多、赫奇帕奇、拉文克勞與斯萊特林。 2、霍格沃茨魔法學院共有格蘭芬多、…

        2024年1月24日

      聯(lián)系我們

      聯(lián)系郵箱:admin#wlmqw.com
      工作時間:周一至周五,10:30-18:30,節(jié)假日休息