谷歌最強大(da)的(de)(de)(de)文(wen)生圖(tu)大(da)模型 Imagen 2,可提供(gong)與用(yong)戶提示(shi)詞緊密結(jie)合且(qie)一致的(de)(de)(de)高(gao)質量(liang)、逼真(zhen)的(de)(de)(de)圖(tu)像輸出。它可以(yi)通過使(shi)用(yong)訓練數據的(de)(de)(de)自然分布(bu)來生成更逼真(zhen)的(de)(de)(de)圖(tu)像,而不是采用(yong)預先編(bian)程(cheng)的(de)(de)(de)風格。
谷歌的(de)(de)增強模型 Imagen 2是利用谷歌旗艦人工智能(neng)實驗室Google DeepMind的(de)(de)技術開(kai)發的(de)(de),該模型在5月份的(de)(de)科技巨頭 I/O大會上(shang)悄(qiao)悄(qiao)推出了(le)預覽版(ban)。谷歌聲稱,與第一代Imagen相比,它在圖像質量方面“顯著”提高,并引入了(le)新功能(neng),包括(kuo)渲染文本和Logo的(de)(de)能(neng)力(li)。
“Imagen 2 可以生成……徽(hui)章、字母標(biao)記和(he)抽象徽(hui)標(biao)……[并且]能夠將這些徽(hui)標(biao)覆蓋到產(chan)品、服裝、名片和(he)其他表面上。”
得益(yi)于“新穎的(de)(de)(de)訓練和(he)建模(mo)技術”,Imagen 2還可(ke)以理(li)解更(geng)具(ju)描述性的(de)(de)(de)長格式提(ti)(ti)示(shi),并(bing)對有(you)關圖像中元素(su)的(de)(de)(de)問題提(ti)(ti)供“詳細答案(an)”。谷歌(ge)表示(shi),這些技術還增強了 Imagen 2的(de)(de)(de)多語言(yan)理(li)解能(neng)力——允許模(mo)型將一種語言(yan)的(de)(de)(de)提(ti)(ti)示(shi)翻譯成另一種語言(yan)的(de)(de)(de)輸(shu)出(例如Logo)。
Imagen 2利用(yong)(yong)SynthID(DeepMind開發的一種方(fang)法)將隱形水(shui)印(yin)應用(yong)(yong)到其創建的圖像上。當然,檢測這(zhe)些(xie)水(shui)印(yin)(谷歌聲稱這(zhe)些(xie)水(shui)印(yin)能夠適應圖像編輯,包括壓(ya)縮、濾鏡和顏色調整)需要(yao)谷歌提(ti)供的工(gong)具(ju),而第三方(fang)無法使用(yong)(yong)該工(gong)具(ju)。