AI繪畫的“小秘密”都在這一篇文章裏
◎本報記者 金 鳳
有了AI,人人都可以是藝術家。AI繪畫的出現,恰如瑞士藝術家保羅·克利所言:“藝術不是再現可見,而是使不可見成為可見。”經過20年左右的發展,目前基於不同類型或者模態元素的AI繪畫發展情況不盡相同,發展最久的是“以圖生圖”,再到近期火爆的“文+圖”生圖。當然,也有團隊已經研發出由語音生成圖像的技術。
上傳一張圖片,或者輸入一些簡單的關鍵詞,係統就能自動生成一張卡通圖像……最近一段時間,AI繪畫開始在互聯網社交平台走紅。
AI繪hui畫hua,顧gu名ming思si義yi就jiu是shi利li用yong人ren工gong智zhi能neng進jin行xing繪hui畫hua,是shi人ren工gong智zhi能neng生sheng成cheng內nei容rong的de典dian型xing應ying用yong場chang景jing之zhi一yi。其qi主zhu要yao原yuan理li是shi收shou集ji大da量liang已yi有you作zuo品pin,通tong過guo算suan法fa對dui其qi內nei容rong和he風feng格ge特te征zheng進jin行xing解jie析xi,最zui後hou再zai生sheng成cheng新xin的de作zuo品pin,所suo以yi算suan法fa是shiAI繪畫的核心。
當前,“憑空”生成圖像的AI繪畫,其實也會動輒“翻車”:也許上一秒AI通過你的照片繪出的是一張充滿藝術感的二次元畫像,下一秒你的寵物貓、狗則可能被畫成可愛少女或肌肉猛男。
事實上,AI繪畫早已火爆全球。第一張公開展出的、由人工智能創作的繪畫作品《埃德蒙·貝拉米的肖像》曾於2018年在佳士得拍賣行以43.25萬美元成交,那是一張由機器學習了從14世紀到20世紀的1.5萬張肖像畫之後自動生成的一張肖像畫作品。
AI繪畫是如何實現“憑空”生圖的?除了娛樂外,AI繪畫還有哪些潛在的應用前景?
從“以圖生圖”到“語音生圖”
2022年,由人工智能創作的《太空歌劇院》一度火出圈。在美國科羅拉多州舉辦的新興數字藝術家競賽中,《太空歌劇院》獲得“數字藝術/數字修飾照片”類別一等獎。它的構圖、配色以及畫麵的細節堪稱精致。然而,這個作品的創作者不是藝術家,而是來自美國科羅拉多州的遊戲設計師。
這位遊戲設計師在一個名為“Midjourney”的AI創作工具裏,先輸入幾個關鍵詞,如光源、構圖、氛圍等,得到了100幅作品,再進行約80小時的修圖修飾,最終選出3幅作品,最後把圖像打印到畫布上。
通過簡單交互式對話在短時間內生成的“藝術”作品,讓人類藝術家展開了一場關於“AI繪畫作品參賽是否屬於作弊”的爭論。這場聲勢浩大的爭論也令大眾直觀地意識到如今的AI繪畫水平已經發展到了何種程度。
“人工智能在藝術方麵的創作最早可以追溯到上個世紀末,當時的人工智能繪畫技術叫作‘圖像的風格化濾鏡’。”中國科學院自動化研究所多模態人工智能係統全國重點實驗室研究員董未名說,最初的AI繪hui畫hua方fang法fa比bi較jiao簡jian單dan,比bi如ru一yi張zhang普pu通tong的de照zhao片pian,通tong過guo一yi些xie圖tu像xiang處chu理li的de算suan法fa,把ba照zhao片pian像xiang素su進jin行xing幾ji何he或huo者zhe色se彩cai上shang的de變bian換huan,然ran後hou再zai調tiao節jie不bu同tong參can數shu,就jiu可ke以yi模mo擬ni出chu類lei似si油you畫hua或huo者zhe水shui彩cai畫hua的de風feng格ge。
經過20年左右的發展,目前基於不同類型或者模態元素的AI繪畫發展情況不盡相同,發展最久的是“以圖生圖”,再到近期火爆的“文+圖”生圖。當然,也有團隊已經研發出由語音生成圖像的技術。
AI繪畫主要依靠三種技術模式實現
董未名介紹,目前AI繪畫主要借助圖像風格遷移技術、圖文預訓練模型和擴散模型實現。
“tuxiangfenggeqianyijishuzhideshituxiangchulisuanfatongguoduishurudezhenshituxiangneirongtezhengheduicankaodeyishutuxiangfenggetezhengdetiqu,shixianzhenshituxiangneirongtezhengheyishutuxiangfenggetezhengderonghe,congershengchengxindeyishutuxiang。”董(dong)未(wei)名(ming)舉(ju)例(li),如(ru)果(guo)將(jiang)美(mei)國(guo)舊(jiu)金(jin)山(shan)藝(yi)術(shu)宮(gong)的(de)外(wai)景(jing)照(zhao)片(pian)和(he)印(yin)象(xiang)派(pai)創(chuang)始(shi)人(ren)莫(mo)奈(nai)繪(hui)製(zhi)的(de)作(zuo)品(pin),通(tong)過(guo)圖(tu)像(xiang)風(feng)格(ge)遷(qian)移(yi)技(ji)術(shu)進(jin)行(xing)融(rong)合(he),就(jiu)能(neng)得(de)到(dao)一(yi)張(zhang)看(kan)起(qi)來(lai)像(xiang)是(shi)由(you)莫(mo)奈(nai)繪(hui)製(zhi)的(de)美(mei)國(guo)舊(jiu)金(jin)山(shan)藝(yi)術(shu)宮(gong)的(de)繪(hui)畫(hua)作(zuo)品(pin)。最(zui)初(chu)的(de)AI繪畫采用的正是這種技術。
不過,在董未名看來,圖像風格遷移技術大多依賴的是生成式對抗網絡(GAN)算法,它最大的問題是生成的繪畫作品藝術性不強,筆觸和構圖讓人覺得與真實的繪畫有差距,所以長久以來,AI繪畫一直“籍籍無名”。
當圖像風格遷移技術還在掙紮於輸出作品的審美問題時,圖文預訓練模型的出現,加速了AI繪畫的崛起。
“依托圖文預訓練模型,隻要輸入一句話或者上傳一幅風格明顯的圖片,算法就能將圖像特征和文字特征‘對齊’。生成的繪畫作品的內容特征和上傳圖片的內容相似,藝術性也比圖像風格遷移技術生成的圖片強很多。”董未名舉例,比如支撐圖文預訓練模型的可對比語言—圖像預訓練(CLIP)算法,就是利用圖文特征“對齊”的能力,再結合已有的生成模型,實現“以圖生圖”或者“圖+文”生圖。
不過,董未名坦言,圖文預訓練模型的推廣也存在一些爭議,有部分人認為,該模型在訓練前期,需要用大量的圖形處理器(GPU)進行數據訓練,耗電量大、成cheng本ben很hen高gao,而er該gai模mo型xing的de應ying用yong場chang景jing卻que不bu夠gou清qing晰xi。但dan也ye有you人ren認ren為wei,也ye許xu該gai模mo型xing未wei來lai可ke以yi打da造zao為wei通tong用yong的de人ren工gong智zhi能neng模mo型xing,用yong它ta完wan成cheng更geng多duo的de算suan法fa作zuo業ye,隻zhi是shi這zhe還hai需xu要yao時shi間jian的de驗yan證zheng。
誠然沒有一項技術是完美的,這也為人類探究更先進的技術提供了無限動力。當下最流行的擴散模型便是其中之一。
“目前最新的AI繪畫技術采用的就是擴散模型,這種模型可以把一個隨機采樣的噪聲輸入模型,然後嚐試通過去噪來生成圖像。”dongweimingbiaoshi,kuosanmoxingyecunzairuodian,youyumoxingduitupianneirongshibiedenenglibuzu,huozhenanyiwanquanlijieshibiewenzideyiyi,yijixunlianshujudepiancha,youshibianhuishengcheng“四不像”的作品。此外,擴散模型生成圖片的速度比較慢,目前還達不到實時生成圖片。
互聯網治理、元宇宙或潛藏應用前景
AI繪畫目前的應用場景,更多聚焦於社交軟件。近期在國內社交網絡“火出天際”的AI繪畫軟件主要集中在小程序及App。隨著AI繪畫小程序的火爆,短視頻平台抖音也迅速上線了AI繪畫特效。同時,此前騰訊上線了“QQ小世界AI畫匠”活動,百度也推出了首款AI藝術和創意輔助平台“文心一格”。
有了AI,人人都可以是藝術家。AI繪畫的出現,恰如瑞士藝術家保羅·克利所言:“藝術不是再現可見,而是使不可見成為可見。”“AI現在已經完美實現了這一目標,人們可以通過機器計算來繪製出很多現實中見不到的場景。”董未名暢想,不遠的將來,AI繪畫或許還將展現更豐富的應用場景。
“現(xian)在(zai)網(wang)絡(luo)上(shang)充(chong)斥(chi)著(zhe)很(hen)多(duo)不(bu)良(liang)內(nei)容(rong),這(zhe)些(xie)內(nei)容(rong)為(wei)了(le)逃(tao)避(bi)監(jian)管(guan)經(jing)常(chang)以(yi)繪(hui)畫(hua)的(de)形(xing)式(shi)出(chu)現(xian),而(er)當(dang)前(qian)很(hen)多(duo)內(nei)容(rong)識(shi)別(bie)模(mo)型(xing)對(dui)真(zhen)實(shi)圖(tu)片(pian)識(shi)別(bie)得(de)很(hen)準(zhun)確(que),但(dan)缺(que)乏(fa)不(bu)良(liang)內(nei)容(rong)藝(yi)術(shu)作(zuo)品(pin)的(de)相(xiang)關(guan)訓(xun)練(lian)數(shu)據(ju),所(suo)以(yi)對(dui)不(bu)良(liang)內(nei)容(rong)識(shi)別(bie)不(bu)準(zhun)確(que)。也(ye)許(xu)可(ke)以(yi)用(yong)AI繪畫技術,積累不良內容藝術作品的數據,並用以訓練識別模型,以提升互聯網內容的安全監管能力和識別的準確率。”董未名建議。
在董未名看來,作為一種藝術呈現形式,AI繪畫也將在元宇宙、設計、文旅等行業催生新的商業模式。例如AI繪畫目前在AI輔助創作、短視頻、影視製作和元宇宙等方麵都有布局,因為這些賽道都離不開創意,AI繪畫可以幫助創作者通過簡單的特征輸入,實現對其創意的預覽,甚至可以直接進行創作。
不過,董未名並不諱言,當下AI繪畫仍然存在版權爭議問題。AI繪畫的核心是模型,而訓練模型需要使用大量圖像、文本數據。對於未經授權的圖片,經過運算之後所生成的圖像版權歸屬尚難界定。“有的畫家風格特別明顯,如果用畫家的畫去訓練算法模型生成作品,那最後的版權屬於誰呢?”董未名提出的問題,正是多數AI繪畫作品所麵臨的現實問題。
AI繪畫掀起了一場資本的群體狂歡,希望有一天它能走出“照貓畫虎”的尷尬,真正服務藝術創作、創造更多價值。
- 21-12-30科研人員研發出水麵智能保潔無人子母船係統 搭載動態避
- 21-12-31迄今最輕鎂同位素誕生
- 21-12-31我國瞄準智慧育種4.0時代進發
- 21-12-30研究人員開發出可自修複鈣鈦礦太陽能電池 運行500小
- 21-12-30韋布發射升空 五大天文任務可期
- 21-12-31控製調節性T細胞發育的生化“開關”找到
- 21-12-30氣候變暖影響下,這種動物或將麵臨“性別失調”
- 21-12-30“一不小心”活到200歲 太平洋岩魚的長壽秘訣人類可
- 21-12-31埃及法老木乃伊首次“數字化解封”
- 22-04-20超聲波為水下儀器和人體植入設備充電


