AI賦能影像技術,讓修圖小白秒變大師
近日,計算機視覺頂級會議CVPR 2022公布了會議錄取結果,美圖影像研究院(MT Lab)與北京航空航天大學可樂實驗室聯合發表的論文被接收。該論文突破性地提出分布感知式單階段模型(DAS),用於解決極具挑戰性的多人3D人體姿態估計問題。該方法通過一次網絡前向推理同時獲取3D空kong間jian中zhong人ren體ti位wei置zhi信xin息xi以yi及ji相xiang對dui應ying的de關guan鍵jian點dian信xin息xi,從cong而er簡jian化hua了le預yu測ce流liu程cheng,提ti高gao了le效xiao率lv。此ci外wai,該gai方fang法fa有you效xiao地di學xue習xi了le人ren體ti關guan鍵jian點dian的de真zhen實shi分fen布bu,進jin而er提ti升sheng了le基ji於yu回hui歸gui框kuang架jia的de多duo人ren3D人體姿態估計方法的精度。
實際上,這隻是美圖利用人工智能為影像技術賦能的冰山一角。早在2010年,美圖就成立了核心研發部門——美圖影像研究院,該研究院致力於計算機視覺、機器學習、增強現實等人工智能(AI)相關領域的研發,在人臉技術、人體技術、圖像分割、圖像識別、圖像生成、圖像增強等方麵處於領先水平,為美圖現有和未來的產品提供核心算法支持,並通過前沿技術推動美圖產品發展,曾先後多次參與CVPR、ICCV、ECCV等計算機視覺國際頂級會議,並斬獲冠亞軍10餘項,被稱為美圖的“技術中樞”。
高效精準獲取多人3D人體姿態估計結果
計算機視覺中的經典技術——多人3D人體姿態估計在AR/VR、遊戲、運動分析、虛擬試衣等領域具有廣泛的應用潛力,近年來隨著元宇宙概念的興起,更是讓這一技術備受關注。
目前,通常采用兩階段方法來解決多人3D人體姿態估計的問題:自頂向下方法,即先檢測圖片多個人體的位置,之後對檢測到的每個人使用單人3D姿態估計模型來分別預測其姿態;自底向上方法,即先檢測圖片中所有人的3D關鍵點,之後通過相關性將這些關鍵點分配給對應的人體。
jinguanliangjieduanfangfaqudelelianghaodejingdu,danshixuyaotongguorongyudejisuanhefuzadehouchulilaishunxuxingdihuoqurentiweizhixinxiheguanjiandianweizhixinxi,qisulvtongchangnanyimanzushijichangjingxuqiu,yinciduoren3D姿態估計算法流程亟須簡化。
為了克服兩階段方法存在的問題,該論文提出了一種分布感知式單階段模型用於解決基於單張圖片的多人3D人體姿態估計問題。另外,DAS在優化過程中對3D關鍵點的分布進行學習,這為3D關鍵點的回歸提供了極具價值的指導性信息,從而有效地提升了預測精度。
此外,為了緩解關鍵點分布估計的難度,DAS采用了一種迭代更新策略以逐步逼近真實分布目標,通過這樣一種方式,DAS可以高效且精準地從單目RGB圖片中一次性獲取多個人的3D人體姿態估計結果。
與(yu)已(yi)有(you)的(de)兩(liang)階(jie)段(duan)方(fang)法(fa)相(xiang)比(bi),該(gai)模(mo)型(xing)可(ke)以(yi)通(tong)過(guo)一(yi)次(ci)網(wang)絡(luo)前(qian)向(xiang)推(tui)理(li)同(tong)時(shi)獲(huo)取(qu)人(ren)體(ti)位(wei)置(zhi)信(xin)息(xi)以(yi)及(ji)所(suo)對(dui)應(ying)的(de)人(ren)體(ti)關(guan)鍵(jian)點(dian)位(wei)置(zhi)信(xin)息(xi),從(cong)而(er)有(you)效(xiao)地(di)簡(jian)化(hua)預(yu)測(ce)流(liu)程(cheng),克(ke)服(fu)了(le)已(yi)有(you)方(fang)法(fa)在(zai)高(gao)計(ji)算(suan)成(cheng)本(ben)和(he)高(gao)模(mo)型(xing)複(fu)雜(za)度(du)方(fang)麵(mian)的(de)弊(bi)端(duan)。另(ling)外(wai),該(gai)方(fang)法(fa)成(cheng)功(gong)將(jiang)標(biao)準(zhun)化(hua)流(liu)引(yin)進(jin)到(dao)多(duo)人(ren)3D人(ren)體(ti)姿(zi)態(tai)估(gu)計(ji)任(ren)務(wu)中(zhong),以(yi)在(zai)訓(xun)練(lian)過(guo)程(cheng)中(zhong)學(xue)習(xi)人(ren)體(ti)關(guan)鍵(jian)點(dian)分(fen)布(bu),並(bing)提(ti)出(chu)迭(die)代(dai)回(hui)歸(gui)策(ce)略(lve)緩(huan)解(jie)分(fen)布(bu)學(xue)習(xi)難(nan)度(du),來(lai)達(da)到(dao)逐(zhu)步(bu)逼(bi)近(jin)目(mu)標(biao)的(de)目(mu)的(de)。通(tong)過(guo)該(gai)模(mo)型(xing)可(ke)以(yi)獲(huo)取(qu)數(shu)據(ju)的(de)真(zhen)實(shi)分(fen)布(bu),有(you)效(xiao)地(di)提(ti)升(sheng)模(mo)型(xing)的(de)回(hui)歸(gui)預(yu)測(ce)精(jing)度(du)。
人工智能技術大大提升攝影修圖效率
對人臉皮膚進行精細化的瑕疵修複與暗沉祛除,一鍵入“齒”修複牙齒上的瑕疵,照片上模糊的容顏清晰重現,全身美型告別大粗腿、水桶腰……AI技術正讓修圖小白秒變大師。
一家商業攝影機構的業務流程基本包括:營銷獲客、攝影服務、後期處理、成品製作等環節。其中,後期修圖是商業攝影工作流程中占比高、耗時長、工作量大的一個環節。
在旺季或者拍攝任務激增時,從拍攝到出片的周期甚至長達1個月左右。尤其是在人像處理部分,非常考驗修圖師的專業功底,而一名合格修圖師的培養需要耗費高昂的人力、物力成本,還需要麵臨人員頻繁流動的風險。
美圖創始人兼首席執行官吳欣鴻在接受科技日報記者采訪時表示,據不完全統計,商業攝影1年修圖可達120億張,大量繁雜的重複性勞動以及較高的技術門檻,給商業影樓帶來巨大的成本壓力。借助AI技ji術shu完wan成cheng重zhong複fu繁fan雜za的de後hou期qi初chu修xiu工gong作zuo,不bu僅jin能neng夠gou提ti升sheng商shang業ye攝she影ying後hou期qi的de修xiu圖tu效xiao率lv,同tong時shi也ye為wei商shang業ye攝she影ying行xing業ye提ti供gong了le深shen度du融rong合he美mei學xue藝yi術shu的de專zhuan業ye級ji圖tu像xiang處chu理li服fu務wu。
由美圖技術大腦——美(mei)圖(tu)影(ying)像(xiang)研(yan)究(jiu)院(yuan)自(zi)主(zhu)研(yan)發(fa)的(de)美(mei)圖(tu)雲(yun)修(xiu),通(tong)過(guo)智(zhi)能(neng)預(yu)設(she)功(gong)能(neng),一(yi)鍵(jian)即(ji)可(ke)完(wan)成(cheng)對(dui)照(zhao)片(pian)的(de)批(pi)量(liang)處(chu)理(li)。其(qi)中(zhong),臉(lian)部(bu)優(you)化(hua)功(gong)能(neng)可(ke)以(yi)修(xiu)複(fu)麵(mian)部(bu)瑕(xia)疵(ci),打(da)造(zao)細(xi)膩(ni)肌(ji)膚(fu);妝容調整功能可實現對妝容的智能調節。此外,美圖雲修還能夠完成塑造立體的麵部五官、分區域實現全身美型、美化身體肌膚等80餘項修圖工作。同時,靈活自由的參數自定義也滿足了用戶對修圖更專業的需求。
“美圖雲修還提供濾鏡特效、牙齒修複、祛雙下巴、勻膚、縮頭、一鍵仿妝、背景增強、多人全身美型等獨特功能,可以幫助影樓快速完成約80%的精修工作。”美圖技術副總裁、美圖影像研究院負責人劉洛麒表示。
我國影像軟件技術攜手AI大步向前
今年3月30日,美圖披露2021年全年業績報告。報告顯示,2021年美圖研發投入達5.455億元,同比2020年增長35%。
隨(sui)著(zhe)中(zhong)國(guo)影(ying)像(xiang)軟(ruan)件(jian)產(chan)業(ye)對(dui)技(ji)術(shu)研(yan)發(fa)投(tou)入(ru)的(de)不(bu)斷(duan)加(jia)大(da),近(jin)年(nian)來(lai)中(zhong)國(guo)影(ying)像(xiang)軟(ruan)件(jian)在(zai)技(ji)術(shu)能(neng)力(li)方(fang)麵(mian)有(you)了(le)很(hen)大(da)的(de)進(jin)展(zhan),有(you)些(xie)已(yi)經(jing)不(bu)輸(shu)國(guo)外(wai)同(tong)類(lei)產(chan)品(pin)。
“我們推出的視頻美顏App——Wink,它的視頻人像美化功能需要將人像美顏從圖像擴展到視頻維度,這就需要實時的人臉檢測跟蹤、分割、3D建模等技術與人像美顏算法進行有機結合,同時還要應對視頻抖動、大側臉等極端情況,才能為用戶提供滿意的結果。”劉洛麒說。
“用戶拍攝的照片或視頻存在清晰度低、畫質差、產chan生sheng噪zao點dian等deng問wen題ti,我wo們men利li用yong基ji於yu深shen度du學xue習xi的de畫hua質zhi增zeng強qiang技ji術shu能neng夠gou提ti高gao用yong戶hu照zhao片pian與yu視shi頻pin的de質zhi量liang,滿man足zu他ta們men的de拍pai攝she需xu求qiu。同tong時shi,我wo們men也ye將jiang深shen度du學xue習xi應ying用yong到dao人ren像xiang美mei顏yan中zhong,例li如ru我wo們men自zi主zhu研yan發fa的deAI勻膚技術,既能祛除臉部瑕疵,同時也保留了細膩的皮膚紋理質感。”吳欣鴻說。
“我們基於AI研發的人體美型技術,不是簡單地對人體進行拉伸,而是先結合人體3D重建、人體分割等技術去建立人體的三維模型,再利用深度學習算法學習美化之後的人體模型形變,同時對背景的Mesh(網格)進行建模,從而緩解背景的變形扭曲,最終實現用戶滿意的人體美型效果。”劉洛麒指出。
此ci外wai,美mei圖tu證zheng件jian照zhao應ying用yong到dao的de人ren像xiang摳kou圖tu技ji術shu,可ke以yi實shi現xian發fa絲si級ji的de精jing細xi摳kou圖tu,完wan成cheng對dui證zheng件jian照zhao人ren像xiang的de一yi鍵jian換huan裝zhuang,同tong時shi保bao持chi人ren像xiang和he背bei景jing的de光guang線xian和he諧xie性xing。而er基ji於yuAI生成的增發技術,可以調整發際線,可以改變發色和發型,還能使頭發顯得更蓬鬆。
未來,人工智能將如何賦能影像技術?對此,吳欣鴻表示,一方麵,基於人工智能的影像技術,將與各行各業有更多、更深入的結合,這也對影像技術提出了更高的要求。另一方麵,通過3D技術和AR技術等,為用戶提供沉浸式和可交互的虛擬化體驗也是未來影像技術發展的熱門方向。
- 21-12-30科研人員研發出水麵智能保潔無人子母船係統 搭載動態避
- 21-12-31迄今最輕鎂同位素誕生
- 21-12-31我國瞄準智慧育種4.0時代進發
- 21-12-30研究人員開發出可自修複鈣鈦礦太陽能電池 運行500小
- 21-12-30韋布發射升空 五大天文任務可期
- 21-12-31控製調節性T細胞發育的生化“開關”找到
- 21-12-30氣候變暖影響下,這種動物或將麵臨“性別失調”
- 21-12-30“一不小心”活到200歲 太平洋岩魚的長壽秘訣人類可
- 21-12-31埃及法老木乃伊首次“數字化解封”
- 22-04-20超聲波為水下儀器和人體植入設備充電


