微軟亞洲研究院與首都師大合作開發甲骨文校重助手Div
【環球網科技綜合報道】甲骨文是迄今為止中國發現的年代最早的成熟文字係統,對中國曆史乃至世界文化的發展研究具有非凡意義。因為收藏、流轉的緣故,大部分的甲骨都留下了多張拓本圖像,被稱為“重片”。甲骨重片數量繁多,效果互有參差,對其整理成為了一項重要的基礎性研究工作,稱作“校重”。然而,人工校重隻能一一對照,費時費力,是甲骨文研究的一大痛點。
近期,微軟亞洲研究院主管研究員武智融與首都師範大學甲骨文研究中心莫伯峰教授團隊合作開發甲骨文校重助手Diviner,第一次將自監督 AI 模型引入到甲骨文“校重”工作中,大幅提升了甲骨文校重工作的效率。
這項研究係統窮盡比對了18萬wan幅fu拓tuo本ben,輔fu助zhu甲jia骨gu學xue家jia在zai上shang百bai個ge甲jia骨gu文wen數shu據ju庫ku中zhong發fa現xian了le大da量liang甲jia骨gu重zhong片pian,不bu僅jin複fu現xian了le專zhuan家jia過guo去qu所suo發fa現xian的de數shu萬wan組zu重zhong片pian,而er且qie經jing過guo初chu步bu整zheng理li,已yi發fa現xian了le三san百bai多duo組zu未wei被bei前qian人ren發fa現xian的de校xiao重zhong新xin成cheng果guo,為wei甲jia骨gu文wen整zheng理li領ling域yu開kai創chuang了le人ren工gong智zhi能neng與yu人ren類lei專zhuan家jia協xie作zuo(AI+HI)的全新研究範式。

近兩年,不依賴人工標注數據的自監督學習是 AI 研究的熱門方向,但很多前沿技術仍停留在研究階段。武智融表示,“jinguanzijianduyanjiureduhengao,danshihenduowentizuizhonghaishiyaotongguorengongshujubiaozhulaijiejue。womenyizhixiwangshiyongwanquanwubiaozhudeshujujinxingzijianduxuexi,shenzhishirengonggenbenshangwufabiaozhudeshuju。jiaguwenxiaozhongxuyaoliangliangbiduishibawanzhangshujukuzhongdesuoyoutuopian,zheweijiyuwanquanwubiaozhushujudezijianduxueximoxingyingyongtigongleyigejuejiadeluodichangjing。”
據(ju)介(jie)紹(shao),計(ji)算(suan)兩(liang)張(zhang)拓(tuo)片(pian)的(de)視(shi)覺(jiao)相(xiang)似(si)度(du),通(tong)常(chang)的(de)方(fang)法(fa)會(hui)從(cong)全(quan)局(ju)特(te)征(zheng)出(chu)發(fa)。然(ran)而(er),在(zai)甲(jia)骨(gu)文(wen)的(de)研(yan)究(jiu)中(zhong),即(ji)使(shi)是(shi)重(zhong)片(pian),外(wai)觀(guan)上(shang)也(ye)可(ke)能(neng)有(you)很(hen)大(da)差(cha)異(yi),這(zhe)是(shi)由(you)於(yu)拓(tuo)印(yin)範(fan)圍(wei)、拓印方式、磨(mo)損(sun)等(deng)多(duo)方(fang)麵(mian)原(yuan)因(yin)造(zao)成(cheng)的(de)。考(kao)慮(lv)到(dao)一(yi)塊(kuai)完(wan)整(zheng)的(de)甲(jia)骨(gu)可(ke)能(neng)會(hui)碎(sui)裂(lie)成(cheng)多(duo)片(pian),校(xiao)重(zhong)時(shi)經(jing)常(chang)需(xu)要(yao)從(cong)大(da)骨(gu)片(pian)中(zhong)找(zhao)出(chu)小(xiao)骨(gu)片(pian)。因(yin)此(ci),基(ji)於(yu)全(quan)局(ju)外(wai)觀(guan)表(biao)示(shi)的(de)傳(chuan)統(tong)方(fang)法(fa)並(bing)不(bu)能(neng)很(hen)好(hao)地(di)發(fa)揮(hui)作(zuo)用(yong)。麵(mian)對(dui)這(zhe)一(yi)挑(tiao)戰(zhan),研(yan)究(jiu)員(yuan)想(xiang)到(dao)了(le)甲(jia)骨(gu)拓(tuo)片(pian)的(de)特(te)性(xing),因(yin)其(qi)是(shi)從(cong)同(tong)一(yi)塊(kuai)甲(jia)骨(gu)而(er)來(lai),重(zhong)片(pian)之(zhi)間(jian)存(cun)在(zai)著(zhe)精(jing)確(que)的(de)點(dian)與(yu)點(dian)的(de)對(dui)應(ying)關(guan)係(xi)。基(ji)於(yu)這(zhe)一(yi)特(te)性(xing),校(xiao)重(zhong)助(zhu)手(shou) Diviner 從局部尋找匹配關係,再拓展到全局。
其中,在局部匹配方麵,Diviner 使shi用yong的de局ju部bu描miao述shu符fu是shi經jing過guo自zi監jian督du訓xun練lian的de深shen度du神shen經jing網wang絡luo,模mo型xing應ying用yong了le對dui比bi學xue習xi的de自zi監jian督du技ji術shu,使shi用yong圖tu像xiang增zeng強qiang,讓rang特te征zheng在zai訓xun練lian時shi不bu受shou甲jia骨gu拓tuo片pian上shang清qing晰xi度du、對比度、噪音、旋轉等因素的影響。在甲骨圖像上訓練的局部描述符能夠檢測和匹配局部塊之間的關鍵點,並進行點對點匹配。
隨後在全局優化方麵,基於密集的點與點的匹配結果,通過使用魯棒的優化算法 RANSAC gujiquanjudejihefangshebianhuan,fangshebianhuanyunxumoxingzaineirongzhongfudeqingkuangxiapinhehuopinjieyiyoutuxiang,zhezhongjubudaoquanjudefangfaduijiancedaliangdejiagusuipianzhiguanzhongyao。
值得一提的是,Diviner 模(mo)型(xing)一(yi)個(ge)特(te)點(dian)是(shi)具(ju)有(you)強(qiang)大(da)的(de)泛(fan)化(hua)能(neng)力(li),這(zhe)歸(gui)功(gong)於(yu)其(qi)自(zi)監(jian)督(du)學(xue)習(xi)的(de)匹(pi)配(pei)算(suan)法(fa)。模(mo)型(xing)通(tong)過(guo)圖(tu)像(xiang)增(zeng)強(qiang)技(ji)術(shu)模(mo)擬(ni)同(tong)一(yi)塊(kuai)甲(jia)骨(gu)在(zai)不(bu)同(tong)時(shi)期(qi)製(zhi)作(zuo)成(cheng)拓(tuo)片(pian)或(huo)者(zhe)因(yin)年(nian)深(shen)日(ri)久(jiu)造(zao)成(cheng)的(de)圖(tu)像(xiang)變(bian)化(hua),例(li)如(ru)磨(mo)損(sun)、模糊等。在大規模無標注數據上獲取的密集的自我監督,比稀疏的基於整體的人工監督更有效。
此外,Diviner 模mo型xing另ling一yi個ge特te點dian在zai於yu能neng夠gou精jing確que地di預yu測ce出chu重zhong片pian之zhi間jian點dian對dui點dian的de對dui應ying關guan係xi,並bing將jiang重zhong片pian拚pin合he或huo拚pin接jie在zai一yi起qi。這zhe種zhong可ke以yi被bei專zhuan家jia快kuai速su解jie讀du的de結jie果guo大da大da方fang便bian了le人ren類lei與yu人ren工gong智zhi能neng的de協xie同tong合he作zuo。對dui於yu甲jia骨gu文wen這zhe樣yang的de科ke學xue,人ren機ji合he作zuo尤you為wei重zhong要yao。在zai校xiao重zhong結jie果guo中zhong,專zhuan家jia可ke以yi看kan到dao局ju部bu匹pi配pei細xi節jie和he重zhong疊die圖tu,極ji大da地di幫bang助zhu並bing加jia速su了le他ta們men驗yan證zheng的de過guo程cheng。
針對該項研究,莫伯峰表示,“jiaguxueshiyigexitongxingdekexue,yifangmiantashiyizhongyuyanwenziyanjiuziliao,lingyifangmiantashiyizhonglishiyanjiuziliao,qiyanjiushejifangfangmianmian,yanjiuzhexuyaolejiewenzizaigudaidexing、音、yidengdeng,yinciwomenjiejueyigewentiyeyaocongbutongweidutantao。ciciyuweiruanyazhouyanjiuyuandehezuozhishijiaguwenherengongzhinengjiaochayanjiudeyigexiaoxumu,tuikailejiaguxueyanjiudeyishanxindamen,weihouxudeyanjiuqidaoleshifanzuoyong。weilai,rengongzhinengyuguwenziyanjiudejiehejiangjuyougengguangkuodeqianjing。”
武智融表示,“我們很高興看到人工智能模型 Diviner 能neng夠gou為wei甲jia骨gu學xue專zhuan家jia節jie省sheng用yong於yu甲jia骨gu文wen數shu據ju整zheng理li的de時shi間jian,讓rang他ta們men更geng專zhuan注zhu於yu其qi他ta方fang麵mian的de研yan究jiu。甲jia骨gu文wen是shi兼jian具ju象xiang形xing圖tu像xiang屬shu性xing和he文wen字zi屬shu性xing的de神shen秘mi語yu言yan,多duo模mo態tai的de人ren工gong智zhi能neng在zai甲jia骨gu文wen研yan究jiu上shang有you著zhe廣guang闊kuo天tian地di。未wei來lai,我wo們men希xi望wang能neng夠gou與yu甲jia骨gu文wen專zhuan家jia一yi起qi探tan索suo更geng多duo有you趣qu的de課ke題ti。”
- 21-12-30科研人員研發出水麵智能保潔無人子母船係統 搭載動態避
- 21-12-31迄今最輕鎂同位素誕生
- 21-12-31我國瞄準智慧育種4.0時代進發
- 21-12-30研究人員開發出可自修複鈣鈦礦太陽能電池 運行500小
- 21-12-30韋布發射升空 五大天文任務可期
- 21-12-31控製調節性T細胞發育的生化“開關”找到
- 21-12-30氣候變暖影響下,這種動物或將麵臨“性別失調”
- 21-12-30“一不小心”活到200歲 太平洋岩魚的長壽秘訣人類可
- 21-12-31埃及法老木乃伊首次“數字化解封”
- 22-04-20超聲波為水下儀器和人體植入設備充電


