微軟亞洲研究院與首都師大合作開發甲骨文校重助手Div
【環球網科技綜合報道】甲骨文是迄今為止中國發現的年代最早的成熟文字係統,對中國曆史乃至世界文化的發展研究具有非凡意義。因為收藏、流轉的緣故,大部分的甲骨都留下了多張拓本圖像,被稱為“重片”。甲骨重片數量繁多,效果互有參差,對其整理成為了一項重要的基礎性研究工作,稱作“校重”。然而,人工校重隻能一一對照,費時費力,是甲骨文研究的一大痛點。
近期,微軟亞洲研究院主管研究員武智融與首都師範大學甲骨文研究中心莫伯峰教授團隊合作開發甲骨文校重助手Diviner,第一次將自監督 AI 模型引入到甲骨文“校重”工作中,大幅提升了甲骨文校重工作的效率。
這項研究係統窮盡比對了18萬wan幅fu拓tuo本ben,輔fu助zhu甲jia骨gu學xue家jia在zai上shang百bai個ge甲jia骨gu文wen數shu據ju庫ku中zhong發fa現xian了le大da量liang甲jia骨gu重zhong片pian,不bu僅jin複fu現xian了le專zhuan家jia過guo去qu所suo發fa現xian的de數shu萬wan組zu重zhong片pian,而er且qie經jing過guo初chu步bu整zheng理li,已yi發fa現xian了le三san百bai多duo組zu未wei被bei前qian人ren發fa現xian的de校xiao重zhong新xin成cheng果guo,為wei甲jia骨gu文wen整zheng理li領ling域yu開kai創chuang了le人ren工gong智zhi能neng與yu人ren類lei專zhuan家jia協xie作zuo(AI+HI)的全新研究範式。

近兩年,不依賴人工標注數據的自監督學習是 AI 研究的熱門方向,但很多前沿技術仍停留在研究階段。武智融表示,“盡jin管guan自zi監jian督du研yan究jiu熱re度du很hen高gao,但dan是shi很hen多duo問wen題ti最zui終zhong還hai是shi要yao通tong過guo人ren工gong數shu據ju標biao注zhu來lai解jie決jue。我wo們men一yi直zhi希xi望wang使shi用yong完wan全quan無wu標biao注zhu的de數shu據ju進jin行xing自zi監jian督du學xue習xi,甚shen至zhi是shi人ren工gong根gen本ben上shang無wu法fa標biao注zhu的de數shu據ju。甲jia骨gu文wen校xiao重zhong需xu要yao兩liang兩liang比bi對dui十shi八ba萬wan張zhang數shu據ju庫ku中zhong的de所suo有you拓tuo片pian,這zhe為wei基ji於yu完wan全quan無wu標biao注zhu數shu據ju的de自zi監jian督du學xue習xi模mo型xing應ying用yong提ti供gong了le一yi個ge絕jue佳jia的de落luo地di場chang景jing。”
據(ju)介(jie)紹(shao),計(ji)算(suan)兩(liang)張(zhang)拓(tuo)片(pian)的(de)視(shi)覺(jiao)相(xiang)似(si)度(du),通(tong)常(chang)的(de)方(fang)法(fa)會(hui)從(cong)全(quan)局(ju)特(te)征(zheng)出(chu)發(fa)。然(ran)而(er),在(zai)甲(jia)骨(gu)文(wen)的(de)研(yan)究(jiu)中(zhong),即(ji)使(shi)是(shi)重(zhong)片(pian),外(wai)觀(guan)上(shang)也(ye)可(ke)能(neng)有(you)很(hen)大(da)差(cha)異(yi),這(zhe)是(shi)由(you)於(yu)拓(tuo)印(yin)範(fan)圍(wei)、拓印方式、mosundengduofangmianyuanyinzaochengde。kaolvdaoyikuaiwanzhengdejiagukenenghuisuiliechengduopian,xiaozhongshijingchangxuyaocongdagupianzhongzhaochuxiaogupian。yinci,jiyuquanjuwaiguanbiaoshidechuantongfangfabingbunenghenhaodifahuizuoyong。mianduizheyitiaozhan,yanjiuyuanxiangdaolejiagutuopiandetexing,yinqishicongtongyikuaijiaguerlai,zhongpianzhijiancunzaizhejingquededianyudiandeduiyingguanxi。jiyuzheyitexing,xiaozhongzhushou Diviner 從局部尋找匹配關係,再拓展到全局。
其中,在局部匹配方麵,Diviner shiyongdejubumiaoshufushijingguozijianduxunliandeshendushenjingwangluo,moxingyingyongleduibixuexidezijiandujishu,shiyongtuxiangzengqiang,rangtezhengzaixunlianshibushoujiagutuopianshangqingxidu、對比度、噪音、旋轉等因素的影響。在甲骨圖像上訓練的局部描述符能夠檢測和匹配局部塊之間的關鍵點,並進行點對點匹配。
隨後在全局優化方麵,基於密集的點與點的匹配結果,通過使用魯棒的優化算法 RANSAC gujiquanjudejihefangshebianhuan,fangshebianhuanyunxumoxingzaineirongzhongfudeqingkuangxiapinhehuopinjieyiyoutuxiang,zhezhongjubudaoquanjudefangfaduijiancedaliangdejiagusuipianzhiguanzhongyao。
值得一提的是,Diviner 模mo型xing一yi個ge特te點dian是shi具ju有you強qiang大da的de泛fan化hua能neng力li,這zhe歸gui功gong於yu其qi自zi監jian督du學xue習xi的de匹pi配pei算suan法fa。模mo型xing通tong過guo圖tu像xiang增zeng強qiang技ji術shu模mo擬ni同tong一yi塊kuai甲jia骨gu在zai不bu同tong時shi期qi製zhi作zuo成cheng拓tuo片pian或huo者zhe因yin年nian深shen日ri久jiu造zao成cheng的de圖tu像xiang變bian化hua,例li如ru磨mo損sun、模糊等。在大規模無標注數據上獲取的密集的自我監督,比稀疏的基於整體的人工監督更有效。
此外,Diviner 模mo型xing另ling一yi個ge特te點dian在zai於yu能neng夠gou精jing確que地di預yu測ce出chu重zhong片pian之zhi間jian點dian對dui點dian的de對dui應ying關guan係xi,並bing將jiang重zhong片pian拚pin合he或huo拚pin接jie在zai一yi起qi。這zhe種zhong可ke以yi被bei專zhuan家jia快kuai速su解jie讀du的de結jie果guo大da大da方fang便bian了le人ren類lei與yu人ren工gong智zhi能neng的de協xie同tong合he作zuo。對dui於yu甲jia骨gu文wen這zhe樣yang的de科ke學xue,人ren機ji合he作zuo尤you為wei重zhong要yao。在zai校xiao重zhong結jie果guo中zhong,專zhuan家jia可ke以yi看kan到dao局ju部bu匹pi配pei細xi節jie和he重zhong疊die圖tu,極ji大da地di幫bang助zhu並bing加jia速su了le他ta們men驗yan證zheng的de過guo程cheng。
針對該項研究,莫伯峰表示,“甲(jia)骨(gu)學(xue)是(shi)一(yi)個(ge)係(xi)統(tong)性(xing)的(de)科(ke)學(xue),一(yi)方(fang)麵(mian)它(ta)是(shi)一(yi)種(zhong)語(yu)言(yan)文(wen)字(zi)研(yan)究(jiu)資(zi)料(liao),另(ling)一(yi)方(fang)麵(mian)它(ta)是(shi)一(yi)種(zhong)曆(li)史(shi)研(yan)究(jiu)資(zi)料(liao),其(qi)研(yan)究(jiu)涉(she)及(ji)方(fang)方(fang)麵(mian)麵(mian),研(yan)究(jiu)者(zhe)需(xu)要(yao)了(le)解(jie)文(wen)字(zi)在(zai)古(gu)代(dai)的(de)形(xing)、音、義yi等deng等deng,因yin此ci我wo們men解jie決jue一yi個ge問wen題ti也ye要yao從cong不bu同tong維wei度du探tan討tao。此ci次ci與yu微wei軟ruan亞ya洲zhou研yan究jiu院yuan的de合he作zuo隻zhi是shi甲jia骨gu文wen和he人ren工gong智zhi能neng交jiao叉cha研yan究jiu的de一yi個ge小xiao序xu幕mu,推tui開kai了le甲jia骨gu學xue研yan究jiu的de一yi扇shan新xin大da門men,為wei後hou續xu的de研yan究jiu起qi到dao了le示shi範fan作zuo用yong。未wei來lai,人ren工gong智zhi能neng與yu古gu文wen字zi研yan究jiu的de結jie合he將jiang具ju有you更geng廣guang闊kuo的de前qian景jing。”
武智融表示,“我們很高興看到人工智能模型 Diviner 能(neng)夠(gou)為(wei)甲(jia)骨(gu)學(xue)專(zhuan)家(jia)節(jie)省(sheng)用(yong)於(yu)甲(jia)骨(gu)文(wen)數(shu)據(ju)整(zheng)理(li)的(de)時(shi)間(jian),讓(rang)他(ta)們(men)更(geng)專(zhuan)注(zhu)於(yu)其(qi)他(ta)方(fang)麵(mian)的(de)研(yan)究(jiu)。甲(jia)骨(gu)文(wen)是(shi)兼(jian)具(ju)象(xiang)形(xing)圖(tu)像(xiang)屬(shu)性(xing)和(he)文(wen)字(zi)屬(shu)性(xing)的(de)神(shen)秘(mi)語(yu)言(yan),多(duo)模(mo)態(tai)的(de)人(ren)工(gong)智(zhi)能(neng)在(zai)甲(jia)骨(gu)文(wen)研(yan)究(jiu)上(shang)有(you)著(zhe)廣(guang)闊(kuo)天(tian)地(di)。未(wei)來(lai),我(wo)們(men)希(xi)望(wang)能(neng)夠(gou)與(yu)甲(jia)骨(gu)文(wen)專(zhuan)家(jia)一(yi)起(qi)探(tan)索(suo)更(geng)多(duo)有(you)趣(qu)的(de)課(ke)題(ti)。”
- 21-12-30科研人員研發出水麵智能保潔無人子母船係統 搭載動態避
- 21-12-31迄今最輕鎂同位素誕生
- 21-12-31我國瞄準智慧育種4.0時代進發
- 21-12-30研究人員開發出可自修複鈣鈦礦太陽能電池 運行500小
- 21-12-30韋布發射升空 五大天文任務可期
- 21-12-31控製調節性T細胞發育的生化“開關”找到
- 21-12-30氣候變暖影響下,這種動物或將麵臨“性別失調”
- 21-12-30“一不小心”活到200歲 太平洋岩魚的長壽秘訣人類可
- 21-12-31埃及法老木乃伊首次“數字化解封”
- 22-04-20超聲波為水下儀器和人體植入設備充電


