俄科學(xué)家用人工智能破譯古代典籍
【環(huán)球時報綜合報道】俄羅斯科學(xué)院西伯利亞分院蒙古學(xué)、佛學(xué)和藏學(xué)研究所收藏有藏文和蒙文古文獻十余萬冊,稱得上是古代智慧寶庫,但其中只有一小部分文字被翻譯成俄文。目前,該研究所東方手寫文獻和刻本研究中心的科學(xué)家已開始破譯這些古代典籍,他們使用了人工智能系統(tǒng)。
本文引用地址:http://www.ex-cimer.com/article/202209/438373.htm教人工智能系統(tǒng)“閱讀”
“目前,我們正教人工智能系統(tǒng)閱讀藏文”,該研究所所長巴扎羅夫(Boris Bazarov)院士介紹說,“為此掃描了500頁手稿和刻本(木刻板印刷古代書籍),然后通過使用將藏文轉(zhuǎn)換為拉丁字母的威利(Wylie)系統(tǒng)手動輸入拉丁字母?!边@500頁文獻成為神經(jīng)網(wǎng)絡(luò)“教材”,程序員教神經(jīng)網(wǎng)絡(luò)記住圖像并將其與隨附文本相關(guān)聯(lián)。培訓(xùn)只用了2個小時,神經(jīng)網(wǎng)絡(luò)就通過了考試,已能以94%的準確率識別藏文。不過,科學(xué)家們并不滿足于此。
“藏文文字特點在于音節(jié)文字,而非字母”,東方手寫文獻研究中心主任林奇諾夫(Oleg Rinchinov)說,“刻本與其他文獻的不同之處在于多相性——有的地方刻得比較清晰,有的地方刻得比較模糊。而且,這些文獻還受到歲月蠶食。目前,還沒有達到文本識別的最高準確率?!笨茖W(xué)家認為,可將準確率提高到99%,但每提高一個百分點都需要大量細致的工作,例如要將準確率提高到95%,需要多用上千個示例“教”神經(jīng)網(wǎng)絡(luò),準確率從95%提高到96%則需要用上萬個示例。因此,該項目至少延長了5年。相比之下,一個藏學(xué)家翻譯一部作品需要3年到10年。
古代智慧寶庫前景廣闊
“這是世界上首次嘗試解譯藏文”,巴扎羅夫院士介紹說,“翻譯典章和醫(yī)學(xué)文獻等可以更充分地了解古代知識,而且使大量材料得以通用。盡管該項目延期,但我們的所有努力都是為了提高文本識別的準確性。之后,我們借助神經(jīng)網(wǎng)絡(luò)就能輕松地將原始文獻翻譯成其他語言了?!?/p>
俄羅斯科學(xué)院院長謝爾蓋耶夫(Alexandr Sergeev)和俄羅斯科學(xué)院西伯利亞分院院長帕爾蒙(Valentin Parmon)不僅從文化角度,還從實踐角度對古代智慧寶庫的前景予以高度評價,他們認為,醫(yī)學(xué)書籍中的處方可用來制作生物活性添加劑,還可以制藥,這對在布里亞特共和國建立生物醫(yī)學(xué)產(chǎn)業(yè)集群尤其具有現(xiàn)實意義。
中國藥學(xué)家的啟示
“2015年中國藥學(xué)家屠呦呦因發(fā)現(xiàn)治療瘧疾的新藥獲得諾貝爾獎。這種藥是從青蒿中提取的,可以有效降低瘧疾患者的死亡率”,巴扎羅夫舉了一個現(xiàn)代人使用古代知識的鮮活例子,“藏族智慧還包含多少造福人類的發(fā)明?我們很快就會知道。我們發(fā)明這個算法,實現(xiàn)系統(tǒng)工作穩(wěn)定后,一定會開始破譯古蒙古文文獻。我相信,我們在這方面也會取得科學(xué)突破?!彼f。
俄羅斯科學(xué)院西伯利亞分院蒙古學(xué)、佛學(xué)和藏學(xué)研究所收藏的古代藏文和蒙古文典籍、檔案文件、音頻、照片和視頻屬全球最大規(guī)模之一。這些稀有珍品收集了上百年。藏品中有十多萬冊藏文典籍和7000冊古蒙古文文獻,包括哲學(xué)、醫(yī)學(xué)和宗教文學(xué)。最古老的文獻可以追溯到16世紀。這些珍品中有約170部獨立醫(yī)學(xué)著作,涉及冥想方法、針刺療法、外科手術(shù)和藥理學(xué),其中只有10%被譯成了俄語。
評論