快訊

台灣超額死亡世界次低? 學者:不應忽略任何死亡

150萬字形免費下載! 東亞最大規模文字圖像資料庫啟用

中研院歷史語言研究所與數位文化中心自2019年起開發「簡牘字典—史語所藏居延漢簡資料庫」,今年進一步與日本五大學研機構合作建置東亞規模最大的「歷史文字資料庫統合檢索系統」,今天正式啟用。截圖自中研院
中研院歷史語言研究所與數位文化中心自2019年起開發「簡牘字典—史語所藏居延漢簡資料庫」,今年進一步與日本五大學研機構合作建置東亞規模最大的「歷史文字資料庫統合檢索系統」,今天正式啟用。截圖自中研院

中研院歷史語言研究所與數位文化中心自2019年起開發「簡牘字典—史語所藏居延漢簡資料庫」,今年進一步與日本五大學研機構合作建置東亞規模最大的「歷史文字資料庫統合檢索系統」,今天正式啟用。

透過單一入口網即可跨國、跨機構檢索橫跨千年的高畫質歷史文字圖像。中研院表示,目前整合的5個資料庫約有150萬件高解析度文字圖像,均依創用CC條款釋出,且可免費下載,進行加值利用。

中研院表示,「歷史文字資料庫統合檢索系統」由史語所、數位文化中心與奈良文化財研究所、東京大學史料編纂所、國文學研究資料館、國立國語研究所、京都大學人文科學研究所等日本學研機構合作建置,整合源自中國與日本的簡牘與紙本、文書與典籍、抄本與刻本等紀元前至19世紀的文字圖像數位資源。

近年開放資料概念的標準化影響數位典藏的發展,中研院指出,史語所在1990年代開始進行簡牘影像及釋文數位化工作,2002年起參與數位典藏國家型科技計畫。為探究以簡牘為主題的開放性資料庫架構,2019年起,史語所與數位文化中心導入IIIF規範,結合鏈結開放資料(Linked Open Data, LOD)等技術,開發「簡牘字典—史語所藏居延漢簡資料庫」,不僅發展出強大的圖像縮放瀏覽、提取單字字形、圖像比較、標註功能,改善簡牘研究的工具,更建構史語所藏漢簡圖像、後設資料的開放共享環境,更成為此次跨國合作「歷史文字資料庫統合檢索系統」的重要基礎。

跨資料庫搜尋則有賴使用相同的語法規範。數位文化中心陳淑君執行秘書表示,此次與日本學研機構共同確立了文字圖像數位資源共享與流通的體制,並議定一致的國際圖像互通架構(International Image Interoperability Framework, IIIF)規範,以供多方共同遵循,如此一來,便可從彼此的資料庫中檢索出指定的單字圖像。

計畫主持人、中研院史語所助研究員劉欣寧表示,此檢索系統是文字圖像典藏機構間首次創新合作模式,這次系統的公開上線只是起點,未來將持續號召其他典藏機構加入,並嘗試深化技術。期許在文字圖像資源共享的理念下,突破時空的限制,重現東亞漢字文化圈的源流與歷史脈絡。

延伸閱讀

國影中心一期明年2月完工 蘇貞昌:二期經費中央全出

國影中心一期110年2月完工 二期經費中央負擔

台南文化中心E5立體停車場動土 未來供498停車格

中研院區開放活動夯 報名網站塞爆暫時關閉

相關新聞

趁暑假投資自己!從重要性、急迫性歸納4大閱讀清單 念書工作都實用

你會不會有這樣的困擾?明明很想進行閱讀計畫,看到專家列出琳琅滿目的書單之後,依然猶如大海撈針似的,不知該如何下手。然後,又把閱讀的念頭擱著,擱著擱著,一個月過去了,兩個月過去了,我們的閱讀行動還是無法劍及履及

烏克蘭史緊急再版 作者:天真過度依賴某個國家不可取

俄羅斯入侵烏克蘭,三民書局2006年出版的「烏克蘭史」銷售一空、緊急再版。作者王承宗在新版的序中表示,從國際社會視角看,...

疫情助攻、電子書借閱成長2倍 年度讀者最愛這2本書

疫情讓「電子書」成為新的閱讀風潮,國家圖書館今天公布數據,去年全國電子書借閱冊數高達806萬冊,較前年大幅成長122.0...

華語文檢測考題太難? 網友崩潰:難道我不是台灣人

許多人會去考英語檢測來增加工作能力,但如果華語文能力檢測題目看不懂,可能會讓許多台灣人疑惑自己的中文是否「退步了」,日前一名網友表示,他讀完題目後,「懷疑自己不是台灣人,因為完全看不懂題目要表達什麼」。

疫後宅經濟正夯 金融系教授教投資理財

疫後宅經濟發酵,高雄私立正修科技大學金融系副教授李顯儀說,想賺錢,除了靠工作所得、繼承遺產及接受贈與,疫情之後創造財富的...

國際小學堂/俄S-400反飛彈系統 4大強項究竟多厲害?

印度總理莫迪六日與來訪的俄國總統普亭舉行高峰會,雙方同意加強在經貿、能源和防務等領域的雙邊合作。會後印度證實,俄國本月開...

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。