編者:項潔
作者:項潔、翁稷安、涂豐恩、杜協昌、陳詩沛、何浩洋、金觀濤、劉青峰、王昱鈞、蔡宗翰、謝育平、闕河嘉、呂宜華、蘇冠銘、Kihwang Lee, Jae Yun Lee、楊森豪、賴進貴
年份:2011
出版:臺北市:大學出版中心出版
主題:人文學、文獻數位化、數位科技
關鍵字:數位人文、數位人文理論基礎、數位工具、語料庫、語言學輔助方法分析、量化分析、地圖繪製、同位詞、詞夾子、命名實體、詞彙萃取、文字探勘、再現、鄉村意象、鄉村性、語料庫語言學、詞頻分析、韓文、食譜、網路分析
內容介紹:
收錄第二屆「數位典藏與數位人文國際研討會」18篇中的前9篇精選論文。本書內容分為「導論」、「基本概念」、「工具的進步」、「現象的探索」部分。
「導論」:
數位人文相關研究發展可分為三個時期(摸索期(1949-)、整合期(1970-1985)、進階期(2000-))。在歷經半世紀的淬鍊已廣泛受到重視。現階段進行中的研究或許看似各自獨立,但為得到一定發展空間,並在其他領域可能提出的質疑和挑戰下找到立足點和平衡點,實際上,彼此都試圖尋找專屬於數位人文在理論、方法、應用上共有的研究優勢與適用規範。導論中也將本書收錄的文章,分別以知識論的角度看數位人文、數位時代系統建置的新概念、嘗試開發新研究議題三個面向進行概述。
「基本概念」:
〈當資訊科技碰到史料〉以臺灣歷史數位圖書館(THDL)全文資料庫為研究案例的對象,試圖從資料庫建置者的角度理解研究型資料庫除具備檢索功能外,是否能研發出讓使用者可更進一步觀察史料的功能,並且也兼具解決尚未解決的老問題和尚未發現的新問題。
〈數位人文研究的理論基礎〉以理論的角度解析人文學科與自然學科本質的不同,和說明如何達到歷史研究的客觀性,並引用西方哲學論述說明文本分析與研究歷史真實性之間的關係等。作者也從找尋中國現代觀念史形成的研究而建置的數據庫實證經驗中發現到,透過關鍵詞的歷史語義分析,不僅僅只是重構中國現代觀念起源和演變,範圍的深度及廣度從這個分析中已觸及到觀察世界變動的可能性,而這是原先沒有預期的結果。
〈觀念史研究與數據庫的建立和應用〉接續前一篇說明數據庫建置的概念和過程,以及數位分析對人文研究的重大貢獻和影響。
「工具的進步」:
〈《明清臺灣行政檔案》引用關係之重構〉採「引用關係重構」的方法,從臺灣歷史數位圖書館(THDL)收錄的《明清臺灣行政檔案》資料中,找出檔案之間的脈絡及關連性,特別是皇帝與高級官員間的行政文書。同樣的方法也適用於具有相同引用書寫慣例的清代行政文書制度的中央與地方、官員與關衙間往來的行政文書,只要找出合適的syntactic anchor,都有助於研究者未來分析研究。
〈歷史佛典文獻外來語借詞對辨識系統〉以「自動辭彙擷取」、「詞彙過濾」、「語音相似度比對」三大模組,試驗分析《雜阿含經》、《阿毘達磨大毘婆沙論》二部不同時期不同體裁的佛教典籍。該分析經驗提供早期歷史文獻搜尋出可能使用同源詞 (同一個語源的詞彙)或借詞 (外來語),藉此發掘出各詞之間的關聯性或更多研究議題。對研究歷史、古代民族間彼此交流、或歷史語言學也有一定程度的助益。
〈同位詞夾子:主題式分類詞庫萃取演算法〉採半自動主題式詞庫萃取演算法,超越傳統研究依賴各項自動化工作的精準率與召回率,讓自動控制與手動操作並進。使傳統學習演算法的精度推薦與詞夾子演算法的廣度推薦同時可以運作,再將分析結果提供分類推薦給研究者進行一步的操作分析。該演算法成功在短時間內完成以下分類辭庫萃取的任務: 臺灣歷史數位圖書館(THDL)中的人名、地名、官職名、事件名等,以及中國古典小說《三國演義》的武器名、《西遊記》的法術名、《紅樓夢》的衣飾名、《金瓶梅》的小吃名等。
「現象的探索」:
〈電視媒體的鄉村性-以語料庫語言學輔助方法分析《台客練習曲》〉採詞頻統計分析和關鍵詞檢索與論述的分析方法,研究臺灣電視節目《台客練習曲》的對話與旁白為文本,觀察大眾媒體再現鄉村田園詩意意涵蓋的面向。
〈十七至十九世紀朝鮮食譜手稿之量化分析〉說明如何將沒有分段和標點的數位化食譜進行文本分析。先將食譜文本採用大量的語意註記,如食材、調味料、計量單位、食器、烹調與儲存的方法,進行標示,再進行料理元素的網絡分析。
〈繪圖註說-《淡新檔案》知地圖繪製與地圖使用〉繪製地圖各有不同的目的。該文試圖從官方或民間地圖繪製者的角度理解地圖繪製的目的和眼見的生活視野。