Wikimedia Taiwan/OpenWuDict

From Meta, a Wikimedia project coordination wiki
Jump to navigation Jump to search
English
en

「吳阿公的臺語辭典」是個將《國臺對照活用辭典》進行開放內容及數位化的計畫。本書為已故台大文學院吳守禮教授著作,曾經由遠流出版社發行。吳氏後人基於提供大眾無償運用的理念,將本書以開放授權方式贈予中華民國維基媒體協會,結合維基社群、開放社群、企業及學術界力量,共同進行數位化工作。

最新狀況[edit]

預定於2018年4 月 2日下午2:00於台北捷運北投會館舉辦OpenWuDict - 吳守禮國台對照活用辭典成果 open data成果發表會

  • 發表會目標:公佈公眾可以使用的靜態網頁,也介紹給社會大眾open data完成的原始辭典電子資料,歡迎任何人、團體在CC BY-SA授權下加以活用再加值
  • 發表會重點:
    • 吳守禮國台對照活用辭典使用傳統反切、方音符號(台語注音),「年輕人常用注音文模擬台語,可是會碰到拼不出來的音。除了重頭學一套羅馬拼音系統,古早的台語注音符號現在也能在網路上自學。」
    • 使用新一代 Unicode Ideographic Description作為通用缺字描述式,以漢字組建引擎呈現Unicode 未編碼台語缺字
    • 此計畫背後大力促成的吳守禮兒子—吳昭新醫師年事已高身體近來已很不好,我們希望搶在他身體還可以時開發表會,讓他能親眼目睹他父親的著作open data化,嘉惠社會大眾。

其他詳細請參考工作成果段落



吳阿公與他的國臺對照辭典[edit]

吳守禮先生是已故台大文學院教授,而《國臺對照活用辭典》是他畢生心血的精華,同時也是一個祖孫三代的親情寄託。

吳教授在台北帝大(今台大前身)求學時期專攻漢學,投入台灣閩語研究70載。1987年《綜合閩南臺灣語基本字典初稿》出版,當時書中的內容,是由吳教授本人一筆一畫手寫而成。自台大的教職退休,但吳教授並未就此離開研究工作,而是投入自己的時間,將《國臺對照活用辭典》編纂完成。

然而,這時候出版已經進入到數位年代。為了讓吳教授的研究能夠公諸於世,他的外孫從高中開始,就自告奮勇地投入編輯的工作。當時電腦還是DOS作業系統的年代,面對書稿中使用少見的「臺灣方音符號」為標音系統,又有許多為有音無字的情況自創的漢字,小外孫用無比的毅力,一個一個在電腦中造出Big-5的字型,終於在2000年8月出版。

吳守禮教授在2005年,以96歲的高齡辭世。但是年壽有時而盡,文章卻是不朽之盛事。他所留下的著作,已經對台灣文化中最重要的「語言」做出了貢獻。然而,這樣的著作若是藏諸金匱石室,影響力就會有限。吳教授的後人承襲父親對台語的熱愛,決定透過維基媒體各項計畫的開放及閱讀量,讓這樣的鉅作以開放版權的方式,無償提供更多的台語愛好者使用。經過此一歷程,吳教授與他的辭典,就不再只是一個家族的故事。社群組織者、程式設計師、學者、文化工作者、企業等眾多的資源與智慧,將結合在一起,以前人的作品為媒介,探索台語音韻的世界。

計畫簡介[edit]

本計畫分為三部分工作進行:文本原始資料open data化、維基文庫等相關計畫活用、第三方加值。

文本線上公開[edit]

工作目標,是將字典原始資料(meta data)經過現代化處理,加以open data化,供維基社群也讓第三方能加以活化使用,重要工作有:

  1. 著作權授予或轉讓給敝維基協會,施以適合開放授權成為活化的基礎
  2. 原始的電子原始資料檔轉換為unicode編碼版本
  3. 自行造字產生的缺字,以字型動態描述技術(基於Unicode IDS的技術)處理(日後第三方加值者可以採用動態呈現或者靜態呈現)
  4. 檔案整理成現代適於open data的格式

維基文庫等相關計畫活用[edit]

本部分工作目標,是自動化部署到維基文庫,然後再視可能性提煉其內容放進閩南語維基辭典等相關計畫。重要工作有:

  1. 缺字部份用「漢字組建」動態描繪引擎
  2. 音標加註羅馬拼音,與原符號並存
  3. 若要置入維基辭典,釋義與維基辭典原文整合

第三方加值[edit]

本部分工作目標,是讓人能加以進行第三方加值的影響力。重要工作有:

  1. 製作有助於理解辭條台語讀音的數位檔案
  2. 舉辦有助本專案成果應用的實體活動
  3. 製作第三方加值的參考範例,供未來第三方作為參考,也作為其他領域開放知識運動之參考

工作成果[edit]

計畫過程中改以靜態網頁版的完成,盡早供大眾使用為最優先事項,也作為第三方加值的示範。

  • koktai:開放資料後的電子原始檔,網頁版在此,內有dic資料可供第三方加值使用,也有簡單的靜態網頁(使用IDS 組字描述與動態組字引擎描繪出缺字),感謝g0v萌典團隊的夥伴協力處理。
  • koktai-rawscan:紙本掃描版,感謝中華開放古籍協會王志攀博士的協力,以後作為校對的參考物。
  • koktai-scala:一個發布引擎,可把koktai 的內容自動部屬到Wikisource(維基文庫),感謝法國朋友Pierre Magistry(阿石,a-tsioh )博士的貢獻,關於缺字處理採用IDS 描述,有兩版:1.用預先產生的靜態圖 2.呼叫動態合成的線上組字引擎來達成。
  • 靜態網頁版吳守禮國台對照活用辭典:根據koktai 製成,感謝目前定居日本工作的蘇渤孺設計,此版的原始碼在這裡

存檔[edit]

合作伙伴[edit]

中華民國維基媒體協會[edit]

零時政府萌典專案團隊[edit]

中華開放古籍協會(簡稱古籍協會).開放康熙字典[edit]

參考資料[edit]