看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 688/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: dnstudio <dnstudio@m2.dj.net.tw>, 信區: BudaTech 標 題: Re: 回maha有關大辭典新版之 發信站: 國立中山大學網路組 Mailing List (Wed Jun 25 10:03:10 1997) 轉信站: Lion!ccnews.nsysu!news.nsysu!buda-tech@sccid.nsysu 來 源: sccid.nsysu.edu.tw COSINE wrote: > > 新版還是會以光碟發行,只不過改成html相容,至於網路 > 版,目前還有一些技術上及非技術上的問題。我盡力試試。 > > 之所以用圖形方式顯示造字,有三個原因: > 1)既然是少見到要用「造」的字,檢索的機率必定不高,何況也可以用 > ?的方式來代表所有的造字,如羅?羅,一樣可查出。 > 2)沒有造字空間的問題。 看法相同, 用圖形是末學一直在做的, 有人會問那 dos怎麼辦? 末學認為 這些 users 從市場的角度言, 是沒有必要考慮的. > 3)現在我們面臨的最大問題不是檢索,而是造字沒有標準,沒有標準則 > 無法交換,一切都免談,所以目前最重要的工作就是建立標準,建立 造字標準?標準造字表? Excuse me. As I know we already have one. It is the effort by 台大佛研恆清 and 中研院莊德明. Why don't we keep delevelping based on this one, so the effort won't be waste. > 一個有彈性的標準。標準一旦形成,我們就可以要求軟體系統� > 字形商,把它 build-in 在系統內,才能把造字問題解決。圖形方式 > 大家可把它視作為過渡方案。 > 這問題的癥結應是造字空間有限的問題, 而不是廠商不 build-in 的關係. 談得更深點還可能是中文文字本身在電腦上應用的根本問題, 例如中文字也在不斷演化增加, 只要原來的字增減一畫就是一個新字, 目前方言字, 如廣東方言字, 閩南方言字, 中國地大人多方言也多, 將來各地方言字都出來, 恐怕在大的造字空間都不夠; 不若拉丁字由幾個基本字母(character)來組成單字(word), 單字再多 還是由那幾個基本字母組成. 這是根本問題, 除非, 電腦字的顯示設計 從頭來過, 並由中國人主導, 這在可見的未來似乎是不可能的事. > fkr 格式是我自己定的,乃FKRead (佛光讀經器)之前三碼。 > 有鑒於佛光大辭典上一版和其他軟體整合能力不足及 > 造字的問題,故下一版會考慮直接推出一個讀經器, > 並定出一個新的檔案格式,方便大家交換電子佛典。 > 故它不只是電子版的辭典,更像是一個內建線上 > 解釋佛學名相的整合的讀經介面。 > > 我的想法是: > > FKRead Convertor + user definable rules > Pure Text --> *.fkr > > 大家有自己的輸入規格A內縮,造字都不一,不可能 > 強行統一,故應可以經由可程式化的描述檔加上 > 轉換程式將各家的純文字檔轉成統一格式fkr。方便交換。 > > 接下來,再由另一支程式解讀fkr ,並轉成html輸出至browser > > FKRead fkr Parser and Viewer > > *.fkr ---> HTML > raw text -> html -> fkread (display directly to uer interface) If there is no format for raw text, then there is not need to write a parser for it. Since your application runs on Win95, it's best to follow the standard interchangable text format in that, this format nowaday undoubtablly is html. Also, the trend on html is heading toward dynamic html which you will be able to make multimedia presentation. > 此外,版本控制能力,檢索能力等也很重要。 MS 的 source safe 是版本控制的軟體. > 我現在正在考慮fkr的格式,要決定其規格真不容易,如果 > 太周詳擔心implement 很困難,做不出來,太簡單又怕沒有遠見, > 造成往後compatible的負擔,真是一個delimma。 > 佛光大辭典的coding 部份只有我一人在做,辛苦一ガS有關係, > 只是擔心會影響進度,讓大家久等不好意思,我有以下數點想請 > 大家幫忙,畢竟這是個不小的工程,需要整合很多技術, > 單靠一人確實有不勝study之慨: > > 1)大家一齊來決定檔案格式,要包括那些內容,預計應有 > 經名(書名),作者,譯者,原書頁碼,版本,輸入者,提供者, > 經文結構等。 > 從全文檢索的角度看, 這些應該要建立屬性表 (aka database) 來輔助. 記得在妙雲集程式的討論中末學已提過了. > 2)往後在網路上我們共同來維護一份統一的造字表,用001-->?? , 002--->??表示 > 其中001 002是造字序碼,??是造字表達式,(用中研院莊先生的方法) > 我會把這些造字做成bmp格式小圖,在讀經器內可以show出來。 > 以後佛光大辭典既然是一個讀經器,它就應該有包容各家造字的能力。 > 末學已經在做了, 末學之前給師父的檔案中 budfont.hlp 即是. 16, 24size的 bmp已有近千字, 都是根據莊居士的造字檔. > 3)佛光大辭典v1是用delphi 3.0 compile的,我想沒有意外的話,v2 > 也會用delphi 來做,所以請大家推薦對佛典電子化有與趣的delphi高手, > 我想組成一個 5至10人的cyber-team 來做這做這項工作,就像老外做linux > 的方式一樣。 > 這是 public domain software 的做法, 師父是說佛光辭典的軟體要成為 public domain 的軟體? > 4)我想知道大家對大辭典內圖片的看法,真的有必要每張都做進光碟去嗎? > 因為掃描不是問題,問題是已經找不到原始的圖片了,如果用和原書不一樣的 > 圖大家可以接受嗎? > 是否只要原來的"專家"認可就可以了, 有圖畢竟是好的, 在電腦內也最好是 彩色的. > 有關於佛典保存及流佈,昨天我 post 的一篇慧開法師的文章很值得參考, > 大家有空可以看看。 > -- 張文明 日月工作室 mailto: dnstudio@m2.dj.net.tw 電子佛教藏經閣: http://w5.dj.net.tw/~DNStudio/canon |
閱讀文章: 第 688/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |