看板: BudaTech ◎ 佛典電子化討論    板主: HeavenChow
閱讀文章: 第 1067/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回
發信人: maha <maha@tpts1.seed.net.tw>, 信區: BudaTech
標  題: 新版去點程式的最佳點數設定值(佛教藏)
發信站: (NEWS/INFO) National Sun Yat-San University (Mon Dec  8 10:29:47 1997)
轉信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail
來  源: buddha.nsysu.edu.tw

經過 heaven 的加工趕製,這個新版 fgmvdot,如果應用在目前的佛教藏
OCR 作業,到底最佳設定點數是多少?以下做了個小測試。

  ◎測試材料:佛教藏第62冊 523頁(本頁以舊版程式無法去除乾淨)
  ◎本頁原有圈點:85個

    點數 去除點數 未去除點數
    ────────────
     12    201        3
     13    180        0
     14    155        0
     15    148        0
     16    138        0
     17    127        0
     18     99        0
    *19     90        0
     20     94        0
     21     92        3
    ────────────

點數在12以上、21以下,會有越來越多的未去除點。而點數在 13-20,皆
可把原有的85個圈點去除乾淨,但是程式所報告的去除點數皆大於85,這
是因為程式把不該去除的文字邊角也幹掉了。所以在 13-20之間,乃以點
數19時的狀況最好,它只多去除了 5個不該去除的。因此,19點是最佳點
數設定。

我這個測試,只針對這一頁材料。徐言輝的掃瞄圖檔狀況未必一致,各位
可以參考我這個方法自行測試,找出最佳點數,以發揮 fgmvdot的最大功
效。

═════════════════
 摩訶工作室.吳寶原
 E-mail:maha@tpts1.seed.net.tw
 Tel:(02)6741715/Fax:(02)6741716
═════════════════


閱讀文章: 第 1067/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回

卍 台大獅子吼佛學專站  http://buddhaspace.org