看板: BudaTech ◎ 佛典電子化討論 板主: HeavenChow |
閱讀文章: 第 1067/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
發信人: maha <maha@tpts1.seed.net.tw>, 信區: BudaTech 標 題: 新版去點程式的最佳點數設定值(佛教藏) 發信站: (NEWS/INFO) National Sun Yat-San University (Mon Dec 8 10:29:47 1997) 轉信站: Lion!ccnews.nsysu!news.nsysu!not-for-mail 來 源: buddha.nsysu.edu.tw 經過 heaven 的加工趕製,這個新版 fgmvdot,如果應用在目前的佛教藏 OCR 作業,到底最佳設定點數是多少?以下做了個小測試。 ◎測試材料:佛教藏第62冊 523頁(本頁以舊版程式無法去除乾淨) ◎本頁原有圈點:85個 點數 去除點數 未去除點數 ──────────── 12 201 3 13 180 0 14 155 0 15 148 0 16 138 0 17 127 0 18 99 0 *19 90 0 20 94 0 21 92 3 ──────────── 點數在12以上、21以下,會有越來越多的未去除點。而點數在 13-20,皆 可把原有的85個圈點去除乾淨,但是程式所報告的去除點數皆大於85,這 是因為程式把不該去除的文字邊角也幹掉了。所以在 13-20之間,乃以點 數19時的狀況最好,它只多去除了 5個不該去除的。因此,19點是最佳點 數設定。 我這個測試,只針對這一頁材料。徐言輝的掃瞄圖檔狀況未必一致,各位 可以參考我這個方法自行測試,找出最佳點數,以發揮 fgmvdot的最大功 效。 ═════════════════ 摩訶工作室.吳寶原 E-mail:maha@tpts1.seed.net.tw Tel:(02)6741715/Fax:(02)6741716 ═════════════════ |
閱讀文章: 第 1067/2032 篇 | 上篇 | 下篇 | 回覆 | 轉寄 | 轉貼 | m H d | 返回 |
卍 台大獅子吼佛學專站 http://buddhaspace.org |