默認冷灰
24號文字
方正啟體

第一千一百零六章 跑程序(2/2)

作者:二子從周字數:4348更新時間:2023-12-18 21:14:05

    第一步工作是掃描,將圖形化的文字掃入待識別區。

    第二步工作是字根匹配,尋找到文字所用的字根,再將字根轉化成對應的標準黑體字根。

    第三步工作是結字結構匹配,根據相應字體的結字規則,將文字字根的相應位置標誌成數字坐標。

    第四步工作是將黑體矢量化標準字根和結字規則結合運算起來,構成新的矢量文字。

    第五步是給準備新入庫的矢量字進行偏旁部首等多種標簽定義,便與後續統計分析等工作使用。

    最後就是編碼,根據新文字的標簽定義,通過編碼算法,給它賦予一個唯一的UNICODE編碼,再根據編碼的碼位將新字存入字庫,工作便算是完成了。

    過程中遇到BUG是很正常的,不過周至和柳工都是高手,分分鍾就將程序調整好,讓過程能夠繼續。

    辜開來名義上是工作組組長,但是之前都是把握大進度大方向,這還是第一次親眼看著一個文字,一步步從寫在字卡上“跑”到字庫裏,不由得倍感新奇。

    就連他都覺得神奇,更別說冷玉龍和韋一心兩位老師兄了。

    周至打開文本編輯軟件,切換到瀚文輸入法:“現在我們的字庫裏就有剛剛入庫的(木舟)字,兩位師兄來試試?”

    “我來。”冷玉龍興奮地說著,坐到周至讓出的座位上,輸入了NAN三個字母,在輸入法的選字框上一陣翻,在最後發現了(木舟)字,一敲數字索引號,(木舟)字就跳到了屏幕上。”

    “哈哈哈哈……”冷玉龍很高興:“原來字庫就是這樣搞出來的呀!”

    “這隻是工作原理,我們隻能在自定義區裏玩玩,驗證驗證可行性而已。”周至笑道:“具體的實際工作,要遵循嚴格的軟件工程管理規章製度,流程手續很多的。”

    “這不是耽誤事兒嗎?現在就能用了啊。”冷玉龍對這樣的做法有些不解。

    “沒有工藝文件,不符合國際標準,我們的產品就沒法申請國際專利,別人就可以隨便伸手搶奪。”周至耐心地解釋道:“今天隻是一點小小的嚐試,但是一個大型軟件工程,這樣的小改動,那是成千上萬,可能是幾百人,上千人在同時進行。”

    “要是沒有工程管理控製,大家都各自為是的話,一定會亂套的。”

    工程組裏周至主抓的就是這個事情,發現問題最多的也是這個事情。

    你讓一個工程技術人員寫段程序,他可以加班加點通宵不睡覺,可是你要他寫一段說明文檔,可能就跟要他老命一樣。

    因此逮到機會周至一定會給大家做科普,要求大家重視起來。

    等到將工程管理的概念和老師兄普及了一陣,另一個隸書的漢字,也完成了入庫驗證工作。

    也就是說,經過簡單的參數調整和程序升級後,《中華字海》的漢字字卡,完全可以作為基礎字卡,交給《瀚文字庫》的識別程序使用。

    “所以我們的字卡可以用?”周至和柳工搞了這半天,其他人也看不懂,韋一心忐忑地問道:“接下來還要做什麽?”

    ./94750255/777835655. 本章已閱讀完畢(請點擊下一章繼續閱讀!)

上一章 回目錄 標記書簽 下一章