★★★
日本人也同樣在苦苦徘徊。
“當(dāng)時只有日本搞出了三代機,但并沒有從根本上解決漢字信息的存儲問題,只能提供宋體和黑體兩種字體,僅能勉強應(yīng)付日文中的少量漢字,質(zhì)量也達不到印刷要求,無法投入實際使用?!?/p>
多少人曾希望像西文一樣采用黑白段長度編碼技術(shù),解決漢字字模信息的存儲問題,卻一一鎩羽而歸。無奈之下,從20世紀(jì)70年代初開始,NEC、京都大學(xué)嘗試使用字元組字的方式來解決這一難題。把漢字看成是由一個或多個字元組成的圖形,每個字元都用折線輪廓來加以描述,并將其輪廓信息存儲到系統(tǒng)中,字形還原時先從系統(tǒng)中調(diào)出字元輪廓信息,然后把它們拼成漢字。比如“新”字,可由“立”、“木”、“斤”三個字元經(jīng)放大、縮小、拉長、壓扁處理后拼成。這樣,字形信息的壓縮率雖然很大,但是拼出來的漢字實在慘不忍睹。
難,還是太難,漢字字形特殊,數(shù)量龐大,第一代照排機發(fā)明40年了,可漢字照排系統(tǒng)依然是一座高不可攀的險峰,漠然地橫亙在科學(xué)家面前,面無表情地拒絕了一個又一個努力攀爬的人們。
但是,“這個項目的難度和它的價值,大大地吸引著我?!蓖踹x后來說。
在一系列路徑被證偽之后,王選憑借著他的數(shù)學(xué)功底,憑借他通靈軟硬二界的燁燁才華,終于找到了一條屬于他自己的路。
王選注意到,“漢字雖然繁多,但是有規(guī)律可循,每個漢字都可以細分成橫、豎、折等規(guī)則筆畫和點、撇、捺等不規(guī)則筆畫。對于規(guī)則筆畫,可以用一系列參數(shù)精確表示;對于不規(guī)則筆畫,可以用輪廓表示?!?/p>
“我們統(tǒng)計了一下,漢字中規(guī)則筆畫的比例占了近一半?!蓖踹x說。
以輪廓加參數(shù)的描述方法,使?jié)h字字型信息得以以1∶500的比例高倍壓縮。