當前位置:縱橫輸入法首頁>>教學經驗交流>>第二屆縱橫碼教學經驗交流會論文集

多種漢字輸入法編碼方案的比較及其相應教學方法的探討
蘇州衛生學校 王 雁

一、引言

  漢字是世界上最悠久的文字之一,它記載著我國五千年光輝燦爛的文明史,也是世界上公認的重要的文化交流工具之一。漢字是從象形文字演變而來的,它是一種表意文字,是形、音、義的統一體,它形體複雜,數目繁多。正因為如此,當在美國誕生的電子計算機進入我國時,漢字信息處理便成為首要問題,而這無疑是一項十分艱巨的工作,堪稱一項綜合工程。近二、三十年來,國內外的計算機工作者經過艱苦的努力,對漢字輸入方法進行了大量的探索和實踐,迄今為止,已產生了近千種漢字輸入法。總結這些眾多的漢字輸入方案,大致可分為以下兩類:

1. 自然輸入

  指漢字的文字識別和語音識別,這是漢字輸入的最終和最理想的形式。但是,雖然現在已有一些文字識別系統進入了實用階段,比如清華文通公司的TH-OCR系統、中國科學院自動化所漢王科技公司的漢王筆輸入系統等,以及最近漢王公司開發成功的我國市場上第一個連續非特定人語音識別系統,但這些技術還遠不夠完善,要正真達到普及還尚需時日。

2. 編碼輸入

  編碼輸入是目前以及將來一段較長時間內普遍採用的漢字輸入方法,它是將漢字編成代碼,使之符號化,以便通過適當的方法將漢字輸入計算機。它又可分為以下四種類型:

  (1) 數字類:把漢字作為一個整體,採用一定的規則排定漢字的先後次序,用序號作為漢字的編碼。例如,國標區位碼、電報碼等。這類編碼輸入方便,沒有重碼,可達到很高的輸入效率,但由於編碼記憶量很大,因而僅適合專職操作員使用,對於普遍用戶來說是無法接受的。

  (2)音碼類:根據漢字的讀音,把漢語拼音的聲母韻母與英文字母相聯繫,用英文字母作為漢字的編碼。例如,全拼雙音、雙拼雙音等。這類編碼非常容易學習,尤其適合於非專職操作員,但由於漢字的同音字極多,因而這類編碼的重碼較多,輸入效率難以提高。

  (3)形碼類:根據漢字是象形文字的特點,把漢字拆分成一些相對不變的基本結構,然後利用英文字母或數字對這些基本結構進行編碼。例如,五筆字型、縱橫碼、表形碼。這類編碼重碼率較低,輸入效率較高,但編碼規則通常較多,必須通過一段時間的訓練才能掌握。

  (4)音形類:根據漢字的音和形兩個信息編碼。例如,快速碼、自然碼等。與形碼或音碼比較,這類編碼的規則簡單,重碼少,但掌握這類編碼需要拼音和字形兩個方面的知識。

  從另一方面來看,隨著計算機的越來越普及,操作計算機的人群越來越龐大,其層次也越來越複雜,人們總是希望漢字輸入法既容易掌握又能達到較高的輸入效率。從這個意義上來說,計算機對用戶的要求應該是越低越好。但由於漢字本身的複雜性,比如筆畫多、結構複雜、規律性不強,同音字多,故目前為止還沒有哪一種輸入法能真正滿足人們的要求。事實也正是如此,在這近千種漢字輸入法中,真正能夠得以流行、普及的不過廖廖數十種,而其中較為優秀的要數智能ABC、五筆字型、縱橫碼等。本文對這三種漢字輸入法的編碼方案作一個比較,對相應的教學方法作一點探討。

二、不同編碼方案的比較

1. 智能ABC輸入法

  智能ABC輸入法是由中文Windows 95提供的,它既可以作為音碼來使用,也可以作為音形碼來使用。智能ABC輸入法的編碼規則極為簡單。作為純音碼使用時,只需輸入相應漢字的全拼拼音即可。同時,為了減少擊鍵次數,提高輸入效率,還可以用簡拼和混拼的方法,這也給讀不准漢語拼音的操作者提供了方便。例如:

漢字

  雜志

  日常

  主任

  小姐

全拼

  zazhi

  richang

  zhuren

  xiaojie

簡拼

  zz

  rc

  zr

  xj

混拼

  zaz

  ric

  zren

  xjie

  在作為音形碼使用時,可在拼音編碼後加上筆形碼進一步對漢字進行識別,這可以減少純音碼輸入時的重碼。筆形碼是按照漢字基本的筆畫形狀來劃分的,共分橫、豎、撇、捺、折、彎、叉、方八類。例如:

漢字

識別

葵花

音形混合碼 

shb8

shi45

j31

W7

k72h

  智能ABC輸入法還具有非常豐富的詞組功能。它不僅提供很多通用詞組,還提供自動記憶詞組、手工造詞兩種方法以方便用戶自己定義新的詞組。

  根據以上編碼方案,可以說智能ABC輸入法是音碼類和音形碼輸入法中效率較高的一種漢字輸入法。它的優點是簡單易學,靈活方便,但與一些形碼類輸入法相比,其輸入效率仍很有限。

2. 五筆字型輸入法

  五筆字型輸入法是一種形碼類的漢字輸入法。它將漢字分成三個層次:筆畫、字根、單字。筆畫是根據運筆方向來分類的,共分橫、豎、撇、捺、折五類,字根是由筆畫構成的用於構成漢字的一種相對不變的結構,是五筆字型優選出來的組字頻率高和實用頻率高的構字成份,共有130種。字根被科學地分為五個區,每區五個位,分別對應於25個英文字母鍵。在輸入漢字時,先將漢字根據五筆字型輸入法拆分漢字的原則將漢字拆分成字根,再輸入相應的英文字母,對於非常用字有時還需加打一個末筆字型交叉識別碼。另外,它還提供了簡碼輸入法和詞組輸入法來進一步提高輸入效率。例如:

漢字

全碼

 

 

 

ujfi

 

 

簡碼

q

tu

tjt

 

 

 

詞匯碼

 

 

 

 

ukig

ytsm

  五筆字型輸入法的優點是編碼長度短,簡單平均碼長為2.6鍵,最長不超過4鍵;重碼少,重碼率不超過萬分之二等。但記憶量較大,特別是字根與英文字母的對應關係較難記憶,雖有五首字根助記詞,但仍比較難記,且仍有不少例外的情況。還有拆字的原則也容易產生歧義,較難掌握。

3. 縱橫輸入法

  縱橫輸入法也是一種形碼類的漢字輸入法。它用「0」-「9」十個數字作為碼元,同時也作為筆形、部首及整個漢字的編碼。它定義了十種筆形,並歸納成一首口訣。它按照字形和字義對漢字進行分類,將漢字分為主部首漢字、副部首漢字、無部首漢字三類,然後分別編碼。主部首共精選了55個,分別對應1-2位代碼,有口訣幫助記憶 。副部首只取一碼,無需記憶。漢字被取走主部首或副部首後稱為字身,對於字身和無部首漢字,按照其字形共分七種情況,分別按筆形編碼,同時還需要遵循相應的補碼規則。為了進一步提高輸入效率,縱橫輸入法還提供了詞組輸入、簡碼輸入和縮碼輸入等方法。例如:

漢字

全碼

0370

378607

1211

865 

 

 

簡碼

  5

37

 

 

36

 

詞彙碼

 

 

 

 

36610

378849

  縱橫輸入法的確是一種非常優秀的漢字輸入法,它的編碼規則簡單明瞭,易學易用;最大碼長為6位;重碼率很低;可用小鍵盤單手操作;它的詞彙非常豐富,包容了我們生活中絕大多數的詞彙;它的自定義功能使得各行業用戶可方便地定義各自的常用詞;它的模糊輸入法可以有效地為初學者提供幫助。學習的難點在於其補碼規則較多。

4. 三種漢字編碼方的比較

  智能ABC輸入法是基於漢字的讀音來編碼的,即憑音識碼。它直接利用英文字母來表達漢語拼音,非常直觀簡單。該方案還進一步提供簡拼、混拼等輸入方法,減少了碼長,在一定程度上也降低了對操作者讀音準確性的要求,但會增加重碼。而另一方面,它提供了可附加的筆形碼來減少重碼,但又會增加碼長。它的詞組功能較強,但比較而言,其單字的重碼率還是很高的,這就決定了其輸入效率難以提高到一個較高的水平。所以智能ABC輸入法比較適合於有一定拼音基礎且較少需要輸入漢字的操作者。

  五筆字型輸入法和縱橫輸入法同是形碼類的漢字輸入法,都是基於漢字的字形結構來編碼的,即見字識碼。但兩者對於漢字結構的認識卻大不相同,其編碼思想各有特色。現從以下幾個方面進行比較:

  (1) 從需要操作者記憶的信息量來看。五筆字型輸入法要求記憶五種筆畫代號、三種字型代號、25個鍵名漢字、130種字根的區位號,並要掌握好拆分漢字的原則以及鍵名漢字、成字字根、單字、詞組、簡碼等相應的編碼規則。縱橫輸入法要求記憶十種筆形代碼、55個主部首的代碼、字身的7種取碼規則、字身補碼的一般規則和幾種特殊情況,並要掌握好詞彙碼、簡碼、縮碼的編碼規則。由此看來,後者的信息量相對較小,其編碼規則較為簡明,所以操作者的入門時間會相對較短。

  (2) 從組成輸入碼的碼元來看。五筆字型輸入碼的碼元是25個英文字母;而縱橫輸入碼的碼元是10個數字。因為不管是主鍵盤還是小鍵盤,數字鍵都很集中,故後者更有利於提高擊鍵速度。

  (3) 從取碼成份的結構大小來看,五筆字型輸入碼的取碼單位是字根,而絕大多數的字根是偏旁部首,相對較大;縱橫輸入碼則先取走主部首或副部首(如果有的話),餘下的字身其實也相對簡化,而對字身取碼時,一般只取其四個角上的筆形代碼,取碼單位相對較小, 往往不涉及漢字的全部,這一點對於繁難字的輸入特別有利。從這一點來看,縱橫輸入法的取碼較為簡化,更有利於提高取碼速度;而五筆字型輸入法則對於操作者學習漢字的詳細結構更有幫助。下表是一些字例(括號內的編碼為主部首或副部首的編碼):

  (4) 從詞組功能來看,五筆字型輸入法通常提供5,000餘條詞彙;而縱橫輸入法的詞彙量更大,有4萬餘條,它包容了我們生活中絕大多數的詞彙,並具有靈活方便的自定義詞組功能。

三、相應教學方法的探討

  根據以上對這三種不同的漢字編碼方案所作的分析,在實施教學時應採取相應的教學方法。

  首先,究竟應選擇哪一種漢字輸入法作為教學內容?在我看來,漢字輸入是計算機操作人員必備的基本技能,一個合格的操作者應該達到一定的漢字輸入水平,而對於在校的中、小學生來說,這是他們將來從業需要。所以,對他們來說,學會一種優秀的形碼類漢字輸入法是必要的,同時,就他們本身的素質也是應該能夠學會的。但對於初學漢字輸入的人來說,一開始就學習形碼類漢字輸入法的編碼規則,可能會打擊他們的學習積極性,所以,我還是從簡單易學的音碼類輸入法入手,比如智能ABC輸入法。這樣做的目的是為了使學生盡快體會到漢字輸入的樂趣,又激發了學生要求進一步提高輸入效率的願望,調動了學生下一步學習形碼類輸入法的主動性和能動性,同時也可作為一種補充。幾年以前,在形碼類的輸入法中我一直偏好五筆字型輸入法,但自從接觸了縱橫輸入法,我的想法很快改變了。我現在的教學內容是:智能ABC輸入法+縱橫輸入法。下面就這三種輸入法的教學方法作一點探討。

1. 智能ABC輸入法

  課時定為2學時,教學目標是學會正確使用智能ABC輸入法進行漢字輸入,對輸入速度沒有具體要求。

  第一學時採用講解法和演示法相結合並輔以練習法的教學方法。因為智能ABC輸入法的編碼規則較簡單,可先集中講解並演示其全拼、簡拼、混拼這三種輸入方法,然後留十分鐘讓學生自己練習加以消化理解。在此基礎之上,繼續講解並演示其他的一些智能法,如詞組的定義方法、中文數量詞的簡化輸入法等,以及屬性設置的操作方法,同時讓學生跟著一起操作,教會他們靈活地使用這種輸入法。

  第二學時主要採用實習法,讓學生自由選取文本進行輸入練習,適當作些輔導即可。

2. 五筆字型輸入法

  課時定為20學時,教學目標是學會五筆字型輸入法並達到20字/分鐘的輸入速度。

  前6學時主要採用講解法並輔以練習法。先要講清楚五筆字型輸入法的編碼基礎,包括漢字的三個層次、五種筆畫、三種字型及其結構分析,啟發學生轉變觀念,接受五筆字型對於漢字的新認識,這是至關重要的一步。然後講解五筆字型字根鍵盤。因為字根有130種之多,雖有字根助記詞幫助記憶,但這仍然是一大難點,學生容易產生畏懼心理,甚至失去學習的興趣。我在教學中一直採用逐區解決的方法,教學效果有所改善。具體做法是:先講解第一區字根助記詞,留5分鐘讓學生強記,然後列舉第一區的字例要求學生做拆字練習以求加深影像並提高興趣。比如:式、革、天、磊等都是由第一區的字根組成的。接下來講解第二區至第五區時重複上述過程 ,最後再做一個綜合練習。這一段內容通常要花費3個學時的時間,但總算基本能使學生樹立起學習的信心。至於接下來的具體編碼方案,要點是教會學生注意辨別鍵名漢字、成字字根、普通單字,因為它們是依據不同的規則進行編碼的。

  餘下的14學時主要採用實習法。 五筆字型的練習軟件較多,可根據硬件的配置情況加以選用。在實習輔導時,應鼓勵學生盡量使用簡碼和詞彙碼來提高輸入效率。

3. 縱橫輸入法

  課時定為14學時,教學目標是學會縱橫輸入法並達到20字/分鐘的輸入速度。

  前4學時主要採用講解法和錄像演示法。總的教學思路是先講解編碼要點,再逐步解決細節問題。縱橫輸入法的編碼總則比較簡單明瞭,因此可先從這一點入手。歸納如下表:

分  類

          編碼總則

   第一步

   第二步

主部首漢字
副部首漢字
無部首漢字

主部首(1-2位代碼)+字身
副部首(1位代碼)+字身
=字身

根據字身的字形分為七種情形,以筆形為單位進行編碼

  在此基礎上,開始逐步講解十類筆形代碼,55個主部首的代碼、副部首的取碼方法以及七種字身取碼法。筆形代碼較易記憶,副部首的代碼無需記憶。

(1) 單碼主部首取左上角第一碼;
(2) 雙碼主部首取上下兩角或左右兩角的代碼;
(3) 「諢v(35)和「ば」(39)是兩個例外。

  七種字身取碼法其實也很有規律,字形與取碼規則之間的聯繫很容易使人聯想起來。比如:田字形取其4個角的代碼,「匚」(71)、「z」(17)、「ぢ」(07)、「た」(7)、 「凵」(22)、「禳v(70)、「厂」(71)等均取其上部兩角代碼,不必硬記。

  比較困難的是補碼的取碼法,對於這個難點,可採用分層講解的方法。先講清楚補碼的一般規則,即當一個筆形獨佔字身的上部兩角或下部兩角時,一般要取補碼,取碼時優先取被筆形相貼的筆形,且右邊筆形最優先。對於筆形代碼為4、5、6時的特殊情況以及不取補碼的情況,可先略講,避免學生被細節所困擾而產生畏懼心理。

  其餘一些內容,包括詞彙碼、簡碼、縮碼等輸入方法,非常簡明易記,可讓學生自學。

  至此,學生已能從總體上把握縱橫輸入法的編碼方案,接著可安排學生觀看縱橫輸入法的配套教學錄像,幫助學生進一步加深印象,也可提高趣味性。

  餘下的10學時主要採用實習法。最適用的軟件就是蘇州大學縱橫漢字研究所開發的縱橫漢字輸入法教學演示軟件和訓練軟件。在實習輔導時,鼓勵並點撥學生逐步搞清補碼的特殊情況,在操作過程中比較輕鬆地解決這個難點。

四、討論

  如何更好地解決計算機漢字信息的處理問題,即加快自然輸入法的研製進度,或者研究更優秀的編碼輸入法,是計算機漢字軟件開發者面臨的問題。而如何在現有的漢字信息處理環境下選擇比較合適的漢字輸入法,把我們的學生培養成具有相當計算機操作技能的現代化人才,則是擺在我們計算機教育工作者面前的課題。

  在實施漢字輸入法教學的過程中,可供探討的問題還很多。比如:

(1) 如何進一步探索計算機輔助教學(CAI)這種現代化的教學手段?
(2) 如何更好地利用啟發式教學方法使學生能盡量輕鬆愉快地學會一種優秀的漢字輸入法,比如縱橫漢字輸入法?
(3) 如何更好地在縱橫碼教學中把握好「補碼」這一難點?