醜文:平反倉頡
平反倉頡(上)
前文說到,許多輸入法,尤其牟利的,愛以攻擊倉頡作宣傳。我學倉頡前也看到不少,幸好當時有所懷疑,沒有上當。經過學習,破僞立眞。我僅列出一些常見的指控,以及我透過親身學習所看到的眞相,讓各位判斷。
文宣:倉頡要背各式各樣的字根,又易忘記。我們則以英文字母象形來歸納字根,不易忘記。光是這輸入法是編成英文這一點,我覺得就很難讓我學別的輸入法了。
眞相:英文字母與漢字部件系統差異極大,要是中文輸入法以英文字母象形歸根,一定有甚多牽強的歸納。比較某甲、某乙兩套以字母象形作賣點的輸入法,「辶」某甲歸「L」,某乙歸「W」;「了」某甲歸「Z」,某乙歸「W」;「戶」某甲歸「P」,某乙歸「F」;「厂」某甲歸「F」,某乙歸「L」;「山」某甲歸「V」,某乙歸「E」;「幺」某甲歸「S」,某乙歸「W」;「亞」某甲歸「5(五)」,某乙歸「O」。可見所謂的字母象形歸根有多主觀、牽強,一樣需要學習者死記。而且,中文常用部件有許多,單以英文字母象形,難以囊括所有字根。因此,在同一套輸入法中,還有大量字根,並不能用跟英文字母象形去記憶。例如某甲的「土、士、⺧」歸「G」、「車、東、朿」歸「0」;某乙的「弗、鬼、佳、衤」歸「V」,「兼、弓、犭、丈」歸「Q」,再牽強都無法與字母繫之以形。即是說,這些輸入法的學習者不但要強背死記,還要在記憶不同字根時,用不同的記憶或聯想方法。這極容易引起混亂,造成大量記錯與遺忘,絕不可能如文宣所說般易記。
至於倉頡,主輔根加起來只有百餘個,而且輔根皆是主根或其他輔根的形狀變化、衍生,簡單、清楚、好記,絕不易忘。
文宣:倉頡要死背口訣,以記憶中文字母的位置。我們跟英文鍵盤是吻合的,直接用英文字母,不用另外再背誦口訣,會英文打字的人直接上手,不會打的可以在練中文打字時同時練成英文打字。
眞相:任何輸入法都必須記憶字根歸鍵的位置。倉頡雖用中文字根來歸鍵,但只有二十四個主根,要使手指的神經「記得」字根位置並不難,且莫說絕大多數中文鍵盤都印有倉頡主根,方便學習者上手。至於用口訣來把中文字母轉換作英文字母,根本是走了歪路,不是正確的學習方法1)。
要是一套中文輸入法直接以英文字母歸鍵,一來,使用者仍然要記憶該英文字母鍵的位置——他在腦海還是要把中文輔根轉換作所歸鍵的英文字母,然後以手指按動英文字母所在的鍵,不會因此而減低記憶負擔。二來,因爲英文字母與漢字部件系統差異極大,必有許多字根要強記,記它們會比記歸鍵位置難(如上方所述),結果是得不償失,對記憶的負擔還加重了。況且,即使它以英文鍵來歸根,中文編碼和英文字串也截然不同。一個人熟習了打「OAO」、「YYY」、「OAQE」等編碼組合,難道就等於他已慣打「capability」、「synonym」、「vocabulary」等字串,手指已條件反射地記得字串的指法嗎嗎?實際上還是要練習。
文宣:倉頡的拆碼規則很「龜毛」(「婆媽」),很複雜,很難學。
眞相:倉頡的拆碼規則是仔細,的確相比好些輸入法會顯得繁複,一般輸入法都不會對字身再分拆。然而,倉頡這做法符合漢字特徵2)。規則定得仔細,不等於難學。輸入法眞正難學之處,在於要死記死背誦、因字而異的地方。至於規則,只要製定得能適用於任何情況,就能一理通,百理明。良好的規則,是用來理解、用來明白的,不是用來背誦的。無論把漢字分拆成字首、字身,抑或把字身拆成次字首、次字身,原理都一樣,並不困難。眞的怕「龜毛」的話,學大新倉頡、快倉也行,它們都避開了最「龜毛」的取碼規則,因此也適合作過渡原版倉頡的跳板。
相反,說人家難學的輸入法,自己是否眞的易學?它們當然會說是,並擧出像「OAO=哈」或「阝東=陳」等最直觀的例子。可是,它們的輔根數量多嗎?輔根與主根間的關係統一而好記嗎?它們的取碼規則統一嗎?有沒有許多「不依靠例外就幾乎不行了」的情況?官方取碼會否時常破壞自己的規則?(例如說好了「頭尾」事實卻依賴「頭頭尾」等。)拆字過程能直線順序嗎?還是時常看到「反芻」等非直線情況,或者碰上「最大根」仍要再拆的情況?要是這樣,那麼它們指倉頡「難學」時,其實自己才更難學。
文宣:倉頡很容易忘記。例如哪個朋友的遠親,沒用半年、數個月,便幾乎忘記了怎麼打中文。我們的輸入法好學好記。
眞相:自從學會倉頡以來,我從未忘記過。許多朋友也如此。誠然,要是有人丟下了一段長時間,變得生疏了也不太出奇,但任何中文輸入法也一樣,甚至單說英文打字也一樣,不單單是倉頡。而且,倉頡字根少,拆碼規則是略爲複雜但細緻,只要概念清晰,一明白了便不易忘記。不像那些此以攻擊倉頡的輸入法,邊強記了這堆字根歸在哪鍵,邊又忘記另一些,這才是眞正的容易忘記。
文宣:倉頡打一字要五鍵,速度慢。不及我家輸入法快速、按鍵少。
眞相:倉頡最多取五鍵,但許多常用字,都可以用一、二、三鍵輸入,平均數爲三碼多,與一般輸入法的平均數相差不大。當中不含要強記的簡速碼,平均三碼多就是平均三碼多,沒有摻進水份。況且取五碼之設計,來自嚴謹的統計與分析,有效區別不同的形塊3)。其他輸入法取碼數少於倉頡,卻引致輔根數量大增,或重碼率大增(甚至輔根數量與重碼率都大增)。有些甚至不靠開外掛(例如簡速碼)就難以達到高速輸入,其取碼平均數有「呃秤」(摻水份、欺詐)之嫌。
文宣:我們有許多「簡速字根」、「一碼字」、「兩碼字」等,都是精華所在,讓使用者提升速度。倉頡都沒有。
眞相:但凡簡速碼,都是外掛,在正常規則以外架牀疊屋,以例外取代通則,增加學習者的記憶負荷。對於想在中文輸入速度比賽中得獎的人來說,肯犧牲腦汁去換取數百字之便宜,周瑜打黃蓋,也無可厚非。但一般使用者應當不必依靠之,單以正常規則來取碼,即可得到相對較快、足以應付一般情況有餘的速度。要是一套輸入法不斷強調這些簡速碼,其實側面反映了它的編碼設計本身有缺陷,不靠這些例外難以達成高速輸入。如果你喜歡簡速碼,想背簡速碼去提升速度,在輸入比賽中得獎,可以學大新倉頡、快倉等改良版。大新倉頡還創了全球最高速的紀錄。若不需要,單是學習原版倉頡,已足夠日常應用有餘,不難達到頗高的速度。
文章才寫了一半,篇幅已等於同系列文章的整篇,還是先擱筆一會兒。下一篇繼續說牟利輸入法對倉頡的攻擊,與我看到的眞相有甚麼差異。
— 2016/02/07 22:33 +0800
♪ 本作品以Creative Commons 署名-非商業性-相同方式共享 4.0授權條款授權。
1) 詳見筆者的〈我學中文輸入法(三)〉、〈我學中文輸入法(四)〉。
2) , 3) 詳見筆者的〈我學中文輸入法(四)〉。
平反倉頡(下)
續上篇,一郎繼續說我看到的眞相,到底跟牟利輸入法對倉頡的攻擊文宣有何分別。
文宣:我們的輸入法重碼率或選字率很低,適合盲打。
眞相:依實際數據分析1),倉頡輸入法才是重碼率最低的,這和它的取碼設計有關2)。如此宣稱的牟利輸入法,它們的重碼率可能一點也不低,或者依靠簡速鍵等「官方外掛」來達成低重碼率。甚至連「重碼率」一詞都要迴避,取巧地改用「選字率」或「加用第一及第二選字鍵即時選字後」來計算,玩弄語言僞術。
文宣:我們是最具國際觀的,能夠輸入多國語言漢字,貫通正、簡、日,外國人也適合學習使用。
眞相:倉頡早就支援超大漢字集,無論是Unicode,還是朱邦復先生那收字更多的「倉頡系統」,編碼都老早就公開。對倉頡來說,不論正、簡、日、韓,所有漢字都地位平等,在相同模式下,按同一套拆碼規則輸入,重碼率還很低。因爲在設計字碼階段時,朱邦復先生已顧及這問題,像「場、场」、「穗、穂」或「營、营、営」等字組,都不重碼。
相反,有些宣稱自己支援大字集,卻不見支援Unicode的官方編碼,只有民間擁躉補完。更甚者,那些輸入法,字根不區分正、簡、日寫法,例如「釒、钅」或「貝、贝」等正簡字組,組內彼此間都歸入同一主根。輸入法過去甚至慣以拆簡體字的碼,來輸入正體字,當要同時輸入正簡字元時,就會構成嚴重重碼。結果,它必須區分開正體模式、簡體模式、日韓模式,要麼只能出正體字,要麼只能出簡體字,要麼只能出日韓漢字,無法同時輸入各種寫法的漢字。這根本就是沒有國際觀,不能同時支援多國語言裏的漢字。更莫說還有許多語言並不使用漢字,支援漢字並不等於支援多國語言。
文宣:不論你怎麼寫,用甚麼字形來拆碼,我們的輸入法都支援。倉頡卻不支援異體字。
眞相:倉頡並非不支援異體字,在「倉頡系統」中,異體字有不同編碼,使用者以哪個寫法來取碼,就能輸入該寫法的異體。例如以「竹人木手弓」得出「衛」字,用「竹人木月弓」鍵入「衞」字。本來中文系統就不應該排除異體,應該像倉頡系統般,讓使用者輸入不同的寫法3)。看我在《刻石錄》上的「說文:字形篇」,那些指責作業系統逼迫他人用臺標寫法的文章,就知這問題令中文使用者多麼懊惱,連使用心目中寫法的字形之權利都遭剝奪。然而,過往市場上的正體中文作業系統,都採用不支援異體的Big5編碼,削去了倉頡支援異體的功能。現在Unicode,支援部份異體字,像上述的「衛」與「衞」,它們已立即能夠用倉頡輸入。但Unicode也合併了的異體,例如「令」字,就無法支援較符合字理、下方從「ㄗ」的寫法,這不是倉頡的錯,是Unicode、Big5編碼的錯。改用倉頡系統的話,兩個「令」字皆可正確輸入和顯示。
至於過去那些宣稱支援異體的輸入法,其實只是讓你想着異體來拆碼,卻打出Big5中的臺標字形。你明明想打「衞」字,拆碼正確,卻變成系統裏的「衛」字,顯示不正確。若需要這樣的倉頡,以往在DOS裏運行的國喬系統就有,許多改良版的免費倉頡也有提供,使用者都可以合法地取得、安裝和使用。「不支援異體字」,只是「依Big5版本的倉頡」之問題,不是倉頡本身之問題。
再說有些標榜支援異體的輸入法,連明顯是錯別字的寫法也「支援」。好像「眔」字,粵音「踏」,北音「dà」,「懷」、「鰥」等字從之。有輸入法卻當成是「眾」字的異體,拆「眔」形出「眾」字。這又是否好事呢?
文宣:倉頡沒有容錯碼、簡易的符號輸入碼、假名或諺文輸入、同音字功能、萬用碼功能、打正出簡(或打簡出正)功能、詞組模式。我家的有啊。
眞相:許多改良版倉頡都添加了這些功能,喜歡甚至在意它們的使用者,可選擇這些改良版。甚至我可以說,即使沒有任何改良版本令你滿意,但倉頡發明人早就公開宣佈放棄版權,你可以用他的編碼表去改良,自製合你心水的版本。隨着系統更新,即使是作業系統的預設版本,也加入了部份功能。這些新增功能,並不影響原來輸入法拆字編碼之優劣評價。要動用這些來作攻擊倉頡的武器,是否在主體上輸給別人,就拿無關宏旨的東西來攻擊呢?
文宣:我們是首創唯一只用二十六個英文字母的中文輸入法,智能電話系統也能用。
眞相:倉頡字母只用二十五鍵,還留下了「Z」鍵作特殊功能用。也一樣能用於智能電話系統中。
文宣:倉頡造就了專家權威、培訓中心老師飯碗和收入保證、手寫筆廣告的媒體收入等「好處」,其他輸入法流行起來,就會把這些都「破壞」了,所以要保住倉頡。
眞相:這種純粹訴諸人身攻擊(或曰「『輸入法身』攻擊」)的言詞,不看也罷。我學倉頡,只靠一本價錢相宜的好書。付出一次,受用終身。有些人單靠網上一些編寫得好的敎學,例如維基敎科書上的敎程,也能學得很好。相反,作出這種攻擊的輸入法,它本身是有專利的,不向該公司購買就不能使用,每次更新作業系統,又要等那輸入法出新版,再花錢購買。甚至連敎材都是那公司獨家的,不許其他「外人」編寫,許多獨門技倆都只在敎材上才談及4)。精明的消費者,到底是誰在打你錢包主意呢?
文宣:倉頡有版本差異,出了新版本後,過去的學習者就要跟舊版一起「共存亡」。
眞相:倉頡是開源的,出了新版並不會取締、消滅舊版。即使出了新版,使用者也可繼續合法、免費、方便地使用過去的版本;即使增新了輸入軟件,也仍會繼續合法、免費地支援過去版本的倉頡編碼。而它流通過的,只有三代及五代,兩者間差異極少,亦隨處都有合法、免費、方便的輸入軟件支援,誰都可自由選擇使用哪代的編碼5)。相反,作出這種攻擊的輸入法,它本身是有專利的,只要公司推出新版時,改變了舊版編碼,不再支援,那麼使用者就眞的要與舊版一起「共存亡」。而有關公司也眞的做過這種事,例如在新版本中改變過簡速碼、放棄過舊版本使用的簡速字根等。使用者除非堅持不升級,並且確保他那臺電腦永不壞掉,否則就只能跟隨公司的新版,改變過往習慣。由民間擁躉編寫的査碼網站,更因此而要列出不同版本的編碼,對學習者帶來不便。
寫了一大堆,算是爲坊間不實指控平反一下。各位讀者別誤會,我不是要主動攻擊其他輸入法。寫這文章,也只是看不過眼倉頡飽受無理攻擊,希望以親身體驗到的事實,平衡一下外間那傾側且失實的言論大氣。輸入法這回事,跟人的習慣有關,可說是百貨應百客。因此即使我在文中批評過該輸入法的缺點,但你覺得合適自己的話,請繼續使用它、喜歡它,我對此絕對尊重。只是若眞的要討論,我希望無論哪方都能以事實和公理作依歸。要是你還未接觸中文輸入法,現在或將來要挑選,我更希望你能具有慧眼,不要受像上方那些失實文宣所蒙蔽。
— 2016/02/08 20:57 +0800
♪ 本作品以Creative Commons 署名-非商業性-相同方式共享 4.0授權條款授權。
1) 見泰瑞:〈老話一句:不要學嘸蝦米,學倉頡!〉。
2) , 5) 詳見筆者的〈我學中文輸入法(四)〉。
3) 有人擔心此擧會令搜尋資料時變得不便。其實,系統只要在搜尋時,設有一併搜尋異體字的功能即可。
4) 別跟我說那種輸入法很容易學,根本不需要敎材。若是如此,它的公司都在公開銷售敎材,不就是等於承認它在賣垃圾騙錢麼?
點評
平反倉頡(上)
前文說到,許多輸入法,尤其牟利的,愛以攻擊倉頡作宣傳。我學倉頡前也看到不少,幸好當時有所懷疑,沒有上當。經過學習,破僞立眞。我僅列出一些常見的指控,以及我透過親身學習所看到的眞相,讓各位判斷。
文宣:倉頡要背各式各樣的字根,又易忘記。我們則以英文字母象形來歸納字根,不易忘記。光是這輸入法是編成英文這一點,我覺得就很難讓我學別的輸入法了。
眞相:英文字母與漢字部件系統差異極大,要是中文輸入法以英文字母象形歸根,一定有甚多牽強的歸納。比較某甲、某乙兩套以字母象形作賣點的輸入法,「辶」某甲歸「L」,某乙歸「W」;「了」某甲歸「Z」,某乙歸「W」;「戶」某甲歸「P」,某乙歸「F」;「厂」某甲歸「F」,某乙歸「L」;「山」某甲歸「V」,某乙歸「E」;「幺」某甲歸「S」,某乙歸「W」;「亞」某甲歸「5(五)」,某乙歸「O」。可見所謂的字母象形歸根有多主觀、牽強,一樣需要學習者死記。而且,中文常用部件有許多,單以英文字母象形,難以囊括所有字根。因此,在同一套輸入法中,還有大量字根,並不能用跟英文字母象形去記憶。例如某甲的「土、士、⺧」歸「G」、「車、東、朿」歸「0」;某乙的「弗、鬼、佳、衤」歸「V」,「兼、弓、犭、丈」歸「Q」,再牽強都無法與字母繫之以形。即是說,這些輸入法的學習者不但要強背死記,還要在記憶不同字根時,用不同的記憶或聯想方法。這極容易引起混亂,造成大量記錯與遺忘,絕不可能如文宣所說般易記。
至於倉頡,主輔根加起來只有百餘個,而且輔根皆是主根或其他輔根的形狀變化、衍生,簡單、清楚、好記,絕不易忘。
文宣:倉頡要死背口訣,以記憶中文字母的位置。我們跟英文鍵盤是吻合的,直接用英文字母,不用另外再背誦口訣,會英文打字的人直接上手,不會打的可以在練中文打字時同時練成英文打字。
眞相:任何輸入法都必須記憶字根歸鍵的位置。倉頡雖用中文字根來歸鍵,但只有二十四個主根,要使手指的神經「記得」字根位置並不難,且莫說絕大多數中文鍵盤都印有倉頡主根,方便學習者上手。至於用口訣來把中文字母轉換作英文字母,根本是走了歪路,不是正確的學習方法1)。
要是一套中文輸入法直接以英文字母歸鍵,一來,使用者仍然要記憶該英文字母鍵的位置——他在腦海還是要把中文輔根轉換作所歸鍵的英文字母,然後以手指按動英文字母所在的鍵,不會因此而減低記憶負擔。二來,因爲英文字母與漢字部件系統差異極大,必有許多字根要強記,記它們會比記歸鍵位置難(如上方所述),結果是得不償失,對記憶的負擔還加重了。況且,即使它以英文鍵來歸根,中文編碼和英文字串也截然不同。一個人熟習了打「OAO」、「YYY」、「OAQE」等編碼組合,難道就等於他已慣打「capability」、「synonym」、「vocabulary」等字串,手指已條件反射地記得字串的指法嗎嗎(多打)?實際上還是要練習。
文宣:倉頡的拆碼規則很「龜毛」(「婆媽」),很複雜,很難學。
眞相:倉頡的拆碼規則是仔細,的確相比好些輸入法會顯得繁複,一般輸入法都不會對字身再分拆。然而,倉頡這做法符合漢字特徵2)。規則定得仔細,不等於難學。輸入法眞正難學之處,在於要死記死背誦、因字而異的地方。至於規則,只要製定得能適用於任何情況,就能一理通,百理明。良好的規則,是用來理解、用來明白的,不是用來背誦的。(說的好,可惜做不到)無論把漢字分拆成字首、字身,抑或把字身拆成次字首、次字身,原理都一樣,並不困難。眞的怕「龜毛」的話,學大新倉頡、快倉也行,它們都避開了最「龜毛」的取碼規則(這個說法是錯誤的!),因此也適合作過渡原版倉頡的跳板。
相反,說人家難學的輸入法,自己是否眞的易學?它們當然會說是,並擧出像「OAO=哈」或「阝東=陳」等最直觀的例子。可是,它們的輔根數量多嗎?輔根與主根間的關係統一而好記嗎?它們的取碼規則統一嗎?有沒有許多「不依靠例外就幾乎不行了」的情況?官方取碼會否時常破壞自己的規則?(例如說好了「頭尾」事實卻依賴「頭頭尾」等。)拆字過程能直線順序嗎?還是時常看到「反芻」等非直線情況,或者碰上「最大根」仍要再拆的情況?要是這樣,那麼它們指倉頡「難學」時,其實自己才更難學。
文宣:倉頡很容易忘記。例如哪個朋友的遠親,沒用半年、數個月,便幾乎忘記了怎麼打中文。我們的輸入法好學好記。
眞相:自從學會倉頡以來,我從未忘記過。許多朋友也如此。誠然,要是有人丟下了一段長時間,變得生疏了也不太出奇,但任何中文輸入法也一樣,甚至單說英文打字也一樣,不單單是倉頡。而且,倉頡字根少,拆碼規則是略爲複雜但細緻,只要概念清晰,一明白了便不易忘記。不像那些此以攻擊倉頡的輸入法,邊強記了這堆字根歸在哪鍵,邊又忘記另一些,這才是眞正的容易忘記。
文宣:倉頡打一字要五鍵,速度慢。不及我家輸入法快速、按鍵少。
眞相:倉頡最多取五鍵,但許多常用字,都可以用一、二、三鍵輸入,平均數爲三碼多,與一般輸入法的平均數相差不大。當中不含要強記的簡速碼,平均三碼多就是平均三碼多,沒有摻進水份。況且取五碼之設計,來自嚴謹的統計與分析,有效區別不同的形塊3)。其他輸入法取碼數少於倉頡,卻引致輔根數量大增,或重碼率大增(甚至輔根數量與重碼率都大增)。有些甚至不靠開外掛(例如簡速碼)就難以達到高速輸入,其取碼平均數有「呃秤」(摻水份、欺詐)之嫌。
(ichirou這樣回答不對。人家既然這樣說了,說明倉頡確實存在這個問題。)
文宣:我們有許多「簡速字根」、「一碼字」、「兩碼字」等,都是精華所在,讓使用者提升速度。倉頡都沒有。
眞相:但凡簡速碼,都是外掛,在正常規則以外架牀疊屋,以例外取代通則,增加學習者的記憶負荷。對於想在中文輸入速度比賽中得獎的人來說,肯犧牲腦汁去換取數百字之便宜,周瑜打黃蓋(跟這有何關係),也無可厚非。但一般使用者應當不必依靠之,單以正常規則來取碼,即可得到相對較快、足以應付一般情況有餘的速度。要是一套輸入法不斷強調這些簡速碼,其實側面反映了它的編碼設計本身有缺陷,不靠這些例外難以達成高速輸入。如果你喜歡簡速碼,想背簡速碼去提升速度,在輸入比賽中得獎,可以學大新倉頡、快倉等改良版。大新倉頡還創了全球最高速的紀錄。若不需要,單是學習原版倉頡,已足夠日常應用有餘,不難達到頗高的速度。
(大新倉頡是收費的,學大新並不是解決倉頡速度慢的方法,而是要讓人們接受稍慢的打字速度。)
文章才寫了一半,篇幅已等於同系列文章的整篇,還是先擱筆一會兒。下一篇繼續說牟利輸入法對倉頡的攻擊,與我看到的眞相有甚麼差異。
— 2016/02/07 22:33 +0800
♪ 本作品以Creative Commons 署名-非商業性-相同方式共享 4.0授權條款授權。
1) 詳見筆者的〈我學中文輸入法(三)〉、〈我學中文輸入法(四)〉。
2) , 3) 詳見筆者的〈我學中文輸入法(四)〉。
平反倉頡(下)
續上篇,一郎繼續說我看到的眞相,到底跟牟利輸入法對倉頡的攻擊文宣有何分別。
文宣:我們的輸入法重碼率或選字率很低,適合盲打。(我真懷疑有哪個文宣會這樣攻擊倉頡)
眞相:依實際數據分析1),倉頡輸入法才是重碼率最低的,這和它的取碼設計有關2)。如此宣稱的牟利輸入法,它們的重碼率可能一點也不低,或者依靠簡速鍵等「官方外掛」來達成低重碼率。甚至連「重碼率」一詞都要迴避,取巧地改用「選字率」或「加用第一及第二選字鍵即時選字後」來計算,玩弄語言僞術。
文宣:我們是最具國際觀的,能夠輸入多國語言漢字,貫通正、簡、日,外國人也適合學習使用。
眞相:倉頡早就支援超大漢字集,無論是Unicode,還是朱邦復先生那收字更多的「倉頡系統」,編碼都老早就公開。對倉頡來說,不論正、簡、日、韓,所有漢字都地位平等,在相同模式下,按同一套拆碼規則輸入,重碼率還很低。因爲在設計字碼階段時,朱邦復先生已顧及這問題,像「場、场」、「穗、穂」或「營、营、営」等字組,都不重碼。
相反,有些宣稱自己支援大字集,卻不見支援Unicode的官方編碼,只有民間擁躉補完。更甚者,那些輸入法,字根不區分正、簡、日寫法,例如「釒、钅」或「貝、贝」等正簡字組,組內彼此間都歸入同一主根。輸入法過去甚至慣以拆簡體字的碼,來輸入正體字,當要同時輸入正簡字元時,就會構成嚴重重碼。結果,它必須區分開正體模式、簡體模式、日韓模式,要麼只能出正體字,要麼只能出簡體字,要麼只能出日韓漢字,無法同時輸入各種寫法的漢字。這根本就是沒有國際觀,不能同時支援多國語言裏的漢字。更莫說還有許多語言並不使用漢字,支援漢字並不等於支援多國語言。
文宣:不論你怎麼寫,用甚麼字形來拆碼,我們的輸入法都支援。倉頡卻不支援異體字。
眞相:倉頡並非不支援異體字,在「倉頡系統」中,異體字有不同編碼,使用者以哪個寫法來取碼,就能輸入該寫法的異體。例如以「竹人木手弓」得出「衛」字,用「竹人木月弓」鍵入「衞」字。本來中文系統就不應該排除異體,應該像倉頡系統般,讓使用者輸入不同的寫法3)。看我在《刻石錄》上的「說文:字形篇」,那些指責作業系統逼迫他人用臺標寫法的文章,就知這問題令中文使用者多麼懊惱,連使用心目中寫法的字形之權利都遭剝奪。然而,過往市場上的正體中文作業系統,都採用不支援異體的Big5編碼,削去了倉頡支援異體的功能。現在Unicode,支援部份異體字,像上述的「衛」與「衞」,它們已立即能夠用倉頡輸入。但Unicode也合併了的異體,例如「令」字,就無法支援較符合字理、下方從「ㄗ」的寫法,這不是倉頡的錯,是Unicode、Big5編碼的錯。改用倉頡系統的話,兩個「令」字皆可正確輸入和顯示。
至於過去那些宣稱支援異體的輸入法,其實只是讓你想着異體來拆碼,卻打出Big5中的臺標字形。你明明想打「衞」字,拆碼正確,卻變成系統裏的「衛」字,顯示不正確。若需要這樣的倉頡,以往在DOS裏運行的國喬系統就有,許多改良版的免費倉頡也有提供,使用者都可以合法地取得、安裝和使用。「不支援異體字」,只是「依Big5版本的倉頡」之問題,不是倉頡本身之問題。
再說有些標榜支援異體的輸入法,連明顯是錯別字的寫法也「支援」。好像「眔」字,粵音「踏」,北音「dà」,「懷」、「鰥」等字從之。有輸入法卻當成是「眾」字的異體,拆「眔」形出「眾」字。這又是否好事呢?
(以上幾個文宣,都不像是在攻擊倉頡,沒有任何攻擊力,ichirou何必挑這些出來回應?)
文宣:倉頡沒有容錯碼、簡易的符號輸入碼、假名或諺文輸入、同音字功能、萬用碼功能、打正出簡(或打簡出正)功能、詞組模式。我家的有啊。
眞相:許多改良版倉頡都添加了這些功能,喜歡甚至在意它們的使用者,可選擇這些改良版。甚至我可以說,即使沒有任何改良版本令你滿意,但倉頡發明人早就公開宣佈放棄版權,你可以用他的編碼表去改良,自製合你心水的版本。隨着系統更新,即使是作業系統的預設版本,也加入了部份功能。這些新增功能,並不影響原來輸入法拆字編碼之優劣評價。要動用這些來作攻擊倉頡的武器,是否在主體上輸給別人,就拿無關宏旨的東西來攻擊呢?
文宣:我們是首創唯一只用二十六個英文字母的中文輸入法,智能電話系統也能用。
眞相:倉頡字母只用二十五鍵,還留下了「Z」鍵作特殊功能用。也一樣能用於智能電話系統中。
文宣:倉頡造就了專家權威、培訓中心老師飯碗和收入保證、手寫筆廣告的媒體收入等「好處」,其他輸入法流行起來,就會把這些都「破壞」了,所以要保住倉頡。
眞相:這種純粹訴諸人身攻擊(或曰「『輸入法身』攻擊」)的言詞,不看也罷。我學倉頡,只靠一本價錢相宜的好書。付出一次,受用終身。有些人單靠網上一些編寫得好的敎學,例如維基敎科書上的敎程,也能學得很好。相反,作出這種攻擊的輸入法,它本身是有專利的,不向該公司購買就不能使用,每次更新作業系統,又要等那輸入法出新版,再花錢購買。甚至連敎材都是那公司獨家的,不許其他「外人」編寫,許多獨門技倆都只在敎材上才談及4)。精明的消費者,到底是誰在打你錢包主意呢?
文宣:倉頡有版本差異,出了新版本後,過去的學習者就要跟舊版一起「共存亡」。
眞相:倉頡是開源的,出了新版並不會取締、消滅舊版。即使出了新版,使用者也可繼續合法、免費、方便地使用過去的版本;即使增新了輸入軟件,也仍會繼續合法、免費地支援過去版本的倉頡編碼。而它流通過的,只有三代及五代,兩者間差異極少,亦隨處都有合法、免費、方便的輸入軟件支援,誰都可自由選擇使用哪代的編碼5)。相反,作出這種攻擊的輸入法,它本身是有專利的,只要公司推出新版時,改變了舊版編碼,不再支援,那麼使用者就眞的要與舊版一起「共存亡」。而有關公司也眞的做過這種事,例如在新版本中改變過簡速碼、放棄過舊版本使用的簡速字根等。使用者除非堅持不升級,並且確保他那臺電腦永不壞掉,否則就只能跟隨公司的新版,改變過往習慣。由民間擁躉編寫的査碼網站,更因此而要列出不同版本的編碼,對學習者帶來不便。
寫了一大堆,算是爲坊間不實指控平反一下。各位讀者別誤會,我不是要主動攻擊其他輸入法。寫這文章,也只是看不過眼倉頡飽受無理攻擊,希望以親身體驗到的事實,平衡一下外間那傾側且失實的言論大氣。輸入法這回事,跟人的習慣有關,可說是百貨應百客。因此即使我在文中批評過該輸入法的缺點,但你覺得合適自己的話,請繼續使用它、喜歡它,我對此絕對尊重。只是若眞的要討論,我希望無論哪方都能以事實和公理作依歸。要是你還未接觸中文輸入法,現在或將來要挑選,我更希望你能具有慧眼,不要受像上方那些失實文宣所蒙蔽。
— 2016/02/08 20:57 +0800
♪ 本作品以Creative Commons 署名-非商業性-相同方式共享 4.0授權條款授權。
1) 見泰瑞:〈老話一句:不要學嘸蝦米,學倉頡!〉。
2) , 5) 詳見筆者的〈我學中文輸入法(四)〉。
3) 有人擔心此擧會令搜尋資料時變得不便。其實,系統只要在搜尋時,設有一併搜尋異體字的功能即可。
4) 別跟我說那種輸入法很容易學,根本不需要敎材。若是如此,它的公司都在公開銷售敎材,不就是等於承認它在賣垃圾騙錢麼?
尹評
ichirou找了這麼多「文宣」來反駁,看來對倉頡確實是情有獨鍾。然而他的「文宣」都挑的不對,第一篇只有一半是真正攻擊倉頡的,第二篇基本都沒有在攻擊倉頡。我也不知道他到底是去哪裏找的「文宣」,用什麼標準去挑。
ichirou是個性情暴躁,缺乏耐心的人,溝通能力也很差,不太懂如何回覆他人的質疑。因此他的回答都像是在自言自語,說服不了任何人。
比如有人說倉頡最長五碼,速度慢。ichirou就全盤反駁,這樣做非常失策。他應該承認倉頡碼長很長,速度稍慢,倉頡的四碼和五碼字確實佔了大部分,所以適合不求打字快的人用。
如同寫字,有人喜歡寫快以致字跡繚草,有人願意一筆一畫的寫以使字跡清晰好看。
ichirou如果對倉頡的缺點一概否認,也講不出令人信服的道理,反而會被人懷疑他對倉頡是否有足夠的了解。根據我此前對他的評論,ichirou對倉頡規則的理解是錯漏百出的。
比如他說「未來要做大版本改動,就把『羗』定為連體」,說明他是用外圍繁複論來判定一個字是否為連體的。然而外圍繁複論已經被證明是一個錯誤可笑的理論,「羗」正是它的反例。
再如他此前親自發表的「剪刀原則、鴨脖字元、咼商一致、韭取廿廿廿一」等,展示了他奇特怪異的說理方式。如果他連倉頡規則都搞不明白,那他又有何資格去反駁他人對倉頡的質疑?
因此我們會看到,當有人提出倉頡規則很龜毛時,ichirou就拿大新倉頡來當擋箭牌,正說明了ichirou根本不懂怎麼反駁。
人家說的是倉頡規則很龜毛,跟大新倉頡完全是兩碼事。大新倉頡是對倉頡的改良,它是增加了規則,而非簡化。怎麼能說要用大新倉頡來解決倉頡規則的問題呢?
ichirou意圖使用的詭辯技巧是,大新倉頡也是倉頡,倉頡也可以是大新倉頡。倉頡只有優點沒有缺點,只要談到倉頡的缺點就把大新搬出來。而大新倉頡雖然有「收費、閉源」的缺點,但倉頡又是開源免費的。
ichirou的這種流氓手法很快就會被識破。據我了解,絕大多數的倉頡使用者都沒有在用大新倉頡,包括ichirou本人。說明大新倉頡本身並沒有那麼好用。
ichirou在說別人不講道理時,自己也在用下流無恥的方式回擊。他這樣做能改變多少人對倉頡的看法呢?
第三頁中的「戲肉(或稱戲玉)」是粵語詞,用來形容故事最精彩、最值得觀賞的部分,見https://words.hk/zidin/戲肉
,懂粵語的人應該知道這個詞。
原來如此!不過我從小說粵語,倒是第一次聽說這個詞。
ichirou有喜歡硬造生詞的愛好,因此他的文章多有奇怪的詞語和句式,比如「監人乃後」之類的。他把這些自造詞,以及方言詞寫進他的文章,他以為能增加文章的厚度,結果卻是語句不順,表意不明。
「監人乃後」這個詞我聞所未聞,我看他的斗章也有一头霧水的感觉
我看了這篇文章,我有個想自創形碼的想法,起因是我進了Rime群,看群友用的形碼五花八門,碼長又很短,重碼又不多,我就試著從他們吸取經驗,自己也想弄一個。
我當初在做哈哈倉頡時,也體會到一個輸入法創作的艱辛。比如當幾個字成為重碼時該如何調整。
你看到了什麼優秀的形碼,也可以發到論壇,我們來共同品味一下。
除了倉頡之外,所有的形碼都需要補碼。鄭碼的雙編碼其實也算是一種補碼。所以我認為哈哈倉頡已經是形碼的頂峰,既不需要補碼,碼長又短,高頻字置前。哈哈倉頡具有倉頡的優點,又解決了倉頡的缺點。我在做完哈哈倉頡之後,就不再考慮換輸入法或做新的輸入法了。如果你認為現在有比哈哈倉頡更好用的形碼,歡迎拿出來對比一下。如果你做出了比哈哈倉頡更好用的形碼,那我也很期待。
當然「好用」因人而異,有時他喜歡的就好用。我自2012年起,十幾年來一直用著難用的倉頡,因為喜歡倉頡,所以不覺難用。而當我用上了哈哈倉頡,才願意承認原版倉頡確實難用。