致泰瑞的一封公開信

前段時日我跟泰瑞來回互寄了幾封郵件,後來我想公開這些郵件,但我也承諾了如果他不同意,我是不會公開這些郵件的。

泰瑞不同意公開,他列出了四條理由來解釋他為什麼不同意,同時泰瑞在他最後的兩封信裏面都說了以後不再回覆我的郵件。

因此我只好寫封公開信,因為寫公開信是所有人的自由,不受任何限制,也不用期待回信。

評論泰瑞

泰瑞是一個廢話連篇,言不及義的人。(為什麼用倉頡的不少人都有這個毛病?)

Read more

「字元」是個很好聽的名稱

「元者始也,字之元始,謂之字元。」

倉頡官方手冊只給出「中文字母」和「輔助字形」這兩個名稱,而這兩個合起來應該稱什麼,官方竟然沒有說法!

我把二者合起來叫作「倉頡字元」,來源於我個人的獨立思考。我認為這是最好聽的名字,名副其實。

Read more

為何藍兒做的四碼倉頡沒有人用?

2023年4月25日,藍兒在大馬倉友發表了一個帖子:

馬屁警告

標題:四碼倉頡

來源:
https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195740

Howing 發表於 25-4-2023 17:46:55

本帖最後由 Howing 於 10-5-2023 02:16 PM 編輯

見到「四碼」二字,相信各位都想到大新倉頡,無錯,基本上可以理解為大新倉頡,但據個人喜好修改,略有不同。

網上已有大新倉頡碼表下載,何解鄙要多此一舉再去費時費神編一份碼表呢?鄙使用倉頡也不算短時間,不時好奇想玩下大新倉頡,但試過之後發現有好多不適應地方(僅個人感覺),多次有主要使用大新倉頡的想法最後還是很快放棄。

不適應的地方主要有以下幾點:
一、無簡化字相應編碼,不能實現真正的繁簡通打,如「頡」編碼為「土口一金」、「颉」編碼為「土口一人」;
二、收字數量未滿足到鄙日常使用,如「𥄫」、「𦣇」、「𨋢」;
三、部分字只有臺灣標準字形的編碼,或者講支援字形編碼單一,如「電」只有「一月田山」編碼,不支援「一月中山」香港字形編碼;
四、「丟」、「吞」等字不能按其實際字形編碼「一土戈」、「一大口」打出來;
五、部分候選字順序有點不恰鄙心水,如「人戈竹戈」的候選字「餽」和「餓」,「水日日」的候選字「淐」和「澗」;
六、沒有原版倉頡的標點符號編碼,如「,」的編碼「zxab」、「。」的編碼「zxad」;
七、鄙習慣倉頡的低重碼率,鍾意候選項簡潔,一般候選字無重碼,最多也就两三個重碼。比較少用到大新倉頡裏面的網址、序號、注音符號、標點符號等。

出於好奇想玩但又因以上幾點,萌生整一份自用碼表的想法,工程不小,全靠手動操作。試打了幾次繁簡常用字感覺還算能用 ,只有好少部分常用字重碼,少了一碼感覺幾爽下,不喜煩請勿噴,個人倉頡水平和精力有限,如有錯碼或有需要改善地方還請倉頡大神多多指點(鄙只檢查過7072隻常用傳統漢字以及6763隻常用簡化漢字的編碼) 。

本自編版本是在「倉頡三代補完計畫」之cj3-special基礎上修改的,非常感謝該項目作者,分享如此完善的原版倉頡碼表。

本自編版本取碼說明:
一、整體字:最多取3碼(3碼及3碼以下全取;超過3碼則取第1、2碼及尾碼)。例:「為」取「戈大火」,「事」取「十中弓」
二、組合字:字首最多取2碼,字身最多取2碼。例:「語」取「卜口一口」,「個」取「人田口」
三、需考慮包含省略規則。 例:「練」取「女火木田」,「過」取「卜月月」
四、另外「與、興、輿、舆」等字取1、2碼及尾碼也可取1、3碼及尾碼。例:「與」取「竹難金」或「竹卜金」,「興」取「竹難金」或「竹月金」
五、加入部分簡碼。

只採用了大新倉頡其中幾種規則,既可減短碼長,又能讓原版倉頡用戶輕鬆上手,無過多變化。

個人認為(真的僅個人認為)本自編版本優點有:
一、純單字;
二、收字更多;
三、增加简化字相應編碼;
四、增加標點符號相應原版倉頡編碼;
五、編碼源于「倉頡三代補完計畫」之cj3-special,編碼更完善、支援更多字形。

rime格式方案及碼表下載連結(或見附件):
123雲盤下載地址https://www.123pan.com/s/aeO9-et4sA.html
藍奏雲儲存下載地址https://wwdt.lanzout.com/b022lr6uj密码:ex2g

為方便網友,已用冰凌輸入法平臺內建本版倉頡及原版倉頡(軟件預設為倉頡三代,可以切換方案),免裝便擕版下載連結:
123雲盤下載地址https://www.123pan.com/s/aeO9-tt4sA.html
藍奏雲儲存下載地址https://wwdt.lanzout.com/b022lr6ze密码:6121

為什麼Howing(藍兒)發表的四碼倉頡無人問津?

原因分析如下:

一,藍兒兩次重重的拍馬拉錘的馬屁,使人感到非常噁心。

Read more

到底騎沈四傑的複合字首名單中有沒有屎?

曾經,馬拉錘跟ichirou把「瘸」當成「有義字形」的反例。

馬拉錘跟ichirou其時已經密謀許久,二人早已成為了好朋友。

然而二人在大馬倉友上假裝不熟,為反對有義字形發表了他們的觀點。

首先馬拉錘找到了「瘸」字,之後ichirou協助「證明」了「瘸」的字源確實是「痂/肉」而非「疒>(加/肉)」。

Read more

簡評騎沈四傑與補完計劃

歷史上,受到不公平對待和評價的大有人在。

戰國時期,楚國的屈原具有極高的智商和良好的德行,但是被同朝奸臣的排擠誹謗,因而遭到流放。不久之後楚國就滅亡了。

美國總統川普,被左派媒體大肆攻擊誣蔑,但是他頂住了所有的壓力,並再次當選總統。

倉頡輸入法的發明人朱邦復,他受到的攻擊還少嗎?當他將要拿到政府的訂單,有多少人眼紅?

現在騎沈四傑對我進行惡意造謠抹黑。我尹卂是一個正直的人,但是勢單力孤。在一段時間之內,騎沈四傑是成功的,但是我相信,正義可能會遲到,但是絕對不會缺席。

Read more

批馬拉錘「無頭倉頡」

2023年4月4日是一個重要的日子,這一天,愚蠢可笑的馬拉錘發表了他的傑作:無頭倉頡。

廢話警告

倉頡Rhapsody:不分割字首字身的倉頡

作者:馬拉錘

發表於:4-4-2023 22:38:53

文章地址:https://www.chinesecj.com/forum/forum.php?mod=viewthread&tid=195719

雖然普通人可能一無所知,但鄭碼在形碼輸入法界相當有名。

它之所以有名,是因為它首先采用了一種非常不同於其他輸入法的思路。

以「鵏」為例。

大易輸入法是這樣取碼的:
先取出「甫」,「甫」在「6」鍵。
再取出「鳥」,「鳥」在「H」鍵。
因此得出取碼「6H」。

五筆98是這樣取的:
先取出「甫」,「甫」在「S」鍵。
再取出「鳥去掉灬」,「鳥去掉灬」在「Q」鍵。
再取出「灬」,「灬」在「O」鍵。
最後,根據末筆筆形和字形結構補一識別碼。
得出取碼「SQOY」。

但鄭碼輸入法是這樣取的:
先取出「甫」,「甫」雖然在「F」鍵,但是需要用「FB」代表「甫」。
再取出「鳥」,「鳥」雖然在「R」鍵,但是需要用「RZ」代表「鳥」。
得出最終取碼:「FBRZ」。

最後還想提關於五筆86的一些設計。
一些人在學習五笔86時,抱怨為何五笔86的字根要「缺胳膊少腿」。例如,Q鍵上的一些字根就非常典型,「犭」沒了「丿」,「鱼」沒了「一」。
看了上面的幾樓,大家不妨考慮一下這樣設計的理由。假如這些字根不「缺胳膊少腿」,那麼「猎」和「䱜」和「𱇷」、「狗」和「𬶋」和「鉤」、「钓」和「魡」和「𬶄」、「鯉」和「鲤」和「狸」和「锂」和「鋰」…都會重碼

所以,五筆86通過「缺胳膊少腿」的方式,在這幾個部首上模擬了雙編碼。儘管五筆86是公認的單編碼輸入法,但在這幾個部首上卻有雙編碼的特性。

因此,現在
「鲤」取「QGJF」。
「鯉」取「QOJF」。
「锂」取「QJFG」(G為識別碼)。
「狸」取「QTJF」。

但是,由於五筆本質仍然是單編碼輸入法,所以「鋰」和「锂」仍然是要重碼的。

這種設計同樣是有缺點的。因為五筆86打二字詞取每個字的前兩碼,所以「狡猾」、「狼狈」、「狐狸」等字都是「QTQT」,造成大量的重碼。也就是說,在這裏,王永民為了打單字時的方便,捨棄了打詞時的一些方便。

雙編碼的設計,包括倉頡的隱式雙編碼同樣不是完美的,存在一些缺點。這些,也許下次再聊。

蘋果在20世紀末,通過引入NeXTSTEP系統,將其完全定製成Mac OS 9的模樣,作為測試版發佈出來,這個Rhapsody,就是OS X的前身,可以說是一次徹底的改變。

因此,我在這裏也想借用Rhapsody(狂想曲)的名稱,來命名這個倉頡,它就叫倉頡Rhapsody,或倉頡狂想曲。

有些人會感到很奇怪,為什麼要給一個字根兩個編碼,這不是徒增煩惱嗎?

感到疑惑的大家不妨考慮這種情況,如果我們把「礻」和「衤」都放到倉頡的「L」鍵上,會出現什么結果?

很顯然,大量的字會出現重碼,例如
LSH:「𥘉」、「初」
LLWL:「神」、「𫋵」
LG:「社」、「𬡃」
LL:「祌」、「衶」
LOII:「𮁣」、「袊」
………

我們稱這種重碼為「結構性重碼」。

漢字部首繁多,不同的字可能像上例一樣,擁有不同的部首,但其餘部分完全一样。這給輸入法的設計帶來了很大的挑戰。因為,不同的部首,尤其是下轄的字特別多的部首如果放到同一鍵,很容易「撞車」,出現「結構性重碼」。

很不幸的是,美式鍵盤上的拉丁字母只有26個,即使把數字和符號鍵利用於輸入,也只有40多個鍵。但是根據《康熙字典》,漢字有214個部首。假如把這些部首都放到鍵盘上,結構性重碼豈不得上天?即使捨棄掉一些部首,常見的部首仍然非常之多,非常容易撞車。

那怎麼辦呢?

鄭碼採取了一種非常聰明的方法。部首可以在同一鍵上,這個鍵被稱作「區碼」。比如在鄭碼中,「礻」和「衤」都在「W」鍵上。
為了區分它們,鄭碼給它們增加了一個「位碼」。「礻」的位碼是「S」,而「衤」的位碼是「T」。
所以,「初」的完整編碼是「WTYD」,而「𥘉」的編碼是「WSYD」。因此,雖然「礻」和「衤」同佔一鍵,重碼被完美地離散開來。

所以,鄭碼用1至2碼來代表一個部首,這做法相當於模擬了26*26鍵的鍵盤,在這個鍵盤中,組字能力強的部首可以找到它們的去處,不用再撞到一起去了。這種設計被稱為「雙編碼」。

這種設計是非常高明的。因為,這樣設計意味着簡繁部首有區分開來的可能。對於普通的輸入法而言,「設」和「设」幾乎必定重碼,但雙編碼的輸入法則有可能不重碼。只要給「言」和「讠」不同的位碼,它們就可以被區別開來。

雖然鄭碼在設計時並未認真考慮離散簡繁這一點,但是後來許多輸入法借鑒了鄭碼並做出了改進,如徐碼。

有人可能會想到,倉頡輸入法在手冊裏並沒有這樣規定,那麼倉頡是單編碼輸入法嗎?

和表面上看起來的不同,倉頡也是一種雙編碼輸入法。

我們可以想一想我們是怎麼取碼的。首先,我們要先一刀割出字首。儘管字首不等於部首,但是字首經常是一個部首。

然後,我們給字首取碼,最多兩碼。
例如,「課」的字首是「卜口」(YR)。
再例如,「课」的字首是「戈女」(IV)。

我們很容易發現,「言」在作字首時會有兩碼,而且和「讠」不同。
對比鄭碼,我們會發現倉頡雖然沒有作出雙編碼的規定,但一個部件在字首和字身時往往會取固定的編碼,如果把這些編碼列出來,就非常類似於鄭碼的字根表。只不過,這並不要求任何的記憶。倉頡以小字根、字首字身這種很靈活的方式實現了雙編碼。

倉頡的做法有其優點。

通過這種做法,學習倉頡時只要記憶一個很小的字根表就夠了,不用記憶龐大的雙編碼字根表。而且,區分字首字身意味着檢索上有其優勢。例如,字身為「HAF」的字很可能就是帶「鳥」的字。

但是,這種做法同樣有其劣勢。
當一個字為上下形字時,字首字身的划分顯得很麻煩。 例如,「玄」是組合字就很容易令人感到迷惑。
再例如,細微的字形變化也可能導致字首字身出現改變,「無」就是一例。

為了解決這個問題,蒼頡檢字法規定上下型字僅在幾種特殊情況下當成組合字,否則一律作為整體字。但這種做法也有缺點,因為漢字實在太複雜了,幾種特殊情況何時適用又會造成爭議。

不能採用大字根是這種方案的優勢,也是劣勢。因為細微的字形變化就可能導致取碼改變,由此導致重碼增加。

由此,我生出一種想法,即利用鄭碼的規則,但將字根表中的區碼-位碼換成倉頡的頭尾碼。

例如,「贝」在鄭碼中取「LO」,但倉頡頭尾碼是「BO」。
「足」在鄭碼中的區位碼是「JI」,但倉頡頭尾碼是「RO」。
通過這種置換,倉頡字根表退化為一種助記方式,鄭碼也套上了倉頡的皮。
由於鄭碼不用分割字首字身,所以這種方式製造出來的「倉頡」也不用劃分字首字身了。

於是,我通過修改鄭碼的字根表,自動編碼後得出了以下的編碼:

個 owjr
倌 ojrr
倍 oyr
倎 obtc
倏 olki
倐 olhf
們 oan
倒 omln
倓 off
倔 osuu
倖 ogtj
倗 obb
倘 ofb
候 olso
倚 okmr

可以看到,上述的編碼和倉頡原編碼有很大的相似度。

通過這種方式,原倉頡用戶可以很快地學會這種方案。

但是,我又發現鄭碼的一些編碼方式,尤其是在三基根字中可能會造成比較嚴重的繁簡重碼,與原版倉頡也相差較大。

例如,按鄭碼規則,

「測」→「氵貝刂」,如果套用倉頡的頭尾碼,全碼會是「E BC LN」,簡省後是「EBLN」(水月中弓)。

「测」→「氵贝刂」,如果套用倉頡的頭尾碼,全碼會是「E BO LN」,簡省後是「EBLN」(水月中弓)。

兩者出現重碼,也和原版倉頡有一些差異。

但如果修改成三基根字取頭+頭尾+尾的話,就會是「EBCN」(水月金弓)和「EBON」(水月人弓)了,不仅和原版倉頡一致,還避開了重碼。

按這種規則,上述示例的編碼是:

個 owjr
倌 ojrr
倍 oytr
倎 obtc
倏 olki
倐 olhf
們 oan
倒 omin
倓 off
倔 osuu
倖 ogtj
倗 obb
倘 ofib
候 olso
倚 okmr

 

尹評

命名

首先評論它的命名,馬拉錘把它命名為「倉頡Rhapsody、倉頡狂想曲」,這符合了馬拉錘一貫的搞笑風格,但不太好記。既然馬拉錘宣稱這是一個不用分割字首字身的倉頡,那麼往下我將把它稱作「無頭倉頡」。

最大的問題

無頭倉頡最大的問題就是:它並沒有做出來,而是只寫了篇語氣活潑的介紹文章。

Read more