ichirou於2024年五月被台灣網友群攻

原本我是不知道這件事情的,ichirou如果不寫文章講述此事,那麼這件令ichirou臉上無光的事情可能就湮沒在歷史的洪流中。

ichirou親述:

expand

短短三四天,我的Twitter上一片混沌,無數的瘋子拿着利器肆意起舞,我不得不封鎖人,短短兩天就封了逾百個,比那時有大陸粉紅召喚網軍惡意燒我還多。

原因,只不過是5月2日晚上8:20,在Twitter上發了張帖,說:「看着現在一些不學無術的臺灣人玩『支語獵巫』……看着現在一些臺灣老師……」,並附上照片,拍着有臺灣老師在批改學生功課時,標起學生寫的「估計」二字,寫道:「別用中國用語比較好」。以及附上他們教育部的《國語辭典簡編本》「估計」詞條的擷圖。這張帖,我當時也在本專頁上分享給大家。

而我會發這樣的帖,是因為這一兩個月來,在網上社交媒體看到極多偏激臺灣人「支語獵巫」的例子。諸如「集郵」、「軟件」、「手袋」、「衛衣」、「連身裙」等等,在香港或其他中文地區習用已久的詞彙,都被極端臺灣人誣衊成「支語」——所謂「支語」,他們指的是中共治下的大陸地區那些特有用詞,而且這些用詞是被視為沒美感的、拙劣的甚至有入侵性質的。「支語」一詞是用來貶低這些詞語的。

長期追看一郎專頁的朋友,應該會知道一郎喜歡優美的中文,但反對獵巫。那些中共拙劣的政治用語,例如所謂的「黨八股」,動不動就甚麼「硬道理」、「堅決打擊」、「加大力度」、「偉大領導」、「邪惡敵人」之類秒秒腎上腺素爆錶的。或者一些以粗疏、籠統、不準確說法取代原有、地道且準確、精緻的說法,例如不分「建立、製造、建設、營造、經營、發展」全都用「打造」,放棄「維修、改善、升級、除錯、修繕、改良」全都寫「優化」,不理「英俊、瀟灑、嬌俏、華艷、清秀、標緻、俊朗」只知「顏值」等,一郎都不認同。又,如果一個外來語或罕見說法,在本地原有說法中已完全能表達,而那個外來語或罕見說法甚至會令人誤會,或者與本地用法有衝突,我們當然也必須慎用,可免則免。來自劣質翻譯,違背美感的異化用例,亦應提防。站在粵語的角度,我們也應該警惕違反粵語發音的音譯。

不過,一種語言,只要不是被鎖進博物館裏、已經滅亡,而是活着的、獲人群廣泛使用的,它必然會有變化,也必然會與其他語言有交流。用語的新陳代謝,詞彙的吸收與輸出,只要不是上段所述的情況,本身就是正常且健康的現象,證明那種語言仍然是生生不息的。尤其是若新詞彙或說法,能引進新概念、感覺、筆觸或情緒,或者能方便文學上的顯詞造句,帶來一些既有說法不足表達的美,而它也不是把既有用詞淘汰掉,只是增加一個選項,我們着實不應神打般「師傅上身」排斥、攻擊甚至批鬥。自千禧年代香港人反對「蝗語」之時,一郎已說過類似的話。

現在那些偏激臺灣人的「支語獵巫」,比那時候還變本加厲。他們只要在繁體中文網絡裏,看到臺灣人(或者只是他一個人)不太常見的、較陌生的用法,就亂扣帽子罵作「支語」。他們罵的時候,絲毫不覺得自己有半毫子的查證責任。明明身處在網絡長城以外,只要花三五秒的時間Goo一Google就能找到的真相,他們都拒絕看。總之他們主觀上是這樣,就高舉他們的偏見,不肯摘下他們的有色眼鏡,動輒把其他地區的正常用詞也抹黑作「支語」,而且不容許有人反駁,不肯看其他人呈現給他們看的真相。他們要坐井觀天,說天空只有這麼少,連其他人把井口外的天空投射給他們看,他們也只會找藉口臭罵那些人,令自己站在真相的對立面。

於是,我出了這樣的一個Twitter,然後我的Twitter就炸起來了。無數極端臺灣人湧進來,堅持說「估計」就是「支語」,不帶半點兒理由。不少還人身攻擊我,罵我是「港支」,甚至有人罵我是死宅男,有人罵我是妓女,創作力量同幻想會嚇你一跳。

因為我相信理性對話,抱著「我不同意你的觀點,但我捍衛你理性發言的權利」這信念,因此一開始,我不但不封鎖他們,更嘗試找一些相對附上一點理由或解說的發言者回應,希望曉之以理。結果我失敗了,連一個成功案例都沒有。於是我不得不封鎖這些存心鬧事的人,一開始時我會複製他們逾越理性底線(包括拒絕面對事實證據堅持造謠或堅持失實說法、人身攻擊甚至以陰謀論來抹黑誅心等)的tweet文連結,以留下證據,並擷圖張貼出來,證明自己不是隨便封鎖。未幾,我已儲下了逾百個連結,著實沒時間了,唯有直接封鎖。到此刻,到底我封鎖了二百人?三百人?還是更多?我已經沒有再點算,沒時間。

而那些令我誤以為會說點理由的人,通常是回應我指「估計」一詞臺灣也有用,但只會用在估計數量之上,不會用在其他事情的猜想、推測或判斷。有些人說《國語辭典簡編本》的例句是說演唱會「估計有三萬人參加」,證明了他們的說法。然而,詞彙的用法是多元的,任何詞典的例句都沒可能包山包海,把所有運用層面都寫成例句。同樣是他們教育部編撰的《重編國語辭典修訂本》,在「估計」詞條中,就直接有「推測」這一個義項,例句是:「我估計他今天不會來。」無奈地,我或其他有識之士據此反駁後,偏激臺灣人就說《修訂本》會收入大陸用語,不能作準。

於是我再列出其他並非中共管治下的例子。我選了魯迅翻譯鶴見祐輔的《思想.山水.人物》之用例,證明以「估計」作推測用並不是「支語」。此書出版於1928年,即民國17年,其時,甚至魯迅去世時,中華人民共和國可還沒有誕生。我不是說魯迅的文筆很好,但他畢竟是五四文學的代表作家,他的例子證明在中共出現前,已有著名作家這樣用「估計」,客觀事實擺在眼前,不可能把「估計」扭曲成「支語」。豈知他們沒有一個人肯直面此事實,只會執迷不誤地狂吼甚麼「就支語啊,魯迅就是支人」,或者堅稱魯迅不是臺灣人,所以魯迅寫的不是臺灣用語,於是就是「支語」——在偏激臺灣人眼中,彷彿認為全世界只有臺灣人使用繁體中文,全地球上使用中文的,也只有大陸與臺灣這兩個地區。於是,「非臺即支」,只要不是他們在臺灣看慣的用法,一律批鬥作「支語」。明明客觀事實,是在中共中國與臺灣以外,還有許多地方的人,說著、寫著大家的自然地道中文。但即使把這些事實羅列到他們眼前,他們依然會堅拒去看,用自己荒謬至極的反智說法扭曲眼前的事實,企圖以自己的FF(幻想)凌駕事實、篡改真相。

甚至連我原tweet,寫「看着」,不寫「看著」,也遭指罵:「這關支那人啥事?用繁體字還用不全,『着』的繁體字沒學過嗎?」偏激臺灣人不知道,在香港,在不少使用中文地區,二字一直分工,減少歧義,讀去聲的用「著」,讀入聲的用「着」。自「着」字分化出來後,古代的文獻也有這種分工。以前臺灣也這樣用,只是後來教育部稱「着」字是俗字,把它廢除,才剩下「著」字,開歷史倒車。而早期中文電腦使用臺灣製訂的Big-5編碼,當中沒有「着」字,才令以電腦打字的香港人不得不遷就。

回說「估計」。誠然,這樣用的作家不只魯迅,有理智的網友就指出,臺灣作家也常常這樣用「估計」,比如吳曉樂(吳珊珊)、陳茻等。甚至連那些偏激臺灣人所崇拜的政黨,有好些代表人物,都在公開發言時,這麼使用「估計」一詞。不過最有威力的回應,還是直接在那些偏激臺灣人的Twitter上,找尋他們昔日這樣用「估計」的例子,以子之矛攻子之盾,讓他們吃回力鏢。

他們中回力鏢後,有些選擇性失明,假裝看不到、不存在,奉行鴕鳥政策。有些不斷砌詞狡辯,比如有個叫「🖤一米五戰鬥直升機❤美人廚阿妖初號機💙骸樣💜松潤🍥」(Twitter帳號:ADSL_47)的,寫過「這個連假我買了新耳機。谷主越看越心動,表示也想買一個情侶款XD。不過他頭太大了估計沒辦法」這樣的Tweet文,被網民揭發後,他卻狡辯稱「頭圍大小用估計怎麼了嗎」。明明他這句中的「估計」,是說「估計沒辦法(購買情侶款新耳機)」,卻強辯成是說「估計頭圍大小」,無視語法。更有些會語無倫次,精神錯亂。例如一個叫「A in brissie 🧋🧋🧋」(Twitter帳號:ice31004)的,起初看到我舉出的魯迅書證時,仍堅稱「是支語啊」,並聲言:「我不會用也沒聽過台灣人常用估計」,如此云云。結果大大聲說「我不會用」的他,被網友搜出他的過往用例後,亂喊甚麼「我沒說我沒被支語影響耶」、「貼我以前的言論不代表我認同支語」,反罵其他網友「閱讀能力好像有問題」、「是你理解力有問題」、「繼續崩潰吧不用溫馨提醒」、「你的症狀沒救不需要看醫生」、「還在跳針嗎?」、「你才可悲喔刷存在感啊」諸如此類。

看到此情此景,我唯有借用「被支語」的魯迅一段文字,稍為修改,贈送給他:

//A in brissie 🧋🧋🧋一到店,所有食花生的人便都看着他笑,有的叫道,「A in brissie 🧋🧋🧋,你臉上又添上新傷疤了!」他不回答,對櫃裏說,「溫三杯珍珠奶茶,要31004塊冰。」便排出九文大錢。他們又故意的高聲嚷道,「你一定又用了你批鬥過的支語了!」A in brissie 🧋🧋🧋睜大眼睛說,「你怎麼這樣憑空污人清白……」「甚麼清白?我前天親眼見你用了『估計』這詞,有着擷圖為證。」A in brissie 🧋🧋🧋便漲紅了臉,額上的青筋條條綻出,爭辯道,「貼我以前的言論不能算認同支語……認同支語!……我沒說我沒被支語影響耶,能算認同麼?」接連便是難懂的話,甚麼「繼續崩潰吧不用溫馨提醒」,甚麼「你才可悲喔刷存在感啊」之類,引得眾人都哄笑起來:店內外充滿了快活的空氣。//

極端臺灣人的謾罵當然不止於此。有人堅稱批改功課的臺灣老師只是「教育學生」,乃係天經地義之事。然而,要把學生教育好,有許多方法,卻不見該老師使用過。該老師只懂否定學生,學生只會知道這詞語遭老師否定,不要再用,連否定的原因,也是錯誤的、違反客觀事實的獵巫。這不是「教育學生」,而是洗學生的腦,誤人子弟也哉!有人企圖跟我爭辯「支那 Shina」的語源,藉此玩弄歧義,否定我的「支語獵巫」說。問題是,把「支」定義作中共/中國大陸地區的貶稱,並不是我,而是那些獵巫者,我只是沿用他們的定義,避免節外生枝而已。跟我辯這點的人,卻不肯去跟真正的支語獵巫者爭辯,甚至還跟獵巫者互相唱和,明顯是選擇性來針對我。

還有很多極端臺灣人,聲稱這是「臺灣內部的事」,罵我「跟你這港支有啥關係」,譴責我是「外人來說三道四」,企圖勾銷我的發言權。首先,遭他們攻擊的詞語,也是香港使用多年的自然用詞。他們誣衊香港的正常中文,香港中文使用者身為苦主,怎可能無關?再者,把非支語誣指作支語,是違反客觀事實的事情。全世界任何人,看到有人指鹿為馬,都有權站出來,指出其訛。哪怕是英國人、法國人、德國人、美國人、巴西人、澳洲人、南非人、格陵蘭人,只要他們真的懂得中文,知道偏激臺灣人說法之荒謬在哪裏,都有權指出來。聲稱甚麼「外人無權說三道四」,是中共等極權政府最愛用的反智藉口。那些極端臺灣人,口口聲聲說自己怎麼反「支」,言行和思想卻跟他們口中的「支」一模一樣,真是諷刺。支語獵巫者終成「支」人。恭喜恭喜。(笑)

尹評

(一)

令人意想不到的是,內木一郎竟然成立了一個「思辯社」,大家知道,內木一郎一直被我評價為一個蠢人,笨人,他的智力是比一般正常人還要低很多的,他缺乏常識,以及正常的思維能力。他把「辨」改為了「辯」,也就是說,內木一郎的「思辯」是「思考和辯論」的意思。當然他要這樣組詞也是他的自由,但是在我們讀過四書的人看來,把「思辨」寫成「思辯」,第一感覺就是他沒有文化。

Read more

快訊:倉頡群組有人提出「過」的問題,ichirou至今保持沉默

今年3月,有人在ichirou創建的倉頡輸入法群組提出了以下問題: 既然ichirou認為現在鴨脖作為倉頡三代和五代字元已經是鐵證如山了,為何不出來科普一下? ichirou如果要回答這個問題,他就需要解釋「咼」是連體還是分體,三代和五代倉頡是否存在鴨脖。直達他內心最痛之處。 我多年以前就說過,ichirou過份激進的推出這種違背傳統、違反常識的理論,遲早會翻車的。

慶漢文庫典恢復正常,暨翻到多個錯碼

漢文痛典自去年以來字體變成了細圓體,所有非基本區字的頁面均不能顯示。近日發現其已恢復正常,多愁善感的ichirou想必能鬆口氣了。

那麼頁面恢復正常之後,我要找它的錯碼就方便多了。下面是寡人新找到的錯碼。

禾口口

這個少了個「中」,查之六代有這個字根,六代編碼也是HDRR

Read more

ichirou跟ceku的討論為何會戛然而止?

下面的帖子來自這裏,主體為ichirou發表個人意見,ceku參與討論。

匯整可堪商榷的編碼

ichirou:

發表於 26-4-2020 17:29:20

倉頡輸入法是最有理的字形輸入法(形碼),對不同的字都能用同一套規則取得唯一的編碼,一視同仁,客觀可信。只要熟悉倉頡輸入法的規則,基本上人人都對任何漢字能取得相同的編碼。這點亦對索引、排序非常有利。其他形碼大多做不到這點,編碼有許多主觀元素,跟該輸入法說明的規則自相矛盾,或者往往對同一字形取出多種編碼,令用戶不知哪個才是正統取碼,無所適從。

當然,世事沒有完美,即使倉頡輸入法已經是最有理、規則最一致的,絕大部份漢字的取碼都毫無問題,也免不了有少數漢字的取碼還可以再深究或商榷。本帖中,我嘗試把已知的都窮擧出來。大家或深入硏究,或發現在下漏洞能指點迷津,或在日後維護碼表與規則時加以修繕等等,只要是理性使用,都無任歡迎。

不過我得先說明,所謂瑕不掩瑜,即使這少數漢字取碼可以商榷,這不代表倉頡的編碼規則有明顯問題。相比之下,其他形碼輸入法往往不能依據同一套規則取得唯一編碼,也許要看發明人的主觀,也許只有一堆取碼大包圍而不知哪個正統,問題都比倉頡輸入法嚴重得多。

以下是我想到的或看到其他人商榷過的取碼:(vs前方是官方取碼)

曰:日 vs 田一

輔根獨立成字時,基本上是要分割取碼的。除非該輔根眞的無法再分割。基本上,大家都視「曰」形爲「日」形的輔根,按理應分割爲「田一」。
從維基敎科書主要編輯ceku的信函(https://zh.wikibooks.org/wiki/Talk:%E5%80%89%E9%A0%A1%E8%BC%B8%E5%85%A5%E6%B3%95/%E4%BF%A1%E5%87%BD/20180923)得知,沈紅蓮女士視「日」與「曰」同形,兩者無分主輔,因此皆取「日」。竊以爲「曰」與「日」並非完全同形,「曰」第三筆橫筆的左右相觸跟「日」未必相同,因此此說未必可從。

囗:月一 vs 月山

朱邦復先生發明倉頡時,以「剪刀原則」作爲拆字取碼的原理。對照「目」字,「月山」比「月一」更易剪出來,因此「目」字取「月山」比取「月一」符合剪刀原則。同理,「囗」字也應當取「月山」而非「月一」,可是官方卻編了「月一」。
後來蒼頡檢字法中,「囗」也的確改爲「月山」,不支援「月一」。似乎反映「月山」更合理。

灬:竹火 vs 火戈

輔根獨立成字時的分割問題。官方從左邊第一道縫切下去取「竹火」也非不合理。但一般來說都視這輔根不再分割。因此有不分割並基於先繁後簡原則的取碼「火戈」。

忄:竹卜 vs 中金

輔根獨立成字時的分割問題。官方從左邊第一道縫切下去取「竹卜」也非不合理。但一般來說都視這輔根不再分割,尤其是若它視作可以再分割,會令許多「忄」部的字由「左右形⿰」變成「多列形⿲」。而且「忄」的中豎這麼突出,可比照「小、巾」等字,由上至下,先取中間筆畫(其中「小」字也不分割,以整體字的方式取碼)。因此有不分割並基於由上至下原則的取碼「中金」。

氵:戈戈一 vs 卜一

輔根獨立成字時的分割問題。官方從左邊第一道縫切下去取「戈戈一」也非不合理。但一般來說都視這輔根不再分割。因此有不分割並基於先繁後簡原則的取碼「卜一」,可比照「斗、头」等字。

乂:大 vs 竹人

輔根獨立成字時的分割問題。官方不分割,直接取「大」。後來蒼頡檢字法中,則分割成「竹人」。

婁:中中.女(五代) vs 中田中女(三代) vs 十田日女
相關字:樓、縷、摟、嘍、㜢、簍、蔞、嶁 等

三代視爲整體字,但似乎取了異體「」(上方作「申」形)的寫法,沒有處理橫筆左右穿頭的「⯐」形寫法。五代視爲分體字,取「中中.女」,則似乎依香港敎育參考寫法。但以此字最常見的寫法而言,它應爲整體字,而且上方「⯐」形橫筆左右穿頭。擴展區的「U+20DAD」和「U+2E3F3」也含有「⯐」部件,倉頡取碼不能迴避它。
比照「曲、丳、西、衰、貫」等字,豎筆和橫筆跨越「囗」形是可以的,否則「曲」也不能取「廿田」要取「中中田廿」;「丳」也不能取「中中田田」而要取「中中田中」,不省略則是「中中(丨丨)田中中(罒)中中(丨丨)田中中(罒)中中(丿丨)」;「貫」的字首也不能取「田十」而要取「田一一」。這就恐怖了。
因此,「婁」也應可允許「十」的橫筆與豎筆跨越「囗」形,取「十田日女」。「⌖」部件單獨出現時取「十田」。

韭:中尸一一(五代) vs 中一一一(三代) vs 廿廿廿一
相關字:韮、韲、虀、齏、韯、韱、纖、鑯、籤 等

三代是先取「非之左」,再取「非之右」,最後取底橫,不省略則是「中一一一中一一一一」。五代則依由上至下原則,左右兩邊梅花間竹。但兩種取法都未遵從精簡原則。「韭」這整體字取「廿廿廿一(⻀⻀⻀一)」爲最精簡者。而且「㐀」取「廿一」,「韭」取「廿廿廿一」的話亦能互相對照。
根據維基敎科書主要編輯ceku的信函,沈紅蓮女士回信時說「廿廿廿一」亦可,只是覺得和「非」取碼相差較遠。可是「非」是左右形組合字,「韭」是整體字,兩者不能類比。

甴:中田中一 vs 中田一

官方的取碼,把「囗」外的豎筆與「囗」內的豎筆分成兩斷。但比照「曲、丳、西」等字,豎筆跨越「囗」形是可以的(說明見上方「婁」字條)。因此應取「中田一」,不應把豎筆截斷。否則反而會跟規律不一致。

亞:一中中一 vs 一中中廿
相關字:啞、婭、惡、堊、壺、壼、斲、鬬、鬭 等

官方的取碼把「亞」字拆得很散,先取頂橫「一」,再取兩豎「中中」,接着取「匚コ」之形「尸尸」,再取兩豎「中中」,最後取底橫「一」,全字不省略的話取「一中中尸尸中中一」,按原則省略則是「一中中一」。
然而,底部的「中中一」,其實就是「廿」的輔根「ㅛ」。「亞」字不取「ㅛ」有違精簡原則。故應取「一中中廿」。Cj6兄認爲這是「ㅛ」字根後來才有,更新時官方想不到「亞」字的結果。
除非我們把「亞 去掉 二」設定爲輔根或複合字,或者把「亞」字設定作難字取「一難一」,才有理由直接取它而不取「ㅛ」。後來蒼頡檢字法中,直接把「亞 去掉 二」設爲「止」(即倉頡五代/三代的「難」)。

亜:一中中一 vs 一廿田
相關字:唖、悪、壷 等

官方取「一中中一」,似乎首橫和尾橫皆取了「一」,中間部份則取了「中中……(被省略)」,基於省略原則,不完全確定官方怎麼取。不知會不會是分成「兩豎、罒、兩豎」三部分,取「中中田中中中中」。
然而,比照「曲、丳、西」等字,豎筆跨越「囗」形是可以的(說明見上方「婁」字條)。因此「亜」故取「一廿田(一ㅛ囗)」即可,這亦符合精簡原則。

丂:一女尸 vs 一尸
相關字:兮、巧、朽、㱙、粵、粤、㕺、亏 等

雖然倉頡輸入法有轉角分則,但只在不增加取碼數時才適用,如「东」取「大木」不取「大女木」,「专」取「手弓戈」不取「手女弓戈」。按此,「丂」應取「一尸(丆㇆)」,但官方卻取了「一女尸」,跟規律不一致。
格瓦拉說過,五代/三代取碼時,把「丂」字第二筆視爲「豎橫撇鈎(㇉、豎折折鈎)」而非「撇橫撇鈎(ㄅ、撇折折鈎)」,而倉頡沒有「丅」這字根或輔根,因此怎也會取三碼,就當應用轉角分則,取「一女尸」而非「一中尸」了。
不過以此字最常見的寫法而言,它的第二筆應爲「撇橫撇鈎」,因此也應可取「一尸」。後來蒼頡檢字法中,「丂」也的確改爲「一尸」,不支援「一女尸」。

癶:弓戈.卜人 vs 弓戈.竹人/弓戈.人竹

官方取「弓戈.卜人」,視右邊兩撇爲「卜」。然而「卜」無此輔根,這是官方出錯。否則,像「形、髟」的右旁也得取「卜」。
若依正常字根拆字,「癶」右旁有人取「竹人」(較符合字形特徵原則),有人取「人竹」(較符合先繁後簡原則)。我主張取「竹人」,不然的話「癶」作爲字首時就要由「弓人」改爲「弓竹」,會影響「發、癸、登」等相關字。格瓦拉也主張取「竹人」。
後來蒼頡檢字法中,「癶」的右旁直接作爲「人」的輔根。似乎反映五代/三代原取碼有誤,這也是一種解決方法。

廴:弓弓大 vs 弓水
相關字:延、誕、涎、建、健、廷、挺、廼、廸、廻 等

官方取「弓弓大」而不取「弓水」,ArthurMcArthur懷疑較早版本倉頡的「又」(「水」的輔根)不允許開口所致。但比照五代/三代其他字,無論「又」的左上角是否開口,都可以取「水」碼。「廴」字拆成「弓水」,就不一致了,並且違反了精簡原則。
後來蒼頡檢字法中,「廴」也的確改爲「弓水」,不支援「弓弓大」。似乎反映「弓水」更合理。

毋:田十竹 vs 田十

五代官方的取碼,把「」外的直撇與「」內的直撇分成兩斷。但比照「曲、丳、西」等字,豎向筆畫跨越「」形是可以的(說明見上方「婁」字條)。因此應取「田十」,不應把直撇截斷。否則反而會跟規律不一致。
三代官方則取「田十」。

曱:田一中中 vs 田一中

官方的取碼,把「囗」外的豎筆與「囗」內的豎筆分成兩斷。但比照「曲、丳、西」等字,豎筆跨越「囗」形是可以的(說明見上方「婁」字條)。因此應取「田一中」,不應把豎筆截斷。否則反而會跟規律不一致。

五代字首分割爭議編碼

因實務考量,「撇捺形狀」或「蓋子形狀」字形,如「人」、「八」、「大」、「夭」、「天」、「冖」、「宀」、「癶」、「春之頂部」、「龹」、「夂」、「旁之頂部」、「孛之頂部」、「囊之頂部」、「㥑之頂部」、「學之頂部」等等,雖輕微遮住下部字形,仍統一將其下緣視為可一刀分離,如「貧」之字首取「八」不取「分」、「奮」之字首取「大」不取「奞」、「喬」之字首取「夭」不取「呑」等等。換言之,「微曲上下形結構」與「上下形結構」是一樣的。

三代手冊有明確提及此判定原則;五代手冊移除了相關敘述,大多數「撇捺形狀」或「蓋子形狀」字形的下緣仍比照三代視作可以「一刀分離」,不過有些「癶」、「春之頂部」、「夂」、「旁之頂部」字形下緣改作視爲不可以一刀分離。然而五代改碼不統一,不少字並無此更動。換言之,「微曲上下形結構」多數情況下仍與「上下形結構」一樣,但有個別(不是全部)以「癶」、「春之頂部」、「夂」、「旁之頂部」開首的漢字有所改變。

五代中「癶」、「春之頂部」、「夂」、「旁之頂部」字形下緣視爲不可以一刀分離的有:夆、夅(但有例外)、各、备、冬、登、春、秦(但有例外)、舂、帝 等。視爲可以一刀分離的有:㚅、贛之右旁、癹、癸 等(還有一些字例,因本論壇不支援擴展區B及以上的漢字,無法顯示,從略),顯得十分混亂。五代手冊於介紹字首字身時,提到按「於可橫向一次截然分離處分出字首」的原則,視「螽」的字首是「冬」(而非「夂」),但另一例字「基」則以「其」爲字首,視「撇捺形狀」下緣可以一刀分離,與「冬」似乎牴觸。《倉五手冊》電子版自2003年於網上公開後,就一直把「登、春」列爲複合字首,而印刷版(及pdf版)則一直沒有如是作。可見官方自己也自相矛盾。

六代倉頡相關字除改用新規則處理以外,皆取消了五代的這種變動,改回三代的做法。竊以爲五代這些字首分割改變皆不可取。

「羗」形
相關字:鬼(五代)、U+2A781 等

像「羗」字,官方視「羌」爲字首,「厶」爲字身。但這字首字身比例太懸殊。整體字的釐定原則「字形筆畫雖非全部交連,但形勢上爲一完整個體者。」且比照U+2A6BE、U+2A6BF、U+2A6C3等字,完全可以把「羗」形的字視爲整體字取碼。

龍闖中原:

發表於 26-4-2020 21:27:29

我認為碼表應该統一,以官方的爲凖,要错大家都错成一样,其他再好也不用。就像86五筆一样,码表统一,大家都以86码表為准,虽然还有缺点,但用户都能视而不见,使用也不会造成困惑。

ichirou:

發表於 27-4-2020 06:33:10

個人不能苟同「用户都能视而不见,使用也不会造成困惑」,這只是宣揚盲從死背而已。

而倉頡輸入法並不鼓勵盲從死背,強調對不同漢字都一視同仁,依同一套規則。上述這幾點,許多也不是在下提出的,是過往這麼多年的討論裏各位不同的倉頡朋友提出的。

當然提出不等於一定對,這點要經過大家的深入思考和討論。過往一些有人提出了,但論證上站不住腳,有許多反證,或者在立論過程中歪曲了官方說明規矩的,在下都撇除了,不會列於本帖中。

不過我也同意,即使官方取碼或有可斟酌處,但若沒有官方修訂,或沒有大型且有共識的代表性維護計劃之修訂,要理解這些編碼,仍主要以原來的官方拆碼說法爲根據。

換言之,這帖子串裏提及過的字,哪怕怎麼有道理,也只是爲未來所作的提案芻議,不應在現在就把當中的分析看成拆碼標準方法。

ceku:

發表於 7-6-2020 10:00:45

這論壇好像找不到引用語法的功能?就先簡單回一下,簡陋勿怪:

曰:日 vs 田一

竊以爲「曰」與「日」並非完全同形,「曰」第三筆橫筆的左右相觸跟「日」未必相同,因此此說未必可從。

倉頡輸入法原則上應該不會把水平或垂直的縮放視為不同字形,否則試想「車」、置左的「車」、置下的「車」都視為不同字形,會成為什麼光景?

此外有些文獻的「曰」看起來是比較瘦長的,字形上也和「日」難以區分。例如:

(出自異體字字典https://dict.variants.moe.edu.tw/variants/rbt/word_attribute.rbt?quote_code=QTAxODMw)

我認為沈女士的說法大致是可以接受的,且基於相容性考量,能不改就不改,因此建議維持原取碼即可。

囗:月一 vs 月山

朱邦復先生發明倉頡時,以「剪刀原則」作爲拆字取碼的原理。對照「目」字,「月山」比「月一」更易剪出來,因此「目」字取「月山」比取「月一」符合剪刀原則。同理,「囗」字也應當取「月山」而非「月一」,可是官方卻編了「月一」。
後來蒼頡檢字法中,「囗」也的確改爲「月山」,不支援「月一」。似乎反映「月山」更合理。

「剪刀原則」要怎麼應用一直都有模糊空間存在……如果說「目」比較容易剪出「月」「凵」,為何不能說「且」比較容易剪出「月」「廿」?

灬:竹火 vs 火戈

輔根獨立成字時的分割問題。官方從左邊第一道縫切下去取「竹火」也非不合理。但一般來說都視這輔根不再分割。因此有不分割並基於先繁後簡原則的取碼「火戈」。

有可能當初設定「火」的輔助字形只有「點點點」,因此「灬」的「撇點點」不適用。但是否要計較如此細微的差異,也是可以討論。

乂:大 vs 竹人

輔根獨立成字時的分割問題。官方不分割,直接取「大」。後來蒼頡檢字法中,則分割成「竹人」。

「乂」當初不分割可能是為了保留「交叉」的字形特徵,及按區塊原則避免字根互相跨越。

蒼檢改碼可能是沈紅蓮和朱邦復想法不同所致,但新取碼除了遺失字形特徵以外,尚有另一爭議是為何取「竹人」而不取「人竹」?雖說寫字時一般先寫撇再寫捺,但按倉頡取碼原則,筆晝孰高孰低無絕對標準時,應由左而右取碼,因此似乎是後者比較合理。

我個人比較支持按原設計取一碼「大」。

癶:弓戈.卜人 vs 弓戈.竹人/弓戈.人竹

若依正常字根拆字,「癶」右旁有人取「竹人」(較符合字形特徵原則),有人取「人竹」(較符合先繁後簡原則)。我主張取「竹人」,不然的話「癶」作爲字首時就要由「弓人」改爲「弓竹」,會影響「發、癸、登」等相關字。格瓦拉也主張取「竹人」。
後來蒼頡檢字法中,「癶」的右旁直接作爲「人」的輔根。似乎反映五代/三代原取碼有誤,這也是一種解決方法。

取「竹人」的問題是如何符合字形特徵原則?目前整理出來較具體的「區塊」、「轉角」、「跨越」看起來都不適用。

甴:田一中中 vs 田一中

看起來似乎是「曱」的筆誤?

「羗」形
相關字:鬼(五代)、U+2A781 等

像「羗」字,官方視「羌」爲字首,「厶」爲字身。但這字首字身比例太懸殊。整體字的釐定原則「字形筆畫雖非全部交連,但形勢上爲一完整個體者。」且比照U+2A6BE、U+2A6BF、U+2A6C3等字,完全可以把「羗」形的字視爲整體字取碼。

若按此說,五代的「鬼」恐怕也應該視為整體字取「竹田竹戈」,而不是「竹山.戈」。

卵:竹竹尸中戈 vs 竹竹尸卜

官方給「卵」字取碼時,「卜」字根的豎與點可能不能分離。但比照「鸟」字,豎和點分離仍然取「卜」。因此「卵」也應取「竹竹尸卜」,以符合精簡原則。「孵、毈」等字同理。

「鸟」首碼取「心」和次碼取「卜」似乎都是為了方便簡化字取碼而擴充了原有的輔助字形,但擴充輔助字形往往就忽略了對既有字的影響……。

整體來說,倉頡輸入法有個頗大的先天問題是它其實就是「先射箭再畫靶」,所有取碼規則可說都是為了把常用部件的取碼平均分配而歸納(或說硬湊?)出來的,因此往往為了平均和降低重碼的需求調整既有規則,但調整東就忽略了西,導致很多內在矛盾,五代後期和六代的許多新規則尤其明顯……。

ichirou:

發表於 14-6-2020 01:18:13

卵:竹竹尸中戈 vs 竹竹尸卜

官方給「卵」字取碼時,「卜」字根的豎與點可能不能分離。但比照「鸟」字,豎和點分離仍然取「卜」。因此「卵」也應取「竹竹尸卜」,以符合精簡原則。「孵、毈」等字同理。

ichirou:

發表於 14-6-2020 02:54:12

我知道「倉頡輸入法原則上應該不會把水平或垂直的縮放視為不同字形」啊。關於「日」字,我說的是:『「曰」第三筆橫筆的左右相觸跟「日」未必相同』。像你貼出的圖,「日」與「曰」正是由橫筆有沒有與豎筆相觸區分,不從它的寬與扁。

「且」不剪作「月廿」,跟「印」的字首不剪作「人心」,「哉」的字首不剪作「土戈」相類,當兩種剪法都不違反各原則時,就用較少剪開筆畫的剪法。不過未嘗試窮盡相關漢字思考可有反例,有待大家以事實硏究。

「火」也有這種可能。不過按後來的應用,還維持這樣就不太合理。

「乂」我個人也贊成取「大」。

「癶」的右旁比照「戶」和「歹」,橫剪和斜剪後,兩種剪法都不違反各原則時,就用橫剪。不過我也認爲這個比較大爭議,說不好定它作複合字會更簡單解決。

「曱」的筆誤已修改。

如果未來會做大整理,作爲與舊版有一定不同的新版本,我同意「鬼」和「羗」等視作整體字。反正「龜部首的僻字」如「U+2A6A7 弓日尸中」、「U+2A6BE 弓日尸金」、「U+2A6BF 弓日尸十」、「U+2A6C3 弓日尸尸」都已經如此,也避免跟「兔」、「U+26351」相比時的不習慣感。

我個人反對把取碼方法說成是「先射箭再畫靶」,這是不同概念吧。有些時候在取碼時,發明人確會顧此失彼,才出現這種問題。這也不是倉頡獨有,像五筆王碼等其他形碼,都有一些類似的例子。

ceku:

15-6-2020 22:25:58

我知道「倉頡輸入法原則上應該不會把水平或垂直的縮放視為不同字形」啊。關於「日」字,我說的是:『「曰」第三筆橫筆的左右相觸跟「日」未必相同』。像你貼出的圖,「日」與「曰」正是由橫筆有沒有與豎筆相觸區分,不從它的寬與扁。

第一,你說的「日」「曰」橫筆差異我不明白,有圖解嗎?

第二,就算有,這差異恐怕也是極其細微,別說十個人可能有九個看不出來,甚至明體、楷體等不同書體搞不好也有差異,那要視不同書體取碼嗎?我認為視作同形恐怕還是比較合理。

「且」不剪作「月廿」,跟「印」的字首不剪作「人心」,「哉」的字首不剪作「土戈」相類,當兩種剪法都不違反各原則時,就用較少剪開筆畫的剪法。不過未嘗試窮盡相關漢字思考可有反例,有待大家以事實硏究。

這題我之前提出過,如果引入此原則,那麼「巳」取「口山」而非「尸山」就會成為反例。

而且,此原則如果成立,那麼「目」、「囗」恰恰更應該取「月一」勝過「月山」。

其實官方曾經過過「目」是複合字,這樣或許更好圓說。但傳統上複合字都是自成單位,並與週邊筆畫強制分離,比如「幾」強制分成「女戈.竹戈」,而不是比照「戍」取「戈竹.戈」的邏輯取「女竹.戈」。若採此說,「貝」、「見」等字的取碼都得重新理解成「月山.金」、「月山.竹山」,可能會影響一些字的取碼。

「火」也有這種可能。不過按後來的應用,還維持這樣就不太合理。

後來的應用是指什麼?我想到的例子是主要是簡化字頭「𭕄」(點點撇)。要解釋的話,這可以視為「點點點」手寫時為向下連接「冖」,而自然轉成的類撇筆,本質上還是「點」。但「灬」就不太一樣了,手寫筆順確實是先一「撇」再三「點」,不太能和前者類比。

「癶」的右旁比照「戶」和「歹」,橫剪和斜剪後,兩種剪法都不違反各原則時,就用橫剪。不過我也認爲這個比較大爭議,說不好定它作複合字會更簡單解決。

視作複合字可以解決衍生字取碼問題,不過「癶」就必須改碼為「弓人」了。

之前有個說法是視為「卜」追加兩短撇的輔助字形,因為是與「⺀」類似的兩短撇,因此不須適用「彡」形。這說法有什麼大問題嗎?

另外說到這種字形,「𭕄」為什麼取「戈戈竹」而不是「戈金」或「金戈」也會是個議題。

ichirou:

發表於 19-6-2020 16:59:40

1.
傳承字形一向區分,「日」、「曰」不同形。上「日」下「曰」,無論寬或扁,橫筆不同是區分點。
https://www.chinesecj.com/forum/data/attachment/forum/202006/19/165547enyxiomiiniinxrz.png

2.
「巳」取「尸山」就違反了區塊原則。就像「向、戶、歹」等,橫向剪開是比較理想/優先的。「巳」取「尸山」就跟此違反了。

但「印、哉、且」不同,它們的官方取碼並無違反。「巳」並不是它們的反例。

至於你說「目」,則是轉角分則,是另一個問題。

ceku:

發表於 19-6-2020 18:24:19

1.
傳承字形一向區分,「日」、「曰」不同形。上「日」下「曰」,無論寬或扁,橫筆不同是區分點。

哪個傳承字形?有確切的文獻證據提到這個區別嗎?

我也看過不少不作此區分的字體,比如全字庫正宋體、全字庫正楷體、標楷體、華康魏碑體等等:

https://www.chinesecj.com/forum/data/attachment/forum/202006/19/180334bwayivyj5lzgaj1y.png

再查異體字字典的「日」,也有文獻是用你所謂「曰」的寫法,如下圖最上面的字:

因此我傾向認為此二字並無此區分,那只是部分字體製作者的做法。

2.
「巳」取「尸山」就違反了區塊原則。就像「向、戶、歹」等,橫向剪開是比較理想/優先的。「巳」取「尸山」就跟此違反了。

但「印、哉、且」不同,它們的官方取碼並無違反。「巳」並不是它們的反例。

至於你說「目」,則是轉角分則,是另一個問題。

無論是所謂的區塊原則或剪刀原則,它們的意思都只是「優先選擇字根不互相交錯的取碼方式」,並沒有所謂橫向剪開比較優先之類的意思。「巳」無論取「尸山」或「口山」,字根之間都只是相接而無交錯,因此與區塊原則無關。

我無法保證後者不存在,但我沒有在官方手冊中明確看到過。三代手冊沒有提;五代手冊有「巳」、「民」兩個字例,但它混在「完整原則」裡談,只能看出官方確實認為切出「口」較能保留字形特徵,無法區分具體是根據什麼原則。

轉角分則只適用於連續筆畫,「目」的兩豎和底橫並非連續筆畫,因此和轉角分則無關。

 

那麼,這個討論為甚麼會戛然而止?請看我的分析。

一,ichirou的「剪刀原則」遭到強烈反對

由ichirou原創發明的幼稚可笑的「剪刀原則」遭到ceku無情的批判,ceku說「剪刀原則沒法應用」,直接打中ichirou的七寸。這使得愛面子的ichirou不得不停止跟ceku的公開對話。

Read more

【討論】ichirou自創理論為何四處碰壁?

倉頡社區騎沈四傑之一的ichirou,腦子裏一直都充滿著奇怪且幼稚的想法。他的原創理論基本都是錯誤的,非常可笑。

因此ichirou總是不斷的遭到人們的詰問和質詢,四處碰壁。後來ichirou終於學會了「保持沉默」,這應該是他維持臉面的唯一辦法了。

這些令他臉上無光的理論說法有:

  1. 旋轉鏡像字
  2. 支援舊體字
  3. 咼是連體,咼商一致
  4. 取碼原則優先權
  5. 剪刀原則
  6. 用卨推出鴨脖

下面我將逐一評論。

Read more

英雄出現!旋轉鏡像字使騎沈四傑顏面掃地

逝水流2024-03-08

五倉世紀對「倒字」、「鏡像字」取碼混亂

比如「」取「月山竹山Z」,「」取「口日山Z」,「」取「口Z竹心山」、「」取「弓弓Z」等等,「Z」我猜是倒字或鏡像字的識別碼,但以下這些字又不是以此種方式取碼,「」、「」、「」分別取的是「卜中月山金」、「戈中女」、「戈一大一戈」但按上面的方式應該是分別取「卜Z月山金」、「弓弓Z」、「戈一戈口Z」才對,諸如此類的字。

以上討論來自大馬倉友。,至今帖子仍然留在上面,騎沈四傑想刪不敢刪,非常可笑。

Read more