Bộ gõ Thương Hiệt

Bộ gõ Thương Hiệt (tiếng Anh: Cangjie input method hoặc Tsang-chieh input method, tiếng Trung: 倉頡輸入法) là bộ gõ chữ Hán, giúp người dùng có thể nhập chữ Hán vào máy tính thông qua bàn phím tiêu chuẩn. Được Châu Bang Phục (朱邦復, Chu Bong-Foo) sáng tạo năm 1976, bộ gõ này được đặt theo tên của Thương Hiệt, nhân vật thần thoại được xem là sáng tạo ra chữ Hán; theo gợi ý của Tưởng Vĩ Quốc (蔣緯國), khi ấy là Bộ trưởng Bộ Quốc phòng Trung Hoa Dân Quốc. Ban đầu, bộ gõ chỉ hỗ trợ chữ Hán phồn thể, nhưng hiện nay bộ gõ Thương Hiệt đã được nâng cấp để hỗ trợ cả chữ giản thể.

Bộ gõ Thương Hiệt
Cách nhập chữ 倉頡輸入法 (Hán-Việt: Thương Hiệt du nhập pháp, nghĩa: Bộ gõ Thương Hiệt) bằng chữ Hán phồn thể
Phồn thể倉頡輸入法
Giản thể仓颉输入法

Thương Hiệt là bộ gõ chữ Hán đầu tiên có dạng bàn phím QWERTY, trong khi các phương thức nhập chữ Hán trước đó đều có từ 40-2.400 phím, ngoại trừ phương pháp mã hóa 3 góc (Three Corner coding method, 三角編碼索引) chỉ sử dụng bàn phím số. Châu Bang Phục nhận thấy rằng bàn phím QWERTY sẽ ngày một phổ biến và trở thành tiêu chuẩn quốc tế, và cho rằng nên lấy nó làm phương tiện nhập liệu văn bản chữ Hán.[1] Năm 1982, Châu Bang Phục từ bỏ bằng sáng chế Bộ gõ Thương Hiệt bởi ông cho rằng nó thuộc về di sản văn hóa Trung Hoa.[2] Kể từ đó, bộ gõ này được cung cấp miễn phí, bất kỳ ai cũng được quyền sử dụng và hiệu chỉnh tùy ý, khiến Thương Hiệt trở thành một bộ gõ thông dụng trên các hệ máy hỗ trợ chữ Hán phồn thể.

Trong tên các tập tin và những nơi khác, tên của bộ gõ thường được viết tắt là cj.

Bộ gõ Thương Hiệt dựa vào tự dạng (tức hình dạng của chữ Hán) để đánh chữ, khác hẳn với bộ gõ Bính âm vốn lấy ngữ âm làm cơ sở. Mỗi một đồ họa cơ bản có một “tự căn” (字根) làm đại diện, tổng số là 24, ứng với mỗi ký tự Latinh trên bàn phím QWERTY tiêu chuẩn. Phím X dùng để nhập các "chữ khó" không gõ được bằng mã thông thường. Trong các biểu diễn phím-ký tự, chúng được chia thành bốn nhóm nhỏ: Philosophical Set (tương ứng các ký tự từ 'A' đến 'G' và đại diện cho mặt trời, mặt trăng và ngũ hành), Strokes Set (tương ứng các ký tự từ 'H' đến 'N' thể hiện các nét ngắn và tinh tế), Body-Related Set (tương ứng các ký tự từ 'O' đến 'R' đại diện cho các bộ phận khác nhau trong giải phẫu cơ thể người), và Shapes Set (tương ứng các ký tự từ 'S' đến 'Y' và thể hiện các nét phức tạp và bao hàm).

Thành phần tạo chữ cơ bản trong bộ gõ Thương Hiệt thường được gọi là "tự căn" (字根), thành phần dựa trên phép dựng hình; chứ không phải bộ thủ truyền thống, cũng không dựa trên thứ tự nét bút.

Tổng quát

Phím và "tự căn"

Có 24 tự căn nhưng có đến 26 phím; 24 tự căn liên kết với 76 phụ trợ tự hình (輔助 字形), trong nhiều trường hợp là các phiên bản xoay hoặc hoán vị của các tự căn. Ví dụ, phím A (日) có thể đại diện cho chính nó, rộng hơn một chút 曰 hoặc xoay 90°.

24 phím được xếp thành 4 nhóm

  • Triết lý (哲理): tương ứng với các phím từ A đến G đại diện cho âm dương ngũ hành
  • Bút hoạch (筆畫): tương ứng với các phím từ H đến N đại diện cho các nét ngắn
  • Nhân thể (人體): tương ứng với các phím từ O đến R đại diện cho các bộ phận cơ thể con người
  • Tự hình (字形): tương ứng với các phím từ S đến Y đại diện cho hình dạng chữ, các kí tự phức tạp và bị bao vây
NhómPhímTênNghĩa chính
Triết lýA日 nhật
  • 日, 曰
  • 日 quay 90° (như trong 巴)
B月 nguyệt
  • 4 nét trên cùng của 目
  • 冂, 爫, 冖
  • Phần trên bên trái của 炙, 然, và 祭
  • 4 nét trên cùng bên trái của 豹 và 貓
  • 4 nét đầu của 骨
C金 kim
  • 金, 八, 儿, ソ, ハ, 丷
  • Hai nét giáp chót của: 四, 匹 (儿)
D木 mộc
  • 2 nét đầu của: 寸, 才
  • Hai nét đầu của: 也, 皮
E水 thủy氵, 又, 氺
F火 hỏa
  • 小, 灬
  • 3 nét đầu của: 當, 光
G土 thổ土, 士
Bút hoạchH竹 trúc
  • Nét xiên và xiên ngắn ㄏ,丿, ノ
  • Bộ trúc 竹, phần trên của 笨, 節
I戈 qua
  • Nét chấm 、
  • 广, 厶
J十 thập十, 宀
K大 đạiNét hình chữ X: 乂ㄨナ犭疒廴
L中 trung
  • Nét sổ (丨)
  • 4 nét đầu của 書, 盡
M一 nhất
  • Nét ngang (一)
  • 厂, 工
  • Nét cuối trong 孑, 刁
N弓 cungNét hình cung, móc câu: フ, ク, 乙, 亅,ㄱ
Nhân thểO人 nhân
  • Bộ nhân 人
  • 2 nét đầu trong: 丘, 乓
  • 2 nét đầu trong: 知, 攻, 氣
  • 2 nét cuối trong: 兆
P心 tâm
  • Bộ tâm 忄
  • 匕, 七, 勹
  • Nét thứ hai trong: 心
  • 4 nét cuối trong: 恭, 慕, 忝
  • Hai nét áp chót trong: 代
Q手 thủ手, ヰ,扌
R口 khẩuBộ khẩu 口
Tự hìnhS尸 thi
  • 2 nét đầu của 己 (コ)
  • Nét đầu của 司, 刀
  • Nét thứ 3 của: 成, 豕
  • 4 nét đầu của: 長, 髟
T廿 trấp
  • Hai nét dọc nối bằng một nét ngang: ㅛ, 卄, 廾, 丱, 业
  • Bộ thảo 艸, 艹
U山 sơnBa mặt đóng, mở bên trên: ㄩ, 乚, 屮
V女 nữ
  • Một nét móc bên phải, hình chữ V: ㄴ,ㄑ, <, レ
  • 3 nét cuối của: 艮, 衣, 長
W田 điền
  • Đóng bốn phía, bên trong có nét khác: 囗
  • Hai nét đầu của: 母, 毋
Y卜 bốc
  • 卜 ,ㅏ, 亠, 辶
  • Hai nét đầu trong 斗
Phím trùng, đặc biệtX重/難 trùng/nan
  • Các chữ dễ nhầm lẫn, trùng lặp
  • Những chữ khó tách riêng
Kí tự đặc biệtZXem ghi chúCác kí hiệu đặc biệt, các dấu chấm câu (như 。,、,「 」,『 』)
Kí tự đại diện*(Shift+8)Kí tự đại diệnCó thể thay thế bất kì phím nào tự vị trí thứ 2 đến 5 và trả về danh sách tổ hợp. Hữu ích cho những lần đoán khi chắc chắn về phím đầu và cuối (VD: Nhập 竹 * 竹 sẽ cho ra danh sách 身, 物, 秒, 第

Bố cục bàn phím

Các quy tắc cơ bản

Người đánh máy phải quen với một số quy tắc phân tách để lấy mã Thương Hiệt:

  • Hướng tách: trái sang phải, trên xuống dưới, ngoài vào trong
  • Các chữ không được kết nối hình học được chia thành 2 phần (ví dụ: 你) xác định 2 phần theo hướng tách (ví dụ, 人 và 尔) , sau đó lấy mã đầu và cuối của phần thứ nhất, và mã đầu, nhì và cuối của phần thứ hai
  • Các chữ không được kết nối hình học được chia thành nhiều phần (ví dụ: 謝) xác định phần đầu tiên theo hướng tách (ví dụ, 言) rồi lấy mã đầu và cuối của phần đó. Tiếp theo tách phần còn lại thành các phần con (tức là, 身 và 寸) rồi lấy mã đầu và cuối của phần con đầu tiên, sau đó lấy mã cuối của phần con cuối

Các quy tắc tuân theo các nguyên tắc sau:

  • Tinh giản (精簡): nếu có nhiều cách tách, cách tách ngắn hơn được coi là đúng
  • Hoàn chỉnh (完整): nếu có nhiều cách tách với cùng độ dài, cách tách phức tạp hơn được coi là đúng
  • Tự hình đặc trưng (字型 特徵): Các cách tách phải phản ảnh hình dạng của tự căn, nghĩa là:
    • Tránh sử dụng một mã 2 lần hoặc nhiều hơn
    • Hình dạng của chữ không nên bị cắt ở góc
  • Tỉnh lược (省略)
    • Bộ phận tỉnh lược (部分 省略): khi số lượng mã vượt số mã cho phép, các mã bổ sung sẽ bị bỏ qua
    • Bao hàm tỉnh lược (包含 省略): khi một phần của kí tự được tách và phần bao vây được tách, các phần còn lại sẽ bị bỏ qua

Các ví dụ

  • 車 xa
    • Chữ này được kết nối hình học, bao gồm một cấu trúc dọc duy nhất. Vì vậy, ta lấy mã Thương Hiệt đầu tiên, thứ hai và cuối cùng từ trên xuống dưới
    • Do đó, mã Thương Hiệt là 十田十 (JWJ) tương ứng với các tự căn trong ví dụ này
  • 謝 tạ
    • Chữ này gồm các phần không được kết nối hình học được sắp xếp theo chiều ngang. Tách lần đầu ta được 2 phần 言 và 射
    • Phần đầu tiên, 言, không liên kết hình học từ trên xuống dưới; chúng ta lấy phần đầu (亠, phụ trợ tự hình của 卜 ) và phần cuối (口, tự căn của 口) ta được 卜口 (YR)
    • Phần thứ hai, 射, không liên kết hình học theo chiều ngang. Tách theo chiều ngang ta được 身 và 寸
      • Đối với phần con đầu tiên 身, ta lấy mã đầu và cuối. Cả 2 đều là nét xiên nên ta có 竹竹 (HH)
      • Đối với phần con thứ hai 寸, ta lấy mã cuối. Phần này không liên kết hình học nên ta lấy phần bao ngoài trước, phần thứ hai là nét chấm ở giữa. Nét chấm là 戈 (I)
    • Do đó, mã Thương Hiệt là 卜口竹竹戈 (YRHHI)
  • 谢, giản thể của 謝
    • Ví dụ này giống với trên, trừ phần đầu là 讠. Nét đầu là nét chấm, nét cuối hình chữ V nên ta có mã 戈女 (IV)
    • Làm tương tự như trên, ta có mã Thương Hiệt là 戈女竹竹戈 (IVHHI)

Ngoại lệ

Một số chữ được tách theo cùng 1 cách cho dù các quy tắc nói rằng chúng có được tách theo cách này hay không. Có ít các trường hợp như vậy

ChữCách tách cố định
門 môn日弓 (AN)
目 mục月山 (BU)
鬼 quỷ竹戈 (HI)
几 kỉ竹弓 (HN)
贏 doanh卜弓月山金 (YNBUC)
吂 mang卜女口 (YVR)
隹 chuy人土 (OG)
气 khí人一弓 (OMN)
畿 (kỳ) bỏ 田 (điền)女戈 (VI)
鬥 đấu中弓 (LN)
阝phụ弓中 (NL)

Một số chữ không thể tách. Chúng được biểu thị bằng phím X 難 trên bàn phím

ChữCách tách cố định
臼 cữu竹難 (HX)
與 dữ, dư, dự竹難卜金 (HXYC)
興 hưng, hứng竹難月金 (HXBC)
盥 quán竹難月廿 (HXBT)
姊 tỷ女中難竹 (VLXH)
齊 tề卜難 (YX)
兼 kiêm廿難金 (TXC)
鹿 lộc戈難心 (IXP)
身 thân, quyên竹難竹 (HXH)
卍 vạn弓難 (NX)
黽 mãnh, mẫn口難山 (RXU)
龜 quy弓難山 (NXU)
廌 trãi, trĩ戈難火 (IXF)
慶 khánh戈難水 (IXE)
淵 uyên水中難中 (ELXL)
肅 túc中難 (LX)

Vấn đề

Bộ gõ Thương Hiệt được thiết kế để trở thành một hệ thống dễ sử dụng giúp thúc đẩy việc sử dụng máy tính của Trung Quốc. Tuy nhiên, nhiều người dùng thấy Thương Hiệt rất khó học và sử dụng, gặp nhiều khó khăn do hướng dẫn kém.

Khó khăn nhận thức được

  • Để nhập liệu bằng Thương Hiệt, cần phải có kiến ​​thức về cả tên của các tự căn cũng như phụ trợ tự hình của chúng. Ta thường thấy các bảng của các tự căn Thương Hiệt với các phụ trợ tự hình của chúng được dán trên màn hình của người dùng máy tính.
  • Phải quen thuộc với các quy tắc phân tách, thiếu hiểu biết về điều này dẫn đến việc nhập các ký tự ngày càng khó khăn hơn.
  • Người dùng không thể nhập một ký tự mà họ đã quên cách viết (một vấn đề với tất cả các phương thức nhập không dựa trên phiên âm).

Nếu thực hành đủ, người dùng có thể khắc phục các vấn đề trên. Những người đánh máy cảm ứng điển hình có thể gõ tiếng Trung với tốc độ 25 kí tự mỗi phút (cpm) hoặc tốt hơn khi dùng Thương Hiệt, mặc dù họ gặp khó khăn trong việc nhớ danh sách các phụ trợ tự hình hoặc các quy tắc phân tách. Theo báo cáo, những người đánh máy Thương Hiệt có kinh nghiệm có thể đạt được tốc độ đánh máy từ 60 cpm đến hơn 200 cpm.

Hạn chế trong việc thực hiện

Sự phân rã của một ký tự phụ thuộc vào một tập hợp tiêu chuẩn tự hình (標準 字形) được xác định trước. Tuy nhiên, vì có nhiều biến thể của Thương Hiệt tồn tại ở các quốc gia khác nhau, tiêu chuẩn tự hình của một kí tự nhất định trong Thương Hiệt không phải lúc nào cũng được người dùng học trước đó. Việc học Thương Hiệt đòi hỏi phải học không chỉ bản thân Thương Hiệt mà còn cả những tiêu chuẩn tự hình không phổ biến đối với một số ký tự. Trình chỉnh sửa phương thức nhập Cangjie (IME) không xử lý các lỗi trong phân tích ngoại trừ thông báo cho người dùng rằng có sai sót (thường là bằng tiếng bíp). Tuy nhiên, Thương Hiệt ban đầu được thiết kế để gán các mã khác nhau cho các biến thể khác nhau của một ký tự. Ví dụ: trong Thương Hiệt được cung cấp trên Windows, mã cho 產 là YHHQM, không tương ứng với hình dạng của ký tự này mà là một biến thể khác, 産. Đây là sự cố do triển khai Thương Hiệt trên Windows. Trong Thương Hiệt gốc, 產 phải là YKMHM (phần đầu tiên là 文) trong khi 産 là YHHQM (phần đầu tiên là 产).

Các dấu câu không được phân tách theo hình học, mà được cung cấp các mã được xác định trước bắt đầu bằng ZX theo sau là một chuỗi 3 phím liên quan đến thứ tự của các ký tự trong mã Big5 . (Bộ mã này đã được thêm vào Thương Hiệt trên phiên bản tiếng Trung phồn thể của Windows 95. Trên Windows 3.1, Thương Hiệt không có bộ mã cho dấu câu.) Nhập dấu câu trong Thương Hiệt do đó trở thành một bài tập khó chịu liên quan đến việc ghi nhớ hoặc chọn. Tuy nhiên, điều này được giải quyết trên các hệ thống hiện đại thông qua việc truy cập bàn phím ảo trên màn hình (Trên Windows, điều này được kích hoạt bằng cách nhấn Ctrl + Alt + phím dấu phẩy).

Các lỗi thường gặp bao gồm không được coi là mã thay thế. Ví dụ: nếu một người không phân tách 方 từ trên xuống dưới thành YHS, mà thay vào đó nhập YSH theo thứ tự nét, Thương Hiệt sẽ không trả về ký tự 方 như một lựa chọn.

Vì Thương Hiệt yêu cầu tất cả 26 phím của bàn phím QWERTY , nó không thể được sử dụng để nhập chữ Hán trên điện thoại phổ thông vốn chỉ có 12 phím . Các phương thức nhập thay thế, chẳng hạn như Zhuyin , 5-strokes (hoặc 9- của Motorola ) và Q9 được sử dụng thay thế.

Tham khảo

  • Đài Bắc: Chwa! Đài Loan Inc. (全華科技圖書公司).倉頡中文資訊碼 : 倉頡字母 lò 部首 lò 注音三用檢字對照 [Người Trung quốc tìm hiểu thông tin mã : với các chỉ số khóa bằng cách tìm hiểu gốc, Khang hy gốc, và chú âm]. Bố số 023479. — Đây là các hướng dẫn sử dụng của một đầu tìm hiểu hệ với một tìm hiểu điều khiển thẻ.
    • Những thứ hai đoạn cuối cùng trên trang đầu tiên trong phần mang tên "Việc tìm hiểu căn bản, dựa đầu vào Trung quốc phương pháp" (倉頡字母中文輸入法) nói rằng

      [Dịch]
      Điều này là không có vấn đề, cũng có phụ hình thức để bổ sung cho những thiếu sót của các gốc. Phụ hình thức được biến thành hình dạng của chính gốc, và vì vậy] dễ nhớ.

    • Đoạn cuối cùng trên trang thứ năm trong cùng một phần kỳ

      [Dịch]
      Từ điển nối [để cuốn sách này] được dựa trên 4800 tiêu chuẩn, thường được sử dụng vật như tuyên bố của Bộ Giáo dục. Thêm vào đó là nhân vật đó đang tự tạo ra số của nhân vật là 15.000 (sử dụng Khang hy từ điển như là một cơ sở).

  • Một phần của thông tin từ bài này đến từ tương đương với tiếng Trung quốc Wikipedia
  • Sự phân hủy quy tắc đến từ "người Bạn của tìm hiểu — Malaysia" trên trang web http://www.chinesecj.com/ trang web cũng cho tốc độ kinh nghiệm của người đánh máy và cung cấp phần mềm mới 5 của tìm hiểu phương pháp cho Microsoft.
  • Nó có thể khó khăn để tìm thấy cụ thể tham khảo đến "không phải lỗi-tha thứ cho" tài sản của tìm hiểu. Bàn xuống http://www.array.com.tw/keytool/compete.htm Lưu trữ 2005-02-06 tại Wayback Machine là một bên ngoài tài liệu tham khảo mà kỳ thực tế này.
  • Input.foruto.com Lưu trữ 2016-07-10 tại Wayback Machine có một ngắn gọn, lịch sử của tìm hiểu phương thức nhập theo cách nhìn của bài báo đó là tác giả. Một phiên bản 1 và 2 đang xác định rõ ràng trong những bài viết.
  • Cbflabs.com có một số được viết bởi Ông Chu Bong-Foo, với tài liệu tham khảo không chỉ để tìm hiểu phương thức nhập, nhưng cũng là người Trung quốc tiếng nói chung. Một phiên bản 5 và 6 (bây giờ được gọi là 5) của tìm hiểu phương thức nhập được xác định rõ ràng.

Liên kết ngoài