Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Раскладка клавиатуры Wubi 98
Раскладка клавиатуры Wubi 86 (более распространенная)
QWERTY-клавиатура с компонентами Wubi 86

Метод ввода Wubizixing ( упрощенный китайский :五笔字型输入法; традиционный китайский :五筆字型輸入法; пиньинь : wǔbǐ Zixing shūrùfǎ ; лит 'пять-тактный модель символов метод ввода'), часто сокращенно просто Wubi или Wubi Xing , [1] - это метод ввода китайских иероглифов, в основном предназначенный для ввода упрощенного китайского и традиционного китайского текста на компьютере. Вуби не следует путать с методом вубихуа (五 笔画)., который представляет собой другой метод ввода, разделяющий категории на пять типов штрихов.

Этот метод также известен как Ван Ма ( упрощенный китайский :王 码; традиционный китайский :王 碼; пиньинь : Ван мǎ ; букв. «Код Ваня »), названный в честь изобретателя Ван Юнминя (王永民). Существует четыре версии Wubi, которые считаются стандартными: Wubi 86, Wubi 98, Wubi 18030 и Wubi New-Century (версия 3-го поколения). Последние три могут также использоваться для ввода традиционного китайского текста, хотя и более ограниченным способом. Wubi 86 - наиболее широко известный и используемый метод ввода на основе формы для полнобуквенных клавиатур в материковом Китае.. Если также часто необходимо вводить традиционные китайские символы, другие методы ввода, такие как CangJie или ZhengMa, могут лучше подходить для этой задачи, и также гораздо больше шансов найти их на компьютере, который нужно использовать.

Метод Wubi основан на структуре символов, а не на их произношении, что позволяет вводить символы, даже если пользователь не знает произношения, а также не слишком тесно связан с какой-либо конкретной разговорной разновидностью китайского языка . Кроме того, он чрезвычайно эффективен: почти каждый символ может быть написан максимум 4 нажатиями клавиш. На практике большинство символов можно написать меньшим количеством символов. Есть сообщения о том, что опытные машинистки набирают 160 символов в минуту с помощью Wubi. [2]То, что это означает в контексте китайского языка, не совсем то же самое, что и для английского языка, но это правда, что Wubi очень быстр, когда его использует опытный машинист. Основная причина этого в том, что, в отличие от традиционных фонетических методов ввода, не нужно тратить время на выбор нужного символа из списка гомофонических возможностей: практически все символы имеют уникальное представление.

Как следует из названия, клавиатура разделена на пять регионов. Китайский иероглиф(bǐ), при использовании в контексте написания китайских иероглифов, относится к мазков , используемых в китайской каллиграфии. Каждой области присвоен определенный тип штриха.

  • Область 1: горизонтальная (一)
  • Область 2: вертикальная (丨)
  • Область 3: вниз справа налево (丿)
  • Область 4: точечные штрихи или штрихи слева направо вниз (丶)
  • Область 5: крючок

Основным недостатком изучения Wubi является более крутая кривая обучения, поскольку в качестве более сложной системы требуется больше времени для приобретения навыка. Запоминание и практика - ключевые факторы для умелого использования.

В этой статье будет использоваться следующее соглашение: символ всегда будет означать китайский иероглиф, тогда как буква , клавиша и нажатие клавиши всегда будут относиться к клавишам на клавиатуре.

Как это работает [ править ]

По сути, персонаж разбивается на компоненты, которые обычно (но не всегда) такие же, как радикалы . Они набираются в том порядке, в котором они были бы написаны от руки . Чтобы гарантировать, что чрезвычайно сложные символы не требуют чрезмерного количества нажатий клавиш, любой символ, содержащий более 4 компонентов, вводится путем ввода первых 3 записанных компонентов, а затем последнего. Таким образом, данные каждого персонажа могут быть введены не более чем 4 нажатиями клавиш.

Wubi распределяет свои символы очень равномерно, и поэтому подавляющее большинство символов однозначно определяется четырьмя нажатиями клавиш, описанными выше. Затем нужно ввести пробел, чтобы переместить символ из входного буфера на экран. В случае, если четырехбуквенное представление символа не является уникальным, можно ввести цифру для выбора соответствующего символа (например, если два символа имеют одинаковое представление, при вводе 1 будет выбран первый, а 2 - второй). В большинстве реализаций пробел всегда можно ввести, что означает просто 1 в неоднозначной настройке. Интеллектуальное программное обеспечение будет пытаться убедиться, что персонаж в позиции по умолчанию является желаемым.

Многие персонажи имеют более одного представления. Иногда это делается для простоты использования, если есть более чем один очевидный способ разбить персонажа. Однако чаще это происходит потому, что некоторые символы имеют короткое представление, состоящее менее чем из 4 букв, а также «полное» представление.

Для символов с менее чем 4 компонентами, которые не имеют краткого представления формы, каждый компонент вводит, а затем "заполняет" представление (то есть набирает достаточно дополнительных нажатий клавиш, чтобы сделать представление 4 нажатиями клавиш), вручную вводя штрихи символа последний компонент в том порядке, в котором они будут написаны. Если штрихов слишком много, следует написать как можно больше, но последний штрих ставить последним (это отражает правило компонентов для символов с более чем 4 компонентами, описанными выше).

Как только алгоритм будет понят, можно ввести практически любой символ, немного потренировавшись, даже если он не набирал его раньше. Мышечная память гарантирует, что частым машинистам, использующим этот метод, не придется думать о том, как на самом деле построены символы, точно так же, как подавляющее большинство английских машинисток не особо задумываются о написании слов, когда пишут.

Детали реализации [ править ]

Многие реализации используют дальнейшую оптимизацию с использованием нескольких слов. Обычно обычно используемый орграф (двухсимвольное слово), в котором оба символа имеют краткую форму представления с двумя нажатиями клавиш, можно объединить в одно представление с четырьмя нажатиями клавиш, которое генерирует два символа, а не один. Также есть несколько ярлыков из трех символов и даже один, более длинный, политически мотивированный. [ требуется пояснение ] Некоторые из них приведены в разделе примеров ниже.

Другой распространенной особенностью является использование клавиши «z» в качестве подстановочного знака. Метод Wubi был разработан с учетом этой особенности; вот почему клавише z не назначены никакие компоненты. В принципе, можно ввести az, когда не уверены, каким должен быть компонент, и метод ввода поможет завершить его. Если бы кто-нибудь знал, например, что символ должен начинаться с «kt», но не был уверен, каким должен быть следующий компонент, то при вводе «ktz» был бы получен список всех символов, начинающихся с «kt». Однако на практике многие механизмы ввода используют метод табличного поиска для всех систем ввода на основе таблиц, включая Wubi. Это означает, что у них просто есть большая таблица в памяти, связывающая разные символы с их соответствующими представлениями. Тогда метод ввода просто превращается в поиск по таблице.В такой реализации клавиша z нарушает парадигму и, как таковая, не встречается в большинстве универсальных программ (хотя метод ввода Wubi, обычно используемый в китайской Windows, реализует эту функцию). По этой же причине оптимизация нескольких символов, описанная в предыдущем абзаце, также относительно редка.

Некоторые методы ввода, такие как xcin (можно найти во многих UNIX-подобных системах), предоставляют универсальную функциональность с подстановочными знаками, которая может использоваться во всех системах ввода на основе таблиц, включая пиньинь и практически все остальное. Xcin использует "*" для автозаполнения и "?" всего на одну букву, следуя соглашениям, введенным в области подстановки файлов UNIX. Другие реализации, вероятно, имеют свои собственные соглашения.

Подразделение клавиатуры [ править ]

Клавиатура Wubi предполагает QWERTY- подобную раскладку, поэтому пользователям клавиатур, реализующих национальную или альтернативную раскладку (например, Dvorak или французскую AZERTY ), вероятно, придется сделать некоторое переназначение, чтобы сделать систему разумной. Wubi не позиционирует свои компоненты произвольно: их слишком много, и только с введением логической методологии систему становится легко изучить.

По сути, клавиатура разделена на 5 зон, каждая из которых представляет собой штрих. Эти пять ударов: падение влево, вправо, горизонтальное, вертикальное и крючковое, а зоны, которые их представляют, - это QWERT, YUIOP, ASDFG, HJKLM и XCVBN соответственно. Все эти зоны расположены горизонтально, за исключением буквы M, которая не совпадает с остальными буквами в этой зоне.

В общем, клавиатуру можно представить как разделенную по центру между T и Y, G и H, а также N и M. Нумерация клавиш в каждой зоне идет от этой разделительной линии: поэтому мы должны фактически сказать что в зоне QWERT, T - первая буква, R - вторая, а E - третья; в зоне YUIOP Y - первое, U - второе, I - третье и т. д. Для XCVBN N - первое и так далее. В HJKLM считайте M последним в серии, даже если он не лежит на линии.

Это важно, потому что компоненты в первой позиции будут иметь одно повторение рассматриваемого удара (штрих, назначенный зоне, к которой они принадлежат), компоненты во втором - два, компоненты в третьем - три. Те компоненты, которые нелегко классифицировать с использованием этой парадигмы, будут помещены на последнюю букву.

Следовательно, можно было бы ожидать, что будет расположено на G, 二 - на F, а 三 - на D, и это действительно так. Точно так же можно было бы ожидать, что 丨 будет находиться на H, 刂 - на J, а 川 - на K. Этот образец справедлив для всех зон. Более того, это распространяется на большинство радикалов, которые выглядят так, как будто они состоят из трех таких штрихов, даже если на самом деле их может и не быть. Примером этого является 中 на K: хотя у него нет трех нисходящих штрихов (только два), кажется, что у него есть три. Кроме того, он пишется от руки, сначала пишется корень рта, 口, а затем делится пополам вертикальным штрихом вниз. Радикальный рот лежит на «К», так что это делает задание вдвойне логичным. И латинизация пиньинь, kou3, начинается с k, еще одного вспомогательного средства памяти, закодированного в клавиатуре Wubi.

Кроме того, каждая буква каждой зоны имеет один связанный с ней компонент, его «главный компонент». Обычно это полный символ (за исключением X) сам по себе. Этот основной компонент всегда можно набрать, набрав букву, на которой он расположен, четыре раза. Так, например, основным компонентом H является 目, поэтому его можно было бы ввести, набрав «hhhh».

С каждой буквой также связан ярлык. В некоторых случаях этот символ совпадает с компонентом, связанным с рассматриваемым ключом, а иногда и нет. Этот ярлык - это символ, который создается, когда вводится только буква и ничего больше; все это чрезвычайно распространенные символы, используемые при наборе текста на китайском языке.

Вполне возможно, что существует ряд компонентов, не перечисленных ниже, либо из-за недосмотра, потому что они редко используются, либо из-за того, что не существует простого представления Unicode для компонента.

Зона QWERT (падающая влево) [ править ]

Главный компонент клавиши Q - 金, а его ярлык - 我. Он связан со следующими компонентами: 金, 钅, 勹, 儿, 夕, а также крючком в верхней части 饣 и 角, радикалом 犭без нижнего нисходящего штриха (поэтому символы с этим радикалом начинаются с " qt ", а не только" q "), крест-накрест (например, в центре), верх (то есть без горизонтального штриха внизу) и три (почти вертикальные)" ноги " в правом нижнем углу 流.

Главный компонент клавиши W и символ быстрого доступа - 人. Он связан со следующими компонентами: 人, 亻, 八 и вершиной 癸. В то время как 人 означает человек, Вуби часто использует его для создания коренной крыши, например, в 会, «wfc». Не управляется W, несмотря на то, что выглядит похожим, и хотя 餐 имеет вершину, которая отдаленно похожа на верхнюю часть 癸, они не совпадают (действительно, чтобы ввести 餐, нужно физически напечатать каждый компонент наверху) .

Главный компонент клавиши E - 月, а его ярлык - 有. Он связан со следующими компонентами: 月, 用, 彡, 乃, низ 衣 (т. Е. Без 亠), верх (т. Е. Без 子), ((pig), низ (т. Е., без) и нижней части 舟 (т. е. без маленькой точки наверху). В этом случае ярлык E даже не начинается с нисходящей черты влево, а просто выделяется на видном месте компонента, принадлежащего E. 彡 присутствует на этом персонаже, так как это третий символ в зоне (считая от T, см. над). Особое искажение, которое часто возникает, - это использование E в 且 и в символах, содержащих его: Wubi думает об этом компоненте как 月 + 一.

Главный компонент клавиши R - 白, а его ярлык - 的. Он связан со следующими компонентами: 白, 手, 扌, 斤 (как с буквой T, так и без нее), 牛 ( без вертикальной нисходящей черты) и, конечно же, двумя линиями, падающими влево (я не могу найти глиф Unicode, который представляет их), чего можно было бы ожидать от второго ключа в зоне (см. объяснение выше). Обратите внимание на разновидности 手, в которых центральный нисходящий крючок заменяется нисходящим штрихом влево, например, в 看.

Главный компонент клавиши T - 禾, а ее ярлык - 和. Он связан со следующими компонентами: 禾, 竹, 夂, 攵, 彳 и вершиной 乞 (т. Е. Без 乙). 竹 также можно найти в его меньшей форме (⺮). 丿 также находится на этой клавише, потому что T - первая клавиша в зоне (см. Выше). Это означает, что если кто-то набирает компонент или символ штрих за штрихом, они (обычно) используют T для представления нисходящего штриха. См. Раздел о штрихах устранения неоднозначности для получения дополнительной информации об исключениях из этого правила.

Зона YUIOP (падающая вправо) [ править ]

Эту зону можно также назвать точечной зоной, потому что ее рисунок Y: 讠 U: 冫 I: 氵 и O: 灬 на самом деле не обязательно состоит из падающих вправо штрихов. Фактически, можно утверждать, что первый удар в 灬 на самом деле падает влево . Это называется спадающей правой зоной, потому что все клавиши в этой зоне, когда они используются для создания символа штрихом (а не компонентом), представляют собой правые падающие штрихи для некоторой конфигурации персонажа (см. Раздел о штрихах устранения неоднозначности для получения дополнительной информации).

Главный компонент клавиши Y - 言, а ее ярлык - 主. Он связан со следующими компонентами: 言, 讠, 亠, 亠 с 口 под ним, 广, 文, 方 и 丶. Все эти компоненты начинаются с движения вправо. Как правило, точки в китайских иероглифов фактически осталось падение инсульты, и поэтому большую часть времени, использование Т является более подходящим , чем Y. Конечно, если можно писать китайские иероглифы от руки, они должны быть в состоянии сказать , что выбрать вспомнив, как это написано.

Главный компонент клавиши U - 立, а ее ярлык - 产. Он связан со следующими компонентами: 立, 六, 辛, 门, 疒, 丬, 冫, «усиками» в верхней части 单 (всего два штриха: 丷) и усиками плюс горизонтальный штрих, как показано на верхняя часть. Большинство из них имеют два коротких диагональных штриха (门 - очевидное исключение). Это согласуется с местом R как второй буквы в зоне (объяснение см. Выше).

Главный компонент клавиши I - 水, а его ярлык - 不. Он связан со следующими компонентами: 水, 氵, 小, тремя штрихами в верхней части 学 и тремя штрихами в верхней части. Кроме того, с этим символом связан компонент, который можно описать как две 冫, расположенные вплотную друг к другу.

Главный компонент клавиши O - 火, а его ярлык - 为. Он связан со следующими компонентами: 火, 米, 灬 и 业без нижнего горизонтального штриха - это позволяет создавать символы, такие как 严. Это 4-я клавиша в падающей правой зоне: отсюда и включение.

Главный компонент клавиши P - 之, а его ярлык - 这. Он связан со следующими компонентами: 之, 辶, 廴, 冖, 宀 и 礻. Поскольку компоненты Wubi набираются в том порядке, в котором они должны были бы быть написаны вручную, компоненты 辶 и 廴 обычно вводятся последними .

Зона ASDFG (горизонтальная) [ править ]

  • Ярлык клавиши A - 工.
  • Главный компонент клавиши S - 木, а его ярлык - 要.
  • Главный компонент клавиши D - 大, а его ярлык - 在.
  • Главный компонент клавиши F - 土, а ее ярлык - 地. Название основного компонента (земля) соответствует ярлыку, который означает земля.
  • Основной компонент клавиши G - 王, а ее символ быстрого доступа - 一.

Зона HJKLM (по вертикали) [ править ]

  • Главный компонент клавиши H - 目, а ее ярлык - 上.
  • Основной компонент клавиши J - 日, а ее ярлык - 是.
  • Главный компонент клавиши K - 口, а его ярлык - 中.
  • Основной компонент клавиши L - 田, а ее ярлык - 国.
  • Главный компонент клавиши M - 山, а ее ярлык - 同.

Зона XCVBN (крючок) [ править ]

  • Главный компонент клавиши X - 纟, а его ярлык - 经.
  • Основной компонент клавиши C - 又, а ее ярлык - 以.
  • Главный компонент клавиши V - 女, а его ярлык - 发.
  • Главный компонент клавиши B - 子, а ее ярлык - 了.
  • Главный компонент клавиши N - 已, а ее ярлык - 民.

Штрихи устранения неоднозначности [ править ]

Штрихи клавиатуры разделены на 5 зон



Примеры [ править ]

Персонажи с 4 или менее компонентами (но без штрихов) [ править ]

Пример 1: 请 Состоит из трех компонентов: y (讠, радикал # 10), g (王 *, радикал 89), e (月, радикал 118) -> 请

Персонажи с более чем 4 компонентами [ править ]

Пример 2: 遗

Состоит из пяти компонентов: k (口), h (丨), g (一), m (贝), p (辶) -> khgp -> 遗 (ввод m не нужен)

Персонажи, состоящие менее чем из 4 компонентов (требующие штрихов) [ править ]

Пример 3a: 文 : Сначала вы вводите ключ с символом на нем, который оказывается «Y». Затем вы вводите первый компонент, который также является «Y» для штриха 点, затем «G» для 横 штриха ,, и, поскольку у вас уже есть три штриха, вы вводите последний штрих, который также оказывается 捺, достигнув ключевого кода "YYGY" для всего символа.

Пример 3b: 一 : Код этого символа - «GGLL». Как и раньше, вы сначала набираете клавишу для символа, то есть «G», а затем первый штрих этого символа, который также является «G». Поскольку это вся необходимая информация, L используется как заполнитель, пока вы не дойдете до 4 букв. [2] Обратите внимание, что «一» также является сокращенным символом для «G» (на практике это делается только одним штрихом).

Пример 3c: 广 : Код этого символа - «YYGT». Сначала вы набираете клавишу, на которой расположен этот символ, то есть «Y». Затем вы набираете черту 点, которая также находится на «Y». Следующим будет штрих на «G», а последним будет 横 на «T».

Персонажи, требующие штрихов для устранения неоднозначности [ править ]

Пример 4: 等

Состоит из трех компонентов: t (竹), f (土), f (寸),

Штрихи устранения неоднозначности: последний штрих - 丶, и символ имеет структуру сверху-снизу (42, u) -> 等

Поэма [ править ]

Стихотворение было создано как мнемоника для клавиатуры Wubi, в которой с каждой клавишей было связано несколько символов. Первый символ - это соответствующий ключевой главный компонент, а следующие - компоненты или связанные символы.

Версия 1986 года [ править ]

G11 王 旁 青 头 戋 五一

F12 土 士 二 干 十 寸 雨

D13 大 犬 三 羊 古 石 厂

S14 木 丁西

A15 工 戈 草 头 右 框 七

H21 目 具 上 止 卜 虎皮

J22日早两竖与虫依

K23 口 与 川 , 字根 稀

L24 田 甲方 框 四 车 力

M25 山 由 贝 , 下 框 几

T31 禾 竹 一 撇 双人 立 , 反 文 条 头 共 三 一

R32 白手 看头 三 二斤

E33月彡 (衫) 乃 用 家 衣 底

W34 人和 八 , 登 祭 头

Q35 金 勺 缺点 无 尾 鱼 , 犬 旁 留 义 夕 , 氏 无 七

Y41 言 文 方 广 在 四 一 , 高 头 一 捺 谁人 去

U42 立 辛 两点 六 门 疒 (病)

I43 水 旁 兴头 小 倒立

O44 火 业 头 , 四 点 米

P45 之 宝盖 , 摘 示 衣

N51 已 半 巳 满 不出 己 , 左 框 折 尸 心 和 羽

B52 子 耳 了 也 框 向上

V53 女 刀 九 臼 山 朝西

C54 又 巴马 , 丢 矢 矣

X55 慈母 无心 弓 和 匕 , 幼 无力

Версия 1998 года [ править ]

G11 王 旁 青 头 五 夫 一

F12 土 干 十 寸 未 甘雨 , 不要 忘 了 革 字 底

D13 大 犬 戊 其 古 石 厂

S14 木 丁西 甫一 四 里

A15 工 戈 草 头 右 框 七

H21 目 上 卜 止 虎 具 头

J22 日 早 两 竖 与 虫 依

K23 口 流川 , 码 元 稀

L24 田 甲方 框 四 车里

M25 山 由 贝 骨 下 框 集 

T31 禾 竹 反 文 双人 立

R32 白 斤 气 丘 叉 手提

E33 月 用力 豸 毛衣 臼

W34 人 八 登 头 单 人 几

Q35 金 夕 鸟儿 犭 边 鱼

Y41 言 文 方 点 谁人 去

U42 立 辛 六 羊 病 门 里

I43 水族 三点 鳖 头 小

O44 火 业 广 鹿 四 点 米

P45 之 字 宝盖 补 示 衣

N51 已 类 左 框 心 尸 羽

B52 子 耳 了 也 乃 框 皮

V53 女 刀 九 良 山西 倒

C54 又 巴 牛 入 马 失蹄

X55 幺 母 贯 头 弓 和 匕

Версия нового века (3-го поколения) [ править ]

G11 王 旁 青 头 五一 提 

F12 土 士 二 干 十 寸 雨

D13 大三 肆 头 古 石 厂 

S14 木 丁西 边 要 无 女 

A15 工 戈 草 头 右 框 七

H21 目 止 具 头 卜 虎皮 

J22 日 曰 两 竖 与 虫 依 

K23 口中 两 川 三个 竖

L24 田 框 四 车 甲 单 底 

M25 山 由 贝 骨 下 框里

T31 禾 竹 牛 旁 卧 人 立 

R32 白 斤 气 头 叉 手提 

E33 月 舟 衣 力 豕 豸 臼 

W34 人 八 登 祭 风头 几 

Q35 金 夕 犭 儿 包头 鱼

Y41 言 文 方 点 在 四 一 

U42 立 带 两点 病 门 里 

I43 水边 一族 三点 小 

O44 火 变 三 态 广 二 米 

P45 之 字 宝盖 补 示 衣

N51 已 类 左 框 心 尸 羽 

B52 子 耳 了 也 乃 齿 底 

V53 女 刀 九 巡 录 无水 

C54 又 巴 甬 矣 马 失蹄 

X55 幺 母 绞 丝 弓 三 匕

Примечания и ссылки [ править ]

  1. ^ Это имя используется в Mac OS X
  2. ^ a b Wicentowski, Joe (1996), Wubizixing для носителей английского языка , заархивировано из оригинала 10 июля 2015 г.

Внешние ссылки [ править ]

  • Официальный веб-сайт
  • Полные таблицы последовательностей Wubi