next up previous
: 2 canna を使う最低限の設定と使い方 : cannaによる日本語入力 : cannaによる日本語入力


1 UNIXでの日本語入力の仕組み

UNIX環境では、変換サーバー/変換クライアント/各アプリケーションの3者が日 本語入力に関係していて、変換サーバーと変換クライアントは、別なマシンにあっ てもよい。これは、クライアント機が変わっても、同じ辞書を参照できるように するための仕組みである。これら3者のおおまかな関係を簡単に図示すると、次 のようになる。この図は、かなり簡略化しており、もっと詳細な関係は、 こちら で見ることが出来る。

図 1: UNIXにおける日本語入力の概略図
\includegraphics[width=\textwidth]{relation.eps}

変換サーバー

変換クライアントから 「かな」 などを受取り、「漢字」に変換して返す役割を 持つ。 Wnn 1 の jserver、 Canna 2 の cannaserver など。辞書の豊富さ、変換のア ルゴリズム、学習機能などが変換効率に影響する。

変換クライアント

ユーザーの入力を受け、変換サーバと通信して漢字にしてアプリケーショ ンに渡す役割。ユーザーインタフェースを受け持ち,使い勝手に大きな影響を 持つ。kinput2、 xwnmo3、 uum4、 canuum5、 skkinput6など。

アプリケーション

X7上の国際化したアプリケーションは、変換クライアントと通信する能力 をもつ(tgif,mozillaなど)。また、emacs のように、アプリケーションに よっては、自前で変換クライアント機能 ( たまご8や canna) を持ち、直接、変換サーバーと通信するものもある。

変換サーバーと変換クライアントとの関係

どの変換サーバーと通信できるかは、変換クライアントによって決まって いる。uumやxwnmoは Wnn と、canuumは Canna と通信できる。kinput2は、 コンパイル時の指定で、Canna、Wnn(FreeWnn, Wnn6, Wnn7)、Sj3と通信可能 になる。

変換クライアントとアプリケーションとの関係

Xでの変換クライアントとアプリケーションが通信する方法には、 歴史的にいくつかのプロトコルが用いられて来た。 例えば、変換クライアントである kinput2 は、manual page によれば、
	   kinput protocol
	   kinput2 protocol
	   Matsushita jinput protocol
	   Sony xlc protocol
	   XIMP protocol
	   X Input Method Protocol (X Consortium standard)
のプロトコルに対応している。また、X でのお絵書きソフトである tgif は、 "xcin", "chinput","kinput2", "xim" の4つのプロトコルに対応している。 現在は、XIM(X Input Method)プロトコルがほぼ標準になってきたので、 国際化したほとんどのアプリケーションは、 XIM に対応していると考えて間違いない。 XIM で実際に使う変換クライアントは、通常、環境変数 XMODIFIERS で指定する。

1.1 日本語入力の手順

一般的に、日本語入力は次の手順で行われる。

以上の操作のように、ユーザーの側から見ると、日本語入力システムはひとつに 見えるかもしれないが、内部的には、変換クライアントと変換サーバーの役割は 明確に分離している。例えば、「ぁぃぅぇぉ]という「かな]を出したり、"ABC" と入力したとき、"ABC" 、 "ABC"、"あBC"、"あBC" のどれをフェンスモー ドに表示するかは、変換クライアントの仕事であり、 その部分を使い易くするためには、変換クライアントのカスタマイズが必要である。 一方、ある単語が漢字に変換できなかったり、 自分で良く使う単語が候補の最後の方に現れるのは、変換サーバーの所為であり、 変換サーバーの辞書を賢くしたり、変換サーバーに頻度学習を行わせる必要がある。



... Wnn1
京大とオムロンとの共同開発。Version4 までは、フ リーソフトウェアとして公開されていたが、現在は、Wnn6, Wnn7 は商用で 市販されている。私の名前は中野です、を一発で変換できるようにするのを目標 として開発され、それが Wnn の語源。
... Canna2
元々 は NECで開発され、現在は、sourceforge.jp 上で開発が続けられている。
... xwnmo3
Wnn用の X 上の変換クライアント。
... uum4
Wnn用の文字端末用変換クライアント。wnnを180°回転させた。
... canuum5
Canna 用の uum
... skkinput6
SKK用の X 上の変換ク ライアント
... X7
X Window system のこと。略称は、X または、X11 で、X window とは呼ばない。
... たまご8
Wnn の変換クラ イアント。くさん たせて めんなさい、の頭文字をとった。その英訳で egg とも呼ばれる。

next up previous
: 2 canna を使う最低限の設定と使い方 : cannaによる日本語入力 : cannaによる日本語入力