MORE部屋 品書きへ


11.びば!ユーザ辞書ツール (株)シャープ

 E1購入の決め手が連文節変換だったというのはさんざん書き散らしてきたことだけれど、何度強調してもし足りない。ストレスなく日本語が入力できることがこれほどありがたいとは。

 あまりのありがたさに、予想したとおり、インクワープロ参照を使う機会が激減してしまった。以前は"牛乳"だの"野菜ジュース"だの行きつけの呑み屋の名前だのをインクワープロに入れて、日記を書くたびに参照していたものだが、ボード切り替えて探してなぞって入力してという手間が面倒で、結局ぷちぷちと打ってしまっている。純粋に入力時間を比べるとあるいは微妙な勝負なのかもしれないが、精神的手間というのは私にとってかなりのストレスで、打った方がましなのだ。ことほど左様に、E1の日本語入力は優れている。

 顔文字IT!なんてモノもあるしIDボードもあるしで、E1での入力支援環境は既にして、PDAとしては鉄壁というべきものだった。

 そこに満を持して、ユーザ辞書登録ツール。うぅん素晴らしい。トラップさんも書いておられるが、全E1ユーザ必携である。たったの\300-だし。まめに登録さえすれば、入力ボードの文字種とか全角半角/大文字小文字とかの切り替えをスキップもできるわけで、なんとまぁ快適な。読み10文字に変換対象40文字(いずれも全角カウント)というのも充分で、80桁あれば大抵のURLまでも入ってしまう。こんま→http://homepage1.nifty.com/CommA/とか。あー楽だ楽だ。ほんとにPDAかぁ、おまえ。

 最近のシャープMOREは辞書ツールに限らずオンラインマニュアルが充実していて、これも特筆。使い慣れたつもりのMOREでも、一度マニュアルを精読してみると意外な発見があったりするものだ。

 ということでしばらくいじってみて、気がついたポイントをいくつか。


その一
 マニュアルに明記されているが、同じ見出し語でも15個まで登録可能。"かお"でフェースマークいろいろぶち込んでいくとか、自由自在。入力する時は"かお"だけ入れて変換キーを押していけば切り替わる。私が使うフェースマークってせいぜい4種くらいなんで、顔文字IT!より私にとっては快適。ペン要らないもん。HTMLタグもできるけれど、こちらは種類が多いんでちょっと不向きか。


そのニ
 オンラインマニュアルには"ユーザー辞書に登録した登録語は、変換時、一番最初の候補として表示されます。ユーザー辞書では学習は働きません。"とあって、これはこれで正しい。確かに登録した読みだけを入れて変換した時はその通りだけれど、文節の中に入ると一歩遠慮するらしい。
 例えば、"わたし"という読みに対してはもともと、"私""渡し""わたし"の3つが変換候補に出る。ここで
わたし→宮本武蔵
わたし→東京都三鷹市XXXXX
なんてのをこのツールで登録すると、"わたし"と打った最初の変換候補はこうなる。

宮本武蔵
東京都三鷹市XXXXX

渡し
わたし

ここで"私"を確定しても、候補順は変わらず、確かに学習されていない。けれど、"わたし(は)びょういんにいく"で変換すると、


宮本武蔵
東京都三鷹市XXXXX
070-5XXX-4XXX
渡し
わたし

こうなってくれる。実用的かつリーズナブルで、よいよい。ちなみに、"それはかれにわたした"は、きちんと"それは彼に渡した"が出てくる。賢い賢い。


その三
 これはかなりグレーな話なのだけれど、このツールが作る辞書データは、実は単なるテキストファイルである。書式を合わせてPCで作り、本体に転送してやれば...あらら、成功してしまった。ファイル名を公表するとシャープさんへの営業妨害になってしまうのでこれだけは口が裂けても言えないが、うんとこしょとまとめて登録する場合にはやはりこの方が早い。わせわせと登録した辞書のバックアップ対象もこのファイル。
 もちろん単体でメンテできるメリットは大きく、ユーザ辞書登録ツールの必然性が損なわれるわけではないので為念。


 登録できる数には限りがあるが(ファイルサイズ制限であろうか)、データがアレである以上データファイルを切り替えるMOREなんてのは造作もないだろう。すぐ誰かが作りそうな気もする。今後各種専門分野特化辞書なんかも出るだろうし、期待ふくらむところ。ますますもって最強の日本語入力ツールである。

(2001/02/19)

(2001/02/21 追記)

 登録ツール関連MORE第一弾は、やはりボビーさんから。ユーザー辞書インポーター、公開。辞書データ仕様公開云々は、宝箱の公開ツール/サンプルなどに関するフォーラムで読めたりする。これが実現すれば、さらに高度な辞書運用ができる、らしい。うふうふうふ。

(2001/02/21 追記 その2)

 とりあえず困っていたのが、"楽器を奏く"の"奏く"が出ないこと。もう一つ、娘の愛称が"まひ"なんだけど、これが文節の中では一歩遠慮してしまって"麻痺が"とか"マヒが"が第一候補に出ること。
 で、データファイルのフラグを変えながら試行錯誤してみた。その結果、"奏く"(か行5段活用動詞)については

品詞フラグ実験1
      語幹のみ 未然 連用 終始 連体 仮定 命令
読み 単語 フラグ 奏かない 奏きます 奏く 奏くこと 奏けば 奏け
0 1 0 0 0 0 0 0
    1 1 0 0 0 0 0 0
    2 1 0 0 0 0 0 0
    3 0 0 0 1 0 0 0
    4 1 0 0 0 0 0 0
    5 0 1 1 1 1 1 1

(O:NG,1:OK)

となり、フラグ5が正解。また、"まひ"については

品詞フラグ実験2
読み 単語 フラグ      
まひ まひ   まひ まひが まひは
    0 1 0 0
    1 1 1 1

で、フラグ1が正解となった。

 もとよりきちんと品詞を特定しているわけでもないので危ういが、要するにこのフラグで品詞区別していることは確かで、まぁ恐らく0は品詞指定なしなのだろう。上記そのニで長々例を引いているのはこの指定なしの場合だったわけだ。

 変格活用やら形容動詞やらいろいろ定義されているのかもしれないが、私の日常で困る単語はこれで救えたので、とりあえず解析はここで打ち切り。面倒なのだ、かなり。ClipLinkのおかげで、フラグ変えたファイルを転送するのは楽にできるのだけれど。

 やっぱ、早いところ仕様公開してくださいな、シャープさん。

(2001/02/22 追記 その3)

 ボビーさんのツールが1.10になってフラグを隠さない仕様に変更、解析結果はここ、と振られてしまったので追記。ご覧のように、こういった解析でわかることもありますよ、というサンプルの域を出ない。ちなみに、か行五段活用のフラグは5ではなく、6が正解。上記は、この程度の信頼性のものでしかない。正確な仕様は近日シャープ社から公開される予定なので、お待ちあれ。

(2001/04/05 追記 その4)

 ユーザー辞書ファイルフォーマット公開。か行五段は6、ってそれはいいんだけれどこのドキュメント中の品詞登録例、既に入っているものばっかりに見える。ま、"奏く"なんて例を15の品詞すべてに見つけるのは大変なのでやむを得ないか。とまれ、これでやっと、ユーザー辞書インポーター活用の幅が拡がる。めでたし。

(追記終わり)