UniFEP V2 Logo


UniFEP Icon UniFEP V2仮名漢字変換のコツ

シンビアンプラットフォーム(EPOC)用の日本語環境「UniFEP V2 」で使われている日本語入力エンジン(FEP)は、最適な変換速度と辞書のサイズを考慮し、独自方式の変換を採用しています。一言ではなかなか説明できませんが、「送り仮名切り捨て単文節変換」という言い方が一番近いでしょう。しかし、AI変換がない、自動変換でなければと言い、かなり奥深いものがあります。この概念が理解されることにより、使いやすいもの、入力が自由になります。


UniFEPの信念:
言語や言葉というものは文化の大切な一部であり、社会と共に変化していきます。UniFEPの辞書は他社の製品と違い毎日磨かれていますので、現代語・流行言葉や最近強化してきたメール文化に合わせてどんどん進化しています。その結果、定期的にUniFEP愛用者の方々に提供していこうと努力しています。しかし、コンピュータにより失われている日本の言葉や亜細亜全体の誇りである漢字(ハンジ)文化はなによりも大切なものです。コンピュータによる制限と妥協は許しません。より深い辞書と広い文字セットは我々の目標であり、作者のライフワークでもあります。

まずUniFEPを使いこなすコツとして、入力する際「無いだろう」と思う単語をまず変換してみてください。現在のUniFEPの辞書は豊富で意外とデスクトップ用の仮名漢字変換エンジン(FEP)にない単語まで揃っています。人名・地名・旧漢字・四文字熟語・外来語・俗語・医療・科学・軍事・宗教・コンピュータ専門用語に力を入れてきました。その上、UniFEPには学習機能がありますので、ちょっとした手間をかけることによりどんどん賢くなります。その使い方については後程、詳しく説明します。V2用の辞書は定期的に更新をしますのでV2のモジュールページをチェックしてください。


辞書の中身:
最新のバージョンUniFEP V2には三段階の辞書と二段階の変換ルール集があります。辞書の三種類は:

  「Large.SIS」
  「Normal.SIS」
  「Small.SIS」

名前の通り、辞書の大きさが主な違いです。基本的に「Normal.SIS」がUniFEPのデフォルトです。文章を書くには十分な内容であり、その上深いところまでやってくれます。例えば、デスクトップで「さけぶ」変換してみると候補に「叫ぶ」ぐらいしか出てこないでしょう。しかし、UniFEPの「Normal.SIS」では六語が変換されます。

 さけぶ  →  叫ぶ 喊ぶ 嘖ぶ 号ぶ 號ぶ 嚆ぶ
 たたみ  →  畳 疊 疂 疉
 たたかう →  戦う 闘う 鬪う 戰う

この様な字は普段使用しないかも知れませんが、変換されないと困る可能性もあり得ます。これはUniFEPの漢字文化に対する拘りです。

Large.SISは別売の更に大量に人名・地名を足した辞書になります。

Small.SIS」は(初期)REVOのデフォルトインストール用で、できるだけ経済用語・医療用語を残しながら、滅多に使わない単語を削除したものです。削除した分類は:

 すべての平仮名 (変換しないで入力可)
 大半の片仮名  (サイコガルバノメーター・ロータリーエンジン Ctrl+kで変換可)
 旧漢字     (「あきなう」賈う,估う・「あまざけ」醴・「あまだれ」霤)
 四文字熟語   (ぜんじんみとう 前人未到,前人未踏)
 変形送り仮名  (取調べ)
 複数の丁寧語  (ご案内、御案内 → ご案内)
 専門用語    (婆娑羅)
 組み合わせ熟語 (記号論理学・北大西洋条約)
 その他     (既成の事実・土耳古)

それ以外、候補数もそれぞれ違います。
例えば、人名の「ひろし」では Large=301、Normal=65、Small=48
全体のサイズ比率は(圧縮前) Large - 40% = Normal - 40% = Small


ルール:
一般的にUniFEPは「送り仮名切り捨て・単文節」と言われていますが、意外に賢いルール方式も持っています。良くあるローマ字ベース送り仮名指定FEPより正確です。例えば、「抱いて」と「抱いた」は変換されますが「抱いと」という誤変換は出ません。

それに文法によって候補の順位入れ替え機能も含まれています。

  あてた → 当てた、宛てた、..
  あて  → 宛、当て、宛て、..

  いちします → 位置します、..
  いちし   → 一志、位置し、..
  いち    → 一、位置、市、..

このルールにより辞書のサイズを膨大にせず、誤変換を減らすことが出来ます。

連文節:
UniFEPは一部連文節も持っています。特別な例に限り、送り仮名の再変換も行っています。数字・国・地名・人名にはフラグを付けると、この様な一発変換も可能です:

  山田様
  豊田商事

  小泉総理
  織原容疑者
  十二月中旬
  鈴木株式会社

  新宿アルタ前
  厚木市役所の中
  新大阪駅北口改札
  一千七百万二千円
  三百八十五ページ目
  千駄ヶ谷二丁目八番十三号
  アフガニスタン共和国大統領

(※またすべての単語にフラグが付くというわけではありませんのでご注意ください。)

学習機能:
UniFEPは単漢字・あて字に強いということもあります。学習機能と組み合わせれば一発変換ができない場合でもそのまま切り分け変換をすることで、辞書にない熟語の入力ができ、UniFEPが記憶します。操作方法は、変換中(パレット内のカーソルが反転中)Ctr+矢印でカーソルを切り分け位置に移動させ、Enterを押すとカーソルの右側が変換されます。一つの変換に複数の切り分けが可能です。最後にEnterを押すとその変換が学習されます。

切り分け変換:
 しょうぎかいかん (Enter) = 将棋かいかん‖
 (Ctrl+←) = 将棋‖かいかん
 (Enter)= 会館‖ = 会館‖
 (Enter)

次回からは:
 しょうぎかいかん (Enter) = 将棋会館

学習辞書の単語数には限界があります(デフォルトでは1000単語)。操作に自信のある方は定期的に学習させた単語を単語登録すると良いでしょう。UniFEPパレット終了するとき(コントロールパネルで起動をオフにする)学習させた内容は C:/System/Apps/UniFEP/Learn.txt に保存されます。そこからコピーすることもできます。


キーアサイン:
ローマ字・仮名のキーアサインなどは /System/UniFEP/ の中に xxx.im というファイルに定義されています。変更する場合は、エディタで行います。(UniFEPパレットの再起動は必要)IMファイルの詳細についてはUniFEP SDKで説明があります。現在、変更方法についての正式なサポートはしておりません。



リチャード・ノースコット
2001年4月30日


go to Top トップページに戻る
Copyright Enfour Group 2001

連絡先 :