もしかしてルール編
「もしかして」ルールは、登録した「正しい表記」を基に表記揺れや誤入力を検知するルールです。単語(形態素)の区切りを意識することなく、「正しい表記」を登録するだけで機能します。
他のルールは誤っている、あるいは禁止したい表記を登録するものであり、誤入力があってもそれに対応するルールが存在しなければ検知できません。もしかしてルールは、「正しい表記と似ているが同一ではない表記」を検出することで検出モレを低減します。
画面1 入力するのは正しい表記だけ
「東京スカパラダイスオーケストラ」という正しい表記をルールとして登録すると、「東京スカパラダイスオケストラ」「東京スカパララダイスオーケストラ」といった誤入力に対して「もしかして:東京スカパラダイスオーケストラ」と指摘します。
もしかしてルールも万能ではなく、正しい表記との違いが大きすぎると「似ていない=別の言葉である」と判定してチェック対象から除外します。人間の目にはわずかな違いに見えてもプログラム的には(計算上は)違いが大きいというケースも発生します。
正しい表記同士の干渉も発生します。「コミュニケーション」だけ登録した場合、「マスコミュニケーション」という正しい表記が「コミュニケーション」の誤入力として検知されます。この場合は「マスコミュニケーション」ももしかしてルールに登録することで回避できます。
文字数が少ない場合も機能しません。例えば「本田」と登録した場合、「本多」「本屋」は1文字違いとはいえ正しい表記との一致度は50%であり、「全く別の単語」として処理の対象外になります。わずか50%の一致度を表記揺れとして検知対象にすると「もしかして」まみれになってしまいます。また「ホンダ」と「Honda]も人間の目から見れば立派な表記揺れですが、文字列としては全く一致点がないため対象外です。
もしかしてルールは処理負荷が高いので、多用するとチェックに時間がかかります。適宜単語ルールなども活用して適材適所でルール定義することをお勧めします。