形態素解析辞書チューニング サ変名詞編

LINEで送る
Pocket

オンライン文章校正支援サービス「PRUV」が使用している形態素解析辞書は、「サ変名詞」も固有名詞として登録されています。サ変名詞には文法的な機能があるので、分類の変更は重要な意味を持ちます。

サ変名詞とは、「する」「した」を接続して動詞化できる名詞です。例えば、「管理(する)」「検討(した)」「インストール(する)」などです(「野球する」「お茶する」のように、話し言葉では普通名詞のサ変名詞化も行われますが)。

サ変名詞を普通名詞や固有名詞と区別することのメリットは幾つかありますが、ここでは2つの例を紹介します。

1つ目は、助詞の欠落の検知です。サ変名詞は、「食事する」「食事をする」のように、助詞を入れることも省くこともできます。しかし普通名詞は(無理にサ変名詞化しない限り)「結婚式する」「宿題する」のように助詞を省くことはできません。そこで、普通名詞の直後に「する」や「した」などが続いた場合は助詞が欠落している可能性があると分かります。

2つ目は、誤変換の検知です。「用意」はサ変名詞であり、「用意する」であれば全く問題ありません。しかし、編集の仕事をしているとしばしば「容易する」という誤変換を目にします。コンピュータが「用意」と「容易」の意味の違いを理解することはできませんが、各単語の品詞が正しく定義されてれば、「容易」+「する」の組み合わせがおかしいということは指摘できます。

現状ではサ変名詞が固有名詞として登録されているため、これに起因する誤検知が生じることもままありますが、辞書のチューニングが進めば徐々に解消するでしょう。