PRUV開発室

文体統一チェック機能開発開始

カテゴリー:新機能  作成日:2022-02-18

「です・ます」調と「だ・である」調の統一は文章作成の基本です。テクニックとして意図的に異なる文体を入れ込むことはありますが、原則としては統一する必要があります。

これを支援する機能を開発中で、ようやく形になってきました。完成したらPRUV Pro/Business用機能として提供します。

開発方針として、
・地の文と会話文に分けて扱う
 地の文はだ・である調、会話文はです・ます調といったケースを想定しています。

・だ・である調とです・ます調が混在する場合、少ない方を「ゆれ」と見なす
 両者が同数の場合は両方を指摘対象とします。

・体言止めは対象外
 どちらの文体でも使われる可能性があるためです。

これらが「大体」動くようになったので、しばらくテストしつつ文体のサポートを拡大します。文末の表現は案外多彩で、まだチェックもれが発生しているようです。提供はもう少しお待ちください。

なお、複数人が登場してそれぞれ口調(文体)が異なるというケースには対応しません。というかできません。自然言語で話者を機械的に判定する方法がないからです。各話者のセリフデータ集を作ってディープラーニングで学習させれば、話者判定AIを作ることは不可能ではありません。が、1回限りの文章チェックのために使える手法ではありません。

仮に判定AIを作っても、実際問題として口調だけでは十分な推論結果を得られないでしょう。必ず変な語尾を付ける変なキャラならともかく、例えば銀英伝のルッツとワーレンのセリフを「内容」(コンピュータは内容を理解しません)ではなく「口調」で区別するのは人間でも不可能では。「うへぇ」と言ったら……鳥口ですね。これは分かります。