PRUV開発室

形態素解析辞書のチューニング

カテゴリー:お知らせ  作成日:2017-11-03

オンライン文章校正支援サービス「PRUV」は、これでも一応は毎日進化しています。例えば、形態素解析辞書のチューニングです。

形態素解析は、入力された文を単語に分割して品詞を決定する処理です。

今日は秋晴れだ

を、

今日(名詞・副詞可能)は(助詞・係助詞)秋晴れ(名詞・一般)だ(助動詞)

のようにします。この処理の基になるのが、形態素解析辞書。「今日」も「は」も「秋晴れ」も辞書に登録ているから正しく分割できるのです。PRUVでは、ネットで公開されている辞書を独自に拡張したものを利用しています。

続きを読む

通貨レートチェック機能

カテゴリー:新機能  作成日:2017-10-13

オンライン文章校正支援サービス「PRUV」に新機能を追加しました。

海外事情の記事作成に際して、現地通貨が出てくることがあります。そのままでもいいが、せっかくだから日本円換算した金額を併記したい。しかしいちいち為替レートを調べるのは面倒。そんなときに使える機能です。

1日4回(6時間ごと)に主要通貨と日本円のレートを自動取得。原稿中に「100ドル」などの記述があると、データ取得時のレートと日本円に換算した金額を以下のように表示します(「199.50ドル」の場合)。

続きを読む

片仮名語の表記ゆれチェック機能

カテゴリー:新機能  作成日:2017-06-24

オンライン文章校正支援サービス「PRUV」に新機能を追加しました。

「ユーザ」と「ユーザー」など、文章内で表記がバラついてしまう片仮名語の「表記ゆれ」をチェックします。「辞書&オプション機能選択」で「表記ゆれチェック」をオンにしてください。

この機能は、前述した「ユーザ」と「ユーザー」のように、音引きする/しない(他に、セキュリティーとセキュリティ、サーバとサーバーなど)だけでなく、例えば「パスワート」(「パスワード」のタイプミス)なども見つけることができます。

続きを読む

Wikipediaのテキストデータを解析

カテゴリー:お知らせ  作成日:2017-04-12

オンライン文章校正支援サービス「PRUV」の辞書の拡充の一環として、Wikipediaのテキストデータ解析を行っています。

Wikipediaのデータ(XML)をテキストデータに変換して、それを形態素解析しつつデータベースに放り込みます。全部入れると大変なので、取りあえず約30MBのテキストデータを取り込んで解析。見た目がいろいろ残念な自作ツールを使います。

続きを読む

地名と市区町村の対応チェック機能

カテゴリー:新機能  作成日:2017-04-06

オンライン文章校正支援サービス「PRUV」に新機能を追加しました。

都道府県と市区町村の対応チェック機能で実装した都道府県と市区町村の対応チェックに加えて、地名と市区町村の対応チェックを行います。

例:
×千葉県稲毛市 → ○千葉県千葉市稲毛区
×茨城県大洗市 → ○茨城県大洗町

続きを読む

PRUV開発1周年

カテゴリー:お知らせ  作成日:2017-02-04

1年前の2016年2月4日、オンライン文章校正支援サービス「PRUV」の開発がスタートしました。最初のコードはHTMLフォームによる入力機能もなく、コード内に直接書き込んだ文字列を形態素解析するというものでした。

形態素解析とは、文字列(文)を単語に分割して単語の品詞を判定する処理です。例えば、「今日は晴れだ」という文を、「今日」(名詞)、「は」(助詞)、「晴れ」(名詞)、「だ」(助動詞)というデータにします。

続きを読む

校正処理速度が大幅に向上

カテゴリー:お知らせ  作成日:2017-01-28

オンライン文章校正支援サービス「PRUV」が速くなりました。

コードのチューニングやデータベースのインデックス方法を見直しなどを行った結果、処理速度が大幅に向上しました。

以下に簡単なベンチマークテスト結果を挙げます。

続きを読む

学年別教育漢字チェック機能

カテゴリー:新機能  作成日:2017-01-19

オンライン文章校正支援サービス「PRUV」に新機能を追加しました。

小学1~6年生で習う以外の漢字が文章に含まれているかどうかをチェックします。小学生向けの文章を書くのに役立つでしょう。

具体的には、「小学1年生で習う漢字」にすると小学1年生で習う「80字以外の漢字」を指摘します。「小学6年生までに習う漢字」の場合は、小学1~6年生で習う「1006文字でないもの」が対象となります。「小学6年生で習う181字」ではありません。

続きを読む

デモ(サンプル)テキスト入力機能

カテゴリー:新機能  作成日:2017-01-14

オンライン文章校正支援サービス「PRUV」に新機能を追加しました。新機能……じゃないか。

「サンプルテキスト入力」を押すと以下のサンプルテキストが入力されるので、簡単にチェック機能を試すことができます。

続きを読む

実在しない和暦年のチェック機能

カテゴリー:新機能  作成日:2017-01-11

オンライン文章校正支援サービス「PRUV」に新機能を追加しました。

「昭和70年」「大化10年」など、実在しない年を検出するようにしました。ただし、現時点では平成は青天井。「平成100年」でもノーチェックです。今上天皇の譲位が確定したら、平成の上限を再設定しなければなりませんね。