PRUV開発室

頻出単語チェック機能テスト中

カテゴリー:新機能  作成日:2019-12-28

同じ表現を多用すると文章が稚拙になります。これを回避するため頻出する単語をリストアップする機能を仮実装してテスト環境(WSL:Windows Subsystem for Linux)でテストしています。

テストしているのは、「文章にX回登場する単語」と「X文以内に2回以上登場する単語」の2パターン。それぞれ「X回」「X文」の設定や対象品詞を変えながら有用性を検証します。それによって両方実戦投入、片方だけ、両方破棄のどれかを決定します。

英独仏伊西簡易スペルチェック

カテゴリー:新機能  作成日:2019-05-18

オンライン文章校正支援サービス「PRUV」に新機能を追加しました。

YAEKAさんにご要望いただいたドイツ語(ドイツ)スペルチェック機能です。ついでに、フランス語、イタリア語、スペイン語も追加してみました。

ユーザー管理機構を再構築、新システム移行はこれから

カテゴリー:お知らせ  作成日:2019-05-06

PRUVのユーザー管理機構を全面的に再構築しました。これから順次、既存ユーザーを新システムに移行していきます。

新システムは従来の「グループ」に加え、複数のグループからなる「組織」を新設。グループ管理者はグループを、組織管理者は複数のグループを管理できます。グループ辞書の管理もこれに準じます。

AIを校正に応用する挑戦

カテゴリー:お知らせ  作成日:2019-04-15

PRUVにAIを応用できないものかと考えて幾年、ようやく形になってきました。「AI」といっても知能と呼べるようなシロモノではなく、単に「ディープラーニングによって構築した言語モデルでパターンマッチングを行い、単語(形態素)の出現確率を推論する機能」なのですが、長いので便宜上「AI」に短縮します。

正しい(あるいは誤りが少ないと思われる)文章を学習させ、「次に現れる単語」の確率を計算させます。この確率がしきい値以下であれば、「間違いじゃね?」という反応をするというわけです。以下のように結果を出力します。ある商用Webメディアに実際に掲載されていた文です。

新元号「令和」対応

カテゴリー:お知らせ  作成日:2019-04-01

オンライン文章校正支援サービス「PRUV」をアップデートしました。

和暦・西暦の対応チェック機能が新元号「令和」に対応しました。
以後、令和についても西暦との対応をチェック可能です。

通貨レート変換機能のバグを修正

カテゴリー:バグ報告  作成日:2019-02-16

オンライン文章校正支援サービス「PRUV」の通貨レート変換機能のバグを修正しました。

1兆以上の桁を正しく処理できておらず、「1兆ドル」と入力したときの日本円を「1104800億円」のように表示していました。

今回の修正で、正しく「110兆4800億円」と表示するようになりました。

形態素解析の結果表示機能

カテゴリー:新機能  作成日:2019-01-27

オンライン文章校正支援サービス「PRUV」にオマケ機能として形態素解析の結果表示機能を追加しました。

[チェック開始]ボタン直上の「形態素解析のみ」をオンにすると、入力された文章の形態素解析結果のみを表示します。

サーバ移転プロジェクト開始

カテゴリー:お知らせ  作成日:2018-07-07

いろいろと限界が見えてきたので、サーバを移転することにしました。新サーバはCPUのコア数とメモリ容量がアップ。ストレージはSSDになるため、全体的に速度が向上するはずです。

というわけで、Windows 10のHyper-V上に開発環境を構築し、検証と開発を行っています。Linuxのディストリビューション変更、Web、SQLサーバ、NoSQLサーバ、PHPのメジャーバージョンアップを一気にやるため、ノウハウの構築も重要になります。

進捗状況は以下の通りです。

スペルチェックの処理速度向上

カテゴリー:お知らせ  作成日:2018-06-22

オンライン文章校正支援サービス「PRUV」が速くなりました。

スペルチェック機能は負荷が高く、ボトルネックになっていました。そこでリングバッファでスペルチェックした単語をキャッシュする機構を組み込んでみました。これで、一度スペルチェックした単語はスペルチェックをスルーしてキャッシュのデータを利用できるようになりました。

表記ゆれチェックのブラックリスト機能

カテゴリー:新機能  作成日:2018-02-28

PRUV」の表記ゆれチェック機能に、ブラックリスト機能を追加しました。これまでの表記ゆれチェック機能は片仮名語だけが対象でしたが、このブラックリスト機能により平仮名や漢字にも対応します。