PRUV開発室
通貨レートチェック機能修正
カテゴリー:お知らせ 作成日:2017-11-06オンライン文章校正支援サービス「PRUV」の機能を修正しました。
先日通貨レートチェック機能を実装したのですが、この機能に利用しているYahoo! Financeが最近機能していないようです。クエリを投げてもリザルトがnullなので、計算できないのです。
そのうち復旧すると思ったのですがその兆しが見えないので、Yahoo! Financeで通過レート取得に失敗した場合は他社のAPIを使ってレートを取得するようにしました。ただし、対応通貨はドル、ポンド、ユーロ、スイスフランのみとなります。
早くYahoo! FinanceのAPIが復活してくれるとよいのですが……。
形態素解析辞書のチューニング
カテゴリー:お知らせ 作成日:2017-11-03オンライン文章校正支援サービス「PRUV」は、これでも一応は毎日進化しています。例えば、形態素解析辞書のチューニングです。
形態素解析は、入力された文を単語に分割して品詞を決定する処理です。
今日は秋晴れだ
を、
今日(名詞・副詞可能)は(助詞・係助詞)秋晴れ(名詞・一般)だ(助動詞)
のようにします。この処理の基になるのが、形態素解析辞書。「今日」も「は」も「秋晴れ」も辞書に登録ているから正しく分割できるのです。PRUVでは、ネットで公開されている辞書を独自に拡張したものを利用しています。
[続きを読む]
Wikipediaのテキストデータを解析
カテゴリー:お知らせ 作成日:2017-04-12オンライン文章校正支援サービス「PRUV」の辞書の拡充の一環として、Wikipediaのテキストデータ解析を行っています。
Wikipediaのデータ(XML)をテキストデータに変換して、それを形態素解析しつつデータベースに放り込みます。全部入れると大変なので、取りあえず約30MBのテキストデータを取り込んで解析。見た目がいろいろ残念な自作ツールを使います。
[続きを読む]
PRUV開発1周年
カテゴリー:お知らせ 作成日:2017-02-041年前の2016年2月4日、オンライン文章校正支援サービス「PRUV」の開発がスタートしました。最初のコードはHTMLフォームによる入力機能もなく、コード内に直接書き込んだ文字列を形態素解析するというものでした。
形態素解析とは、文字列(文)を単語に分割して単語の品詞を判定する処理です。例えば、「今日は晴れだ」という文を、「今日」(名詞)、「は」(助詞)、「晴れ」(名詞)、「だ」(助動詞)というデータにします。
[続きを読む]
校正処理速度が大幅に向上
カテゴリー:お知らせ 作成日:2017-01-28オンライン文章校正支援サービス「PRUV」が速くなりました。
コードのチューニングやデータベースのインデックス方法を見直しなどを行った結果、処理速度が大幅に向上しました。
以下に簡単なベンチマークテスト結果を挙げます。
[続きを読む]
ドメイン変更:pruv.jpになりました
カテゴリー:お知らせ 作成日:2017-01-06オンライン文章校正支援サービス「PRUV」のURLが変わりました。
諸般の事情により、新たに専用ドメイン「pruv.jp」を取得しました。これにより、URLがギュッと短くなりました。リダイレクトをかけているので、特にブックマークなどを変更しなくてもこれまで通り利用できると思います。
[続きを読む]
処理速度が大幅に高速化しました
カテゴリー:お知らせ 作成日:2016-10-15オンライン文章校正支援サービス「PRUV」をアップデートしました。
PRUVの内部構造を全面改定して、処理時間を短縮しました。5KBのテキストだと、待ち時間が20~30秒くらい短縮しています。従来の仕様には辞書登録数が増えれば増えるほど処理時間も長くなるという問題がありましたが、今バージョンから辞書登録数の影響はほぼなくなりました。
[続きを読む]
スペルチェックの仕様変更
カテゴリー:お知らせ 作成日:2016-09-09オンライン文章校正支援サービス「PRUV」をアップデートしました。といっても、プログラムは毎週何らかの修正を加え、辞書も毎日更新しているのですが。
今回は、スペルチェック機能の内部構造を変更しました。行単位でチェックして、同じ単語が含まれていたらチェック処理を1回にまとめました(従来は、同じ単語も毎回チェック)。また、文章中にURLが含まれている場合、URLは無視することにしました。
[続きを読む]
常用漢字チェック機能
カテゴリー:お知らせ 作成日:2016-08-20オンライン文章校正支援サービス「PRUV」をアップデートしました。
文章中の漢字が常用漢字(2136種)か否かをチェックし、非常用漢字を強調表示します。常用漢字の使用が原則の商用メディアにとって、常用漢字チェックは結構重要です。
ちょっと凝った表現を使うと、常用漢字という制約に引っ掛かってしまいます。窮屈なことですが、ガチガチの表記ルールの中で表現するのが商業メディアというものです。
オンライン文章校正支援サービス「PRUV」公開
カテゴリー:お知らせ 作成日:2016-06-18オンライン文章校正支援サービス「PRUV」を立ち上げました。発音は、英語の「proof」と同じ「プルーフ」です。
実は、本業は編集者なのですが、しょせんは「にんげんだもの」。ついミスをしたり見逃したりしてしまいます。例えば、助詞「の」の連続。「山の上の湖の眺め」のように、「の」が3回連続で使うのは下手な文の典型なのですが、結構見逃しがち。こんなミスを代わりに見つけてくれます。
[続きを読む]