PRUV開発室
Wikipediaのテキストデータを解析
カテゴリー:お知らせ 作成日:2017-04-12オンライン文章校正支援サービス「PRUV」の辞書の拡充の一環として、Wikipediaのテキストデータ解析を行っています。
Wikipediaのデータ(XML)をテキストデータに変換して、それを形態素解析しつつデータベースに放り込みます。全部入れると大変なので、取りあえず約30MBのテキストデータを取り込んで解析。見た目がいろいろ残念な自作ツールを使います。
[続きを読む]
地名と市区町村の対応チェック機能
カテゴリー:新機能 作成日:2017-04-06オンライン文章校正支援サービス「PRUV」に新機能を追加しました。
都道府県と市区町村の対応チェック機能で実装した都道府県と市区町村の対応チェックに加えて、地名と市区町村の対応チェックを行います。
例:
×千葉県稲毛市 → ○千葉県千葉市稲毛区
×茨城県大洗市 → ○茨城県大洗町
[続きを読む]