カスタムAIの効果的な活用ガイド
カスタムAIは、読み込ませるデータ(ルールブック)の質によって精度が大きく変わります。
ここでは、より効果的にAIを活用するためのヒントと、セキュリティについて解説します。
既存のガイドラインをそのまま活用する
カスタムAIの最大の特徴は、人間用のドキュメントをそのまま理解できる点です。
例えば、以下のような公的なガイドラインのPDFをそのままアップロードするだけでも、AIはそこからルールを抽出し、校正に反映させることができます。
- JTF日本語標準スタイルガイド:翻訳やテクニカルライティングの業界標準ルール
- 社内の業務マニュアル:「〇〇の件については××と回答する」といった業務知識
まずは手元の資料を読み込ませてみることから始めましょう。「ルールを生成するAI」が資料からルールを抽出して、「校正を実行するAI」が理解できる形式に情報を変換します。
「辞書機能」と「カスタムAI」の使い分け
PRUVには単語を登録する「辞書機能」もあります。これらは以下のように使い分けるのが効果的です。
| 機能 | 得意なこと | 例 |
|---|---|---|
| 辞書機能 | 機械的な文字の置換 100%確実に統一したい場合 |
「コンピューター」→「コンピュータ」 「遵守」→「順守」 |
| カスタムAI | 文脈判断が必要なルール。 「こういう場合はA、そうでない場合はB」という使い分け。 |
「お客様へのメールでは『弊社』とするが、契約書では『甲』と表記する」 |
精度を高めるデータの作り方(チューニング)
AIの指摘が意図と異なる場合は、読み込ませるデータを調整することで改善できます(PDCAサイクル)。
1. 自然言語で具体的に書く(Word/テキスト)
AIへの指示書を作るイメージで、テキストファイルを作成して読み込ませます。
記述例:
・製品名「スマート・デバイス」は、必ず中黒(・)を入れて表記してください。
・「見れる」「食べれる」などのら抜き言葉は禁止です。「見られる」「食べられる」に修正してください。
・社外向けの文章では、文末は「です・ます」調に統一してください。
2. Excelで対照表を作る
Excelで「誤った例」と「正しい例」のリストを作ると、AIは非常に正確に理解します。
| 対象の単語 | ルール・指示 | 修正例 |
|---|---|---|
| スマホ | 公式文書では略語を使わず正式名称にする | 誤:スマホ → 正:スマートフォン |
| ? | 疑問符の後は全角スペースを空ける | 誤:ですか?はい → 正:ですか? はい |
3. 3項目で「法則」を教える
「誤用例の羅列」「AIへの具体的な指示(プロンプト)」「誤り→正解の例」の3点セットを整えると、AIの学習効果が最大化します。ここで重要なのは、少数の例示で法則を教えることです。
例として、以下のデータを入力します(3列のExcelデータにしても構いません)。
黒、青、黄色
色については英語の片仮名語表記に変更する。他の色についてもこのルールを適用する。
黒→ブラック
青→ブルー
黄色→イエロー
その後、「この青色のクルマは誰のものですか」という文を校正すると
修正前:青色
修正案:ブルー
理由:色を表す単語は英語の片仮名語表記に統一【自信:高】
とAIは答えるようになります。しかしそれだけではありません。
「この茶色のクルマは誰のものですか」という文を校正すると
修正前:茶色
修正案:ブラウン
理由:色を表す単語は英語の片仮名語表記に統一【自信:高】
とAIは答えます。
色を「金色」「緑色」にしても、「ゴールド」「グリーン」と答えるのです。
残念ながら全ての色に対応できるわけではないのですが、「色という概念は片仮名語にする」ということを理解して青や黒以外にも対応していることが分かります。
以上を参考に、少しずつデータを追加して自分だけのカスタムAIを育ててください。
セキュリティとデータの取り扱いについて
独自のルールや社内情報をアップロードするにあたり、PRUVではセキュリティに最大限配慮した設計を行っています。
AIの学習には利用されません
アップロードされたデータや校正した文章が、PRUVのAI(および連携する外部AIモデル)の学習データとして利用されることはありません。
あなたのデータが他社のAI校正に影響を与えたり、情報が漏れ出たりすることはありませんのでご安心ください。
データの保存形式
アップロードされたファイル(WordやPDFなど)は、AIが理解するための「ベクトルデータ(数値の羅列)」に変換されてデータベースに保存されます。
元のファイルそのものはサーバに保存されず、処理完了後に即座に破棄されます。
データベースが不正アクセスを受けたとしても、保存されているのは数値データのみであり元の文書を復元することは極めて困難な仕組みになっています。
保存データ例:
^R$3b5f0dc1-cc99-49c6-a880-8549b2fa956e
80010111110000100001101000c11eb4c5fa7bc89c274f7c51f
ご利用上の注意
上記の通り高い安全性を確保していますが、パスワードやマイナンバー、極めて機密性の高い個人情報などが含まれる文書のアップロードはお控えいただくことを推奨します。
アップロードするデータの内容については、お客様ご自身の責任において管理をお願いいたします。