独自の情報を学習させる:ナレッジ(RAG)管理とOCR編集の活用
マニュアル・メニュー表・FAQ・営業時間・価格表などのファイルをアップロードし、AIが自店舗の情報を正確に回答できるよう学習させる設定ガイドです。PDF・画像・テキスト別の登録方法とナレッジ構造の設計ポイントも解説します。
AI チャットの回答精度は、参照できる「正しい情報」が手元にあるかどうかで決まります。
どんなに優秀な AI でも、御社のサービス情報を知らなければ的外れな回答しかできません。
Socrates(ソクラテス)のナレッジ機能は、RAG(検索拡張生成)技術を活用し、御社固有のドキュメントを AI の「外部脳」として使わせる仕組みです。
この記事では、ナレッジに何を登録すべきか、OCR をどう活用するか、運用で気をつけるべきポイントを解説します。

「AI が的外れに答える」3 つの典型原因
1. そもそもナレッジが空 or 少なすぎる
AI への指示文だけで運用しようとすると、AI は学習時点の一般知識で答えてしまい、御社固有の情報には答えられません。最低限「料金」「メニュー / プラン」「FAQ」の 3 点はナレッジ化が必要です。
2. ナレッジが「読みにくい構造」になっている
1 つの大きな PDF をそのまま入れただけでは、AI が回答時に該当部分を探しにくくなります。「料金プラン」「キャンセル規定」「FAQ」 など、トピックごとに段落を分けて登録するのが基本です。
3. OCR で読み取った結果を確認していない
画像や写真撮影した PDF をアップロードしただけで満足してしまうケース。OCR の読み取り結果に誤字があれば、AI はそのまま誤った情報を回答します。「アップロード = 登録完了」ではないのがポイントです。
Socrates ナレッジ機能の 4 つの実践
実践1. PDF・画像・テキストの混在対応
Socrates は PDF・画像・CSV・テキストファイル等を読み込んでナレッジ化します。OCR が画像内の文字を抽出し、テキストとして登録されます。
現場で使っている既存資料をそのまま素材にできるので、AI 化の初期コストが大きく下がります。
実践2. 「内容確認・編集」で OCR 結果を整える
アップロード後の管理画面「内容を確認・編集」で、OCR の読み取り結果を必ず目視確認します。
料金・電話番号・営業時間など、間違いが許されない項目を優先的にチェックすることで、回答精度を確実に保つ運用が可能です。
実践3. 1 段落 100〜300 字の「探せる粒度」を意識
ナレッジ全体の上限は 8,000 字です。1 段落あたり 100〜300 字程度の Q&A 形式に整理すると、AI が該当箇所を瞬時に検索して使える設計になります。長文の塊で登録するより、トピックごとに細切れにする方が精度が上がります。
実践4. お客様によるチャット内ファイル送信
管理者が事前に登録するだけでなく、チャット画面でお客様が直接 PDF・CSV・画像・テキストを送信して相談することも可能です。詳細は「顧客からのファイル送信」ガイドを参照してください。
お客様の手元にある資料を起点とした、柔軟な相談対応が実現します。
ナレッジ運用の優先順位
- ① 最頻出 Q&A を最優先
「料金」「予約方法」「キャンセル」「営業時間」など、毎日同じ質問が来るテーマを最初に Q&A 化します。 - ② 自社固有用語に定義文を付与
社内独自のプラン名・サービス名・略語には、必ず短い定義文を添えます。AI が他の意味と混同する事故を防ぎます。 - ③ 月 1 回の鮮度チェック
料金・キャンペーン・営業時間など変更が発生しやすい情報を、月 1 回見直して更新します。
業種別ナレッジ登録の優先テーマ
「何をナレッジに入れればいいかわからない」という方向けに、業種ごとの登録優先テーマを整理します。
- 学習塾・スクール
コース料金・授業時間・体験授業の申し込み方法・対象学年・合格実績(記載可能な範囲で)・入塾の流れ・よくある質問 - クリニック・サロン
施術メニューと料金・初診の流れ・予約方法・キャンセルポリシー・アクセス・よくある悩みとその説明 - 不動産
物件情報・エリアの特徴・仲介手数料の仕組み・内見の流れ・FAQ(よくある質問と回答) - B2B・コンサル・SaaS
サービスの概要・料金プラン比較・導入の流れ・FAQ・サポート体制・他社との違い
長期記憶(添付ファイルのナレッジ化)との組み合わせ
この機能は個別チャットモードでご利用いただけます。パブリックモードでは使用できません。
Socratesには、チャット中にお客様が送ったPDF・CSV・画像・テキストをナレッジとして保存する「長期記憶」機能があります。プラン保持期間内であれば、過去の添付ファイルを後から参照することも可能です。
たとえば、お客様が「今使っている機器のマニュアル」を添付してきた場合、そのファイルをナレッジ化しておけば、次回以降の相談でも「以前送っていただいたマニュアルによると…」という文脈で回答できます。これが、単なるチャット履歴ではなく、「積み上がる記憶」としての運用です。
この機能は特に「継続的なサポート」「複数回に渡る案件」「個別化された相談対応」に適しています。お客様ごとのナレッジが蓄積されることで、より深い関係性の土台が生まれます。
よくある質問
Q1. ナレッジ上限の 8,000 字を超えそうな場合は?
「全部入れる」発想を切り替えて、頻出質問に絞って整理します。詳細な仕様は別途お客様向け資料を案内する運用も有効です。厳選することで、むしろ精度が上がる場合がほとんどです。
Q2. プランによってナレッジの登録件数は変わりますか?
はい、ご利用プランによってナレッジの登録可能件数が異なります。件数に余裕があるプランでは、商品種別・サービス種別ごとにナレッジを分けて登録するのが効果的です。たとえば「ランチメニュー」「ディナーメニュー」「アレルギー対応」のようにカテゴリ単位で1件ずつ管理すると、AIが適切なナレッジを参照しやすくなり、回答精度が向上します。
Q3. 機密情報を AI に渡しても大丈夫ですか?
通信は SSL/TLS で暗号化、保存データはテナント単位で分離、AI モデルの学習には利用されない設定です。ただし社外公開してはいけない情報を載せる場合は、社内ポリシーとの照合をご確認ください。
Q4. 何から登録すれば失敗しませんか?
まずは「よくある質問」を 10 個、テキストで入力することから始めます。PDF の一括登録より、Q&A 単位の手書き入力の方が精度が出やすいです。「Q: ○○について教えてください。A: ○○です。」という形式が最もAIに伝わりやすいフォーマットです。
Q5. 同じトピックを複数回登録するとどうなりますか?
AI が情報の優先順位に迷う原因になります。古い情報を必ず削除してから新しい情報を入れる「削除 → 追加のセット」を習慣にしてください。詳しくはナレッジ更新のガイドをご参照ください。
Q6. ナレッジ更新はリアルタイムに反映されますか?
はい。AI はチャット開始時に最新のナレッジを参照する設計のため、更新後すぐに反映されます。「数日待つ」ような再学習は不要です。
Q7. CSV データはどう活用できますか?
商品リスト・価格表・FAQ一覧などをCSV形式で登録できます。行ごとに「商品名, 価格, 説明」のような形で整理したCSVを登録すると、AIが参照しやすい構造になります。詳しくはファイル送信ガイドをご参照ください。
関連ガイド
- OCR精度を高める編集術 — 画像・PDFの読み取り結果を正確に整える方法
- ナレッジ更新の最短ステップ — 料金改定・新メニュー追加をミスなく反映する
- チャットでファイルを送信する方法 — お客様が直接ファイルを送って相談する使い方
「どの資料から読み込ませればいいか」迷う方は、まずは「よくある質問 10 個」からテキスト入力で始めてみてください。
小さく始めて、AI の応答を見ながら育てていくのが、ナレッジ運用を成功させる王道です。