「データを準備する」の中身
AI を業務に入れるとき、データ準備の重要性は誰もが口にしますが、実際に何をすればよいかは曖昧なまま進むことが多い領域です。
データ準備の中身を分解すると、次の 4 種類になります。
- 1. 社内 wiki(手順・規程・ナレッジ)
- 2. 文書(契約書・提案書・議事録)
- 3. FAQ(問い合わせと回答のペア)
- 4. ログ(業務ログ・操作ログ・問い合わせ履歴)
それぞれ、AI に使わせる前にやるべき下処理が違います。一括で「AI に学習させる」と考えると、品質が低いまま AI に渡してしまい、誤回答の温床を作ります。
社内 wiki の下処理
社内 wiki は、書き手・更新時期・粒度がバラバラなのが普通です。AI に渡す前に最低限の下処理が要ります。
- - 最終確認日と対応バージョンを各ページに記入
- - 廃止済みページを別カテゴリに移動(AI の参照対象から外す)
- - 1 ページ 3000 字を超えるものは分割(粒度を揃える)
ここで欲張らないのが要点です。完璧な構造化は 1 年かかります。AI が使い始めるのに必要なのは、上記 3 点だけです。
文書の取扱い
契約書・提案書・議事録などの文書は、社外秘・機密の度合いがページごとに違います。AI に渡す範囲は、次の優先順で絞ります。
- - 公開済み文書(自社サイトに既に出ている内容):渡してよい
- - 社内公開文書(イントラに全社員が読める形で置かれている):許可ツールに限定して渡す
- - 部署内秘・特定者のみアクセス可:渡さない、または匿名化して渡す
- - 守秘契約下文書・営業秘密:渡さない