営業時間外でもお問い合わせに対応できるように、自社POSプロダクト「コアレジ」のAIチャットボットを作成しました。コアレジはヘルプページが充実しているため、そこに掲載されている情報をナレッジとして活用しています。
大規模言語モデル(LLM)は OpenAI API を利用しています。
【仕組み(RAG)】

このAIチャットボットは、生成AIの RAG(Retrieval-Augmented Generation) という仕組みで動いています。簡単に説明すると、次の流れです。
1) ナレッジの準備(クロール → テキスト抽出 → embedding化)
あらかじめコアレジのWebサイトをクロールし、リンクをたどって関連ページを収集します。
収集したページからテキスト部分を抽出し、文章を embedding(数千次元のベクトル表現) に変換します。
テキストとベクトルはデータベースに格納しておきます。
2) 質問の検索(質問文をembedding化 → 類似検索)
利用者が質問を入力すると、同じようにその質問文をembeddingに変換します。
そのベクトルと近いベクトルをデータベースから検索し、質問に関連性の高いナレッジ(該当ページの本文)を抽出します。
3) 回答生成(質問+根拠をLLMへ)
質問文と、関連性の高いナレッジをまとめてLLMに渡し、回答を生成します。
また、回答の根拠として 参考URL(出典) も表示できるようにしています。
【誤情報対策(チューニング)】
生成AIは誤情報を出すことがあるため、精度改善に手間をかけています。まず約50件の代表的な質問を用意し、できる限り多くのケースで適切な回答になるようにテストと調整を繰り返しました。特に誤案内が問題になりやすい領域は、安全側に倒しています。具体的な例としては次のとおりです。
・契約・価格に関する内容は、推測で案内せず、公式情報を参照する形(定型の案内)にする
・カスタマイズで実現できる可能性がある要望は、「標準機能として"できる"」と断定せず、カスタマイズのご相談(個別見積)が必要であることを自然に案内する
・端末連携など誤解が起きやすい質問も、前提を置いて断定しないようにガードする
このAIチャットボットは社内での評価が完了次第、公開予定です。

