
生成AIとRAG、そしてMCP
企業で生成AIを活用する動きが広がり、RAG(Retrieval-Augmented Generation)を導入する会社が増えています。
RAGは、2020年にMeta(旧Facebook)の研究チームが発表した考え方で、「外部の情報を取り出してから文章を生成する」 という仕組みです。
LLMが学習していない社内情報を使えるようになることから、企業利用の“第一歩”として急速に広まりました。
企業が持つ情報の多くは、社内文書、メール、議事録、FAQなどの非構造化データです。
これらを一括で扱える方法として広まったのがベクトル検索でした。
文章を数値ベクトルに変換し、「意味が近いかどうか」で検索できるため、キーワードに頼らず柔軟に情報を探せます。
この“意味検索”の分かりやすさから、RAG=ベクトル検索というイメージが定着していきました。
一方で、ベクトル検索は「意味」を扱う技術です。
そのため、どうしてもあいまいさが残ります。
現場では、本来ベクトル検索が向いていない処理にもRAGを使ってしまうケースが増えています。
たとえば、
- 入力内容のチェック
- データの整合性確認
- ルールに基づく判定
- トランザクション処理
こうした正確さが必要な処理では、意味検索よりも「明示的な処理」の方が適しています。
そこで注目されているのが、MCP(Model Context Protocol)などを使ったツールRAGです。
RAG=ベクトル検索のイメージが強いですが、広義の意味において、外部の知識を用いてLLMの検索能力を拡張できるものはすべてRAGと言えます。
これは、AIが、APIを呼ぶ、SQLを実行する、業務システムと連携する
といった形で、正確なデータを直接取得する方法です。
曖昧な検索ではなく、「正しい値を正しく取りに行く」ための仕組みと言えます。
これからのRAGは、単にベクトル検索を入れるだけではなく、
【意味検索が向く領域】
【明示的な処理が必要な領域】
をどう組み合わせるかが重要になります。
RAGは今、ベクトル検索中心の第一世代から、ツールと連携する第二世代へ進化し始めています。
DELTAでは、この領域を専門とするコンサルタントが、
お客様の業務に合わせたRAG設計を支援しています。
ご興味があれば、ぜひお気軽にご相談ください。
記事をシェア: