はじめに Google Cloud では、RAG を手軽に実現する手段として、Vertex AI Search や Vertex AI RAG Engine などのマネージドサービスが提供されています。あるいは、ベクトル検索エンジンである Vector Search を利用して、独自の RAG システムを構築することもできます。 業務システムとして利用する際は、これらのサービスを利用することで、スケーラビリティの高いシステムが容易に構築できますが、システム設計に関わるエンジニアとしては、そもそも RAG とはどのような仕組みで、どのような処理が裏側で行われているのかを理解しておくことも大切です。そこでこの記事では、前述の便利なサービスをあえて利用せず、自前の RAG システムを手作りすることで、RAG を構成するパーツや高品質な結果を返すための工夫を学びます。 RAG の仕組み はじめに、

