タグ

RAGに関するsds-pageのブックマーク (3)

  • ChatGPTの記憶システムはRAGを使っていなかった - 4層アーキテクチャの衝撃

    参照元 I Reverse Engineered ChatGPT's Memory System, and Here's What I Found! - Manthan Gupta ChatGPT Memory Architecture: Four-Layer Context System Prioritizes Speed Over RAG and Vector Databases RAGを使わないメモリシステムという衝撃 Hacker Newsで500ポイント以上を獲得し、AI開発者界隈で話題になっているのが、Manthan Guptasさんによる「ChatGPTの記憶システム」のリバースエンジニアリング調査です。 調査で明らかになったのは、ChatGPTが ベクトルデータベースもRAG(Retrieval-Augmented Generation)も使っていない という驚きの事実。多

    ChatGPTの記憶システムはRAGを使っていなかった - 4層アーキテクチャの衝撃
    sds-page
    sds-page 2025/12/16
    ポスグレでベクトル型カラムを作ればいいんじゃね https://qiita.com/kanaza-s/items/b46214ba8543e34c5003
  • RAGの精度向上手法、がっつりまとめ【2025年】

    この記事は何 ナレッジセンスでは、エンタープライズ向けにRAGサービスを提供しています。その中で「RAGは簡単に作れるけど、精度を上げるのは難しい」という課題に日々向き合っています。記事は、2024~2025年に公開された研究や事例をもとに、RAGの回答精度を高める代表的なアプローチを ざっくりまとめたものです。 ざっくりサマリー この記事では、企業の社内データを利用したRAG、特に大企業で「エンタープライズRAG」での実装手法についてざっくり理解します。まず、エンタープライズRAGでのよくある課題をお伝えします。その上で、2025年現在の最新動向を踏まえ、評価手法のような基戦略から、ちょっと高度なテクニックまで、RAGの精度を向上手法を概観します。 (エンタープライズRAGとは、社内の膨大なデータをLLMが活用可能にするためのソリューションのことです。) RAG、実装は簡単。しかし、

    RAGの精度向上手法、がっつりまとめ【2025年】
    sds-page
    sds-page 2025/10/08
    簡単に使えるライブラリとして公開されないと自力実装も茨の道よ
  • RAGのSurvey論文からRAG関連技術を俯瞰する - 元生技のデータサイエンティストのメモ帳

    大規模言語モデル (LLM) の学習データに含まれない知識(各社の特有の書類など)を踏まえてLLMに回答させる際に最早必須となってきたRAG (Retrieval-Augumented Generation)。 今回はそんなRAGのSurvey論文を元に、RAGの変遷や構成要素、新たに出てきた技術を俯瞰していきます。 Survey論文へのリンクはこちら arxiv.org RAGとは LLMはそれ単体で回答させると、質問によってはハルシネーションや学習時のデータにはなかった情報を生成時に加味できないといった問題から正しくない回答を生成することが多々あります。例えば世間一般に公開されていない自社の就業規則や業務標準についてをChatGPTに質問しても、正しい回答は得られません。 そのような問題への対応としてRAGが使われます。 「LLM単体で適切な回答を生成できないなら、ユーザーの質問を元に

    RAGのSurvey論文からRAG関連技術を俯瞰する - 元生技のデータサイエンティストのメモ帳
  • 1