[B! LLM] DropOutSurf_JOYのブックマーク

「ベクトルDB不要」なRAG手法「PageIndex」を解説

本記事では、RAGの性能を高めるための「PageIndex」という手法について、ざっくり理解します。株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。この記事は何この記事は、RAGで「ベクトルDB」を使わずに回答精度を上げる手法「PageIndex」[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます（参考）。本題ざっくりサマリー PageIndexは、RAGの精度を上げるための新しい手法です。Vectify AIによって開発されました。通常のRAGでは、文章をベクトル化して、類似度が高いものを検索して参照します。しかし、これだと「意味は似ているが、文脈は違う」情報を取ってきてしまい、回答精度が落ちます。そこで、PageInde

DropOutSurf_JOY 2025/09/10

論理構造/文書構造を保った本来のHTMLに戻ったような。SEOにも有効なJSONLDがLLMとも相性が良さそう。

リンク

12 Factor Agents まとめ

はじめに Heroku社が提唱した「12-Factor App」は、クラウドネイティブなアプリケーション開発のベストプラクティスをまとめたものです。これをAIエージェント開発に応用して、dexhorthy氏がまとめたものが「12 Factor Agents」です。この12 Factor Agentsを読んでみて、かなり学びがあったので、この記事では12 Factorの概要を簡単にまとめておきます。なお、自分用にまとめて補足や所感を追加しているので、詳細はぜひ原文を参照してください。また、この記事は50%を人が書いて、50%をAIが補完しています。 12 Factor Agents の背景「AIエージェントを作ろう！」そう思って意気揚々とLangChainやCrewAIなどのフレームワークを使い始めた開発者は多いのではないでしょうか。最初は順調に進みます。デモは動くし、簡単なタスク

DropOutSurf_JOY 2025/07/07

リンク

LLM / 生成AIを活用するアプリケーション開発におけるセキュリティリスクと対策 - GMO Flatt Security Blog

はじめにこんにちは、GMO Flatt Security株式会社セキュリティエンジニアの佐藤(@Nick_nick310)です。近年、大規模言語モデル(LLM、 Large Language Models)の進化と普及は目覚ましく、多くのサービスや業務プロセスで生成AIとして活用されています。LLMは多大なメリットをもたらす一方で、その特性に起因する新たなセキュリティリスクも指摘されており、安全な活用のためには十分な理解と対策が不可欠です。LLMを自社のサービスや業務に組み込む際、どのようなセキュリティ上の課題に直面する可能性があるでしょうか。本稿では、LLMを活用したアプリケーションを開発・運用する上で考慮すべき主要なセキュリティリスクについて、国際的な指標である「OWASP Top 10 for LLM Applications」を用いながら解説します。併せて、これらのリスクに対

DropOutSurf_JOY 2025/06/12

リンク

「chakoshi」を試して遊んでみる

chakoshiとはなんぞ NTTコミュニケーションズが発表した、テキストの安全性を判定するサービスです。つい先日発表されたばかりのようです。簡単に試せるプレイグラウンドだけでなく、APIも無償提供されてるみたいです⭐️ ↓こういうネチネチした日本的な暴言などに反応して、テキストが安全かどうかを返してくれます。今回はこのAPIを使ってみたいと思います。公式ドキュメントを読んでAPIを触るまずは公式サイトから新規登録してドキュメントを読み漁ります。手順的には以下で準備ができそうです。プレイグラウンドの設定からAPIキーを発行する検知項目をいろいろ設定して、カテゴリのIDも保存する(今回はデフォルト) APIドキュメントを読んだところ... 短文のテキスト用、chat用などいくつか種類があるみたいですが、まずはテキスト用のシンプルなやつから叩きます。早速curlで叩いてみます

DropOutSurf_JOY 2025/02/24

NTTコミュニケーションズが発表した、テキストの安全性を判定するサービスです，チェック，言葉遣い，お行儀レベル，チャット，

リンク

J-Moshi

日本語Full-duplex音声対話システムの試作 Paper (To appear) | Model | Code 大橋厚元，飯塚慎也，姜菁菁，東中竜一郎名古屋大学大学院情報学研究科概要: 人間同士の対話における発話のオーバーラップや相槌など，同時双方向的な特徴をモデル化できるfull-duplex音声対話システムは，近年注目を集めている．しかし日本語においては，full-duplex音声対話システムはほとんど見られず，full-duplex音声対話システムの開発に関する知見は不足している．本研究では，英語における主要なfull-duplex音声対話システムであるMoshi[1] をベースとすることで，日本語で利用可能な最初のfull-duplex音声対話システム J-Moshi[2] を試作し，公開する．

DropOutSurf_JOY 2025/01/25

人間同士の対話における発話のオーバーラップや相槌など，同時双方向的な特徴をモデル化できるfull-duplex音声対話システム，同時発話，

リンク

Clineのシステムプロンプトを日本語化してみた。 - しとちゃぶろぐ

ClineをローカルLLMで使うと、LLMに送られるシステムプロンプトが全文表示されるのですが、そのプロンプトを全て日本語訳してみました。 🦊以下システムプロンプト全文です🍮あなたはクラインです。多くのプログラミング言語、フレームワーク、デザインパターン、およびベストプラクティスに関する幅広い知識を持つ、高度なスキルを持つソフトウェアエンジニアです。 ==== ツール使用あなたは、ユーザーの承認に基づいて実行される一連のツールにアクセスできます。メッセージごとに1つのツールを使用でき、そのツール使用の結果はユーザーの応答で受け取ります。与えられたタスクを達成するために、ステップごとにツールを使用し、各ツール使用は前のツール使用の結果に基づいています。ツール使用のフォーマットツール使用は、XMLスタイルのタグを使用してフォーマットされます。ツール名は開始タグと終了タグで囲まれ、各パラ

DropOutSurf_JOY 2025/01/06

リンク

日本語LLMまとめ

📖 より読みやすいWeb版をご利用くださいこのREADMEの内容は、llm-jp.github.io/awesome-japanese-llm でより見やすい形式でご覧いただけます。表の表示崩れやレイアウトの問題を防ぐため、Web版の閲覧を推奨いたします。この記事は、一般公開されている日本語LLM（日本語を中心に学習されたLLM）および日本語LLM評価ベンチマークに関する情報をまとめたものです。情報は、有志により収集されており、その一部は論文や公開されているリソースなどから引用しています。以下の点について、あらかじめご理解とご了承をお願いいたします本記事の内容は、完全性や正確性を保証するものではありません。これらの情報は予告なく変更されることがあり、また最新の情報を常に提供できるとは限りません。一部の情報は、推測や個々の利用者の解釈にもとづくものである場合があります。そのため、全

DropOutSurf_JOY 2024/12/02

LLM
AI

リンク

PDF2Audio - a Hugging Face Space by lamm-mit

DropOutSurf_JOY 2024/10/04

TTSテンプレート

AI
LLM

リンク

https://playground.allenai.org/?model=mm-olmo-uber-model-v4-synthetic

DropOutSurf_JOY 2024/10/04

Molmoは1B-72Bのモデルを提供。MolmoE-1BはGPT-4V並、7BモデルはGPT-4V/4o間、72BモデルはGPT-4o次点の性能。

リンク

ゼロからRAGを作るならこんなふうに

どんな人向けの記事？これからRAGを作ってみたい DifyやLangChainにこだわらず、自分で開発をハンドリングしたいベクトルDBや埋め込みモデルの選定の勘所をサッと知りたいここではRAGとは何かのような話題は扱いません。 RAGが、ほぼAI活用の現実的な最適解になりつつある LLMは高度な知的タスクを実行可能である。そんな理解が世界に広まっていく中で、企業は自らが蓄えたデータをLLMに組み合わせてどう活用するか躍起になっています。これからはビッグデータだ！という時代を経ているため、情報インフラに投資した企業も多く、AIでデータを活用する流れはもはや確定路線と言えます。この問題を解決する手法として一番最初に思いつくのは、モデル自体を改変するファインチューニングです。しかし、ファインチューニングにはいくつかの実用上の問題があります。ファインチューニング自体に専門知識が必要である

DropOutSurf_JOY 2024/08/16

gogole, GCP,

RAG
LLM

リンク

第1回　生成AIの得意・不得意 2024・夏 | gihyo.jp

皆さんこんにちは。スリーシェイク代表の吉田です。今回より生成AIを、金融業界や製造業、医療業界など各事業ドメイン固有の課題解決にどう使われているのか、具体的なユースケースを提示しながら、それを実現するアーキテクチャについて解説していきます。この連載を通して、これまで生成AIを実際のシステムに組み込むイメージが湧かない方への第一歩として手助けになれば幸いです。第1回は、生成AI自体の一般的な得意不得意を踏まえながらユースケースを解説します。生成AIが得意とする処理とは？生成AIが得意とするのは、「⁠専門性のない一般的な知識をベースにした」テキスト生成、コード生成、画像認識や画像生成が挙げられます。RAG（Retrieval-Augmented Generation）やプロンプトエンジニアリングにより固有ドメインに特化させることは可能ですが、教師あり学習データを前提としたMLやDeep

DropOutSurf_JOY 2024/07/29

改善，効率化，生産性，自動化，ワークフロー，

リンク

RAGで文書を1トークンに圧縮する「xRAG」について

株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。本記事では、「xRAG」という手法について、ざっくり理解します。xRAGとは、RAGシステムでLLMに投げるドキュメント（通常、数千文字ほどですよね。）を、1トークンに圧縮できるのでは？という手法です。この記事は何この記事は、RAGをする際にLLMに渡すドキュメントを1トークンまで圧縮できる手法「xRAG」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー xRAGは、RAGで渡すコンテキストを極限まで圧縮する手法です。北京大学/Microsoftの研究者らによって2024年5月に提案されました。xRAGを使うメリットは、コンテ

DropOutSurf_JOY 2024/05/29

絵文字で圧縮プロンプト系の正式版，ベクトル化，1トークン，

リンク

はてなブックマーク

タグ

関連タグで絞り込む (12)

LLMに関するDropOutSurf_JOYのブックマーク (12)

お知らせ

今週のはてなブックマーク数ランキング（2026年1月第3週）

はてなブックマークの計画メンテナンスのお知らせ（2026年1月23日(金) 深夜1:30〜3:00）

今週のはてなブックマーク数ランキング（2026年1月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス