タグ

LLMに関するDropOutSurf_JOYのブックマーク (12)

  • 「ベクトルDB不要」なRAG手法「PageIndex」を解説

    記事では、RAGの性能を高めるための「PageIndex」という手法について、ざっくり理解します。 株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 この記事は、RAGで「ベクトルDB」を使わずに回答精度を上げる手法「PageIndex」[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます(参考)。 題 ざっくりサマリー PageIndexは、RAGの精度を上げるための新しい手法です。Vectify AIによって開発されました。 通常のRAGでは、文章をベクトル化して、類似度が高いものを検索して参照します。しかし、これだと「意味は似ているが、文脈は違う」情報を取ってきてしまい、回答精度が落ちます。 そこで、PageInde

    「ベクトルDB不要」なRAG手法「PageIndex」を解説
    DropOutSurf_JOY
    DropOutSurf_JOY 2025/09/10
    論理構造/文書構造を保った本来のHTMLに戻ったような。SEOにも有効なJSONLDがLLMとも相性が良さそう。
  • 12 Factor Agents まとめ

    はじめに Heroku社が提唱した「12-Factor App」は、クラウドネイティブなアプリケーション開発のベストプラクティスをまとめたものです。これをAIエージェント開発に応用して、dexhorthy氏がまとめたものが「12 Factor Agents」です。 この12 Factor Agentsを読んでみて、かなり学びがあったので、この記事では12 Factorの概要を簡単にまとめておきます。 なお、自分用にまとめて補足や所感を追加しているので、詳細はぜひ原文を参照してください。また、この記事は50%を人が書いて、50%をAIが補完しています。 12 Factor Agents の背景 「AIエージェントを作ろう!」 そう思って意気揚々とLangChainやCrewAIなどのフレームワークを使い始めた開発者は多いのではないでしょうか。 最初は順調に進みます。デモは動くし、簡単なタスク

    12 Factor Agents まとめ
  • LLM / 生成AIを活用するアプリケーション開発におけるセキュリティリスクと対策 - GMO Flatt Security Blog

    はじめに こんにちは、GMO Flatt Security株式会社セキュリティエンジニアの佐藤(@Nick_nick310)です。 近年、大規模言語モデル(LLM、 Large Language Models)の進化と普及は目覚ましく、多くのサービスや業務プロセスで生成AIとして活用されています。LLMは多大なメリットをもたらす一方で、その特性に起因する新たなセキュリティリスクも指摘されており、安全な活用のためには十分な理解と対策が不可欠です。LLMを自社のサービスや業務に組み込む際、どのようなセキュリティ上の課題に直面する可能性があるでしょうか。 稿では、LLMを活用したアプリケーションを開発・運用する上で考慮すべき主要なセキュリティリスクについて、国際的な指標である「OWASP Top 10 for LLM Applications」を用いながら解説します。併せて、これらのリスクに対

    LLM / 生成AIを活用するアプリケーション開発におけるセキュリティリスクと対策 - GMO Flatt Security Blog
  • 「chakoshi」を試して遊んでみる

    chakoshiとはなんぞ NTTコミュニケーションズが発表した、テキストの安全性を判定するサービスです。 つい先日発表されたばかりのようです。 簡単に試せるプレイグラウンドだけでなく、APIも無償提供されてるみたいです⭐️ ↓こういうネチネチした日的な暴言などに反応して、テキストが安全かどうかを返してくれます。 今回はこのAPIを使ってみたいと思います。 公式ドキュメントを読んでAPIを触る まずは公式サイトから新規登録してドキュメントを読み漁ります。 手順的には以下で準備ができそうです。 プレイグラウンドの設定からAPIキーを発行する 検知項目をいろいろ設定して、カテゴリのIDも保存する(今回はデフォルト) APIドキュメントを読んだところ... 短文のテキスト用、chat用などいくつか種類があるみたいですが、まずはテキスト用のシンプルなやつから叩きます。 早速curlで叩いてみます

    「chakoshi」を試して遊んでみる
    DropOutSurf_JOY
    DropOutSurf_JOY 2025/02/24
    NTTコミュニケーションズが発表した、テキストの安全性を判定するサービスです,チェック,言葉遣い,お行儀レベル,チャット,
  • J-Moshi

    語Full-duplex音声対話システムの試作 Paper (To appear) | Model | Code 大橋 厚元,飯塚 慎也,姜 菁菁,東中 竜一郎 名古屋大学 大学院情報学研究科 概要: 人間同士の対話における発話のオーバーラップや相槌など,同時双方向的な特徴をモデル化できるfull-duplex音声対話システムは,近年注目を集めている.しかし日語においては,full-duplex音声対話システムはほとんど見られず,full-duplex音声対話システムの開発に関する知見は不足している.研究では,英語における主要なfull-duplex音声対話システムであるMoshi[1] をベースとすることで,日語で利用可能な最初のfull-duplex音声対話システム J-Moshi[2] を試作し,公開する.

    DropOutSurf_JOY
    DropOutSurf_JOY 2025/01/25
    人間同士の対話における発話のオーバーラップや相槌など,同時双方向的な特徴をモデル化できるfull-duplex音声対話システム,同時発話,
  • Clineのシステムプロンプトを日本語化してみた。 - しとちゃぶろぐ

    ClineをローカルLLMで使うと、LLMに送られるシステムプロンプトが全文表示されるのですが、そのプロンプトを全て日語訳してみました。 🦊以下システムプロンプト全文です🍮あなたはクラインです。多くのプログラミング言語、フレームワーク、デザインパターン、およびベストプラクティスに関する幅広い知識を持つ、高度なスキルを持つソフトウェアエンジニアです。 ==== ツール使用 あなたは、ユーザーの承認に基づいて実行される一連のツールにアクセスできます。メッセージごとに1つのツールを使用でき、そのツール使用の結果はユーザーの応答で受け取ります。与えられたタスクを達成するために、ステップごとにツールを使用し、各ツール使用は前のツール使用の結果に基づいています。 ツール使用のフォーマットツール使用は、XMLスタイルのタグを使用してフォーマットされます。ツール名は開始タグと終了タグで囲まれ、各パラ

    Clineのシステムプロンプトを日本語化してみた。 - しとちゃぶろぐ
  • 日本語LLMまとめ

    📖 より読みやすいWeb版をご利用ください このREADMEの内容は、llm-jp.github.io/awesome-japanese-llm でより見やすい形式でご覧いただけます。表の表示崩れやレイアウトの問題を防ぐため、Web版の閲覧を推奨いたします。 この記事は、一般公開されている日語LLM(日語を中心に学習されたLLM)および日語LLM評価ベンチマークに関する情報をまとめたものです。情報は、有志により収集されており、その一部は論文や公開されているリソースなどから引用しています。 以下の点について、あらかじめご理解とご了承をお願いいたします 記事の内容は、完全性や正確性を保証するものではありません。これらの情報は予告なく変更されることがあり、また最新の情報を常に提供できるとは限りません。一部の情報は、推測や個々の利用者の解釈にもとづくものである場合があります。そのため、全

    日本語LLMまとめ
  • PDF2Audio - a Hugging Face Space by lamm-mit

    DropOutSurf_JOY
    DropOutSurf_JOY 2024/10/04
    TTSテンプレート
  • https://playground.allenai.org/?model=mm-olmo-uber-model-v4-synthetic

    DropOutSurf_JOY
    DropOutSurf_JOY 2024/10/04
    Molmoは1B-72Bのモデルを提供。MolmoE-1BはGPT-4V並、7BモデルはGPT-4V/4o間、72BモデルはGPT-4o次点の性能。
  • ゼロからRAGを作るならこんなふうに

    どんな人向けの記事? これからRAGを作ってみたい DifyやLangChainにこだわらず、自分で開発をハンドリングしたい ベクトルDBや埋め込みモデルの選定の勘所をサッと知りたい ここではRAGとは何かのような話題は扱いません。 RAGが、ほぼAI活用の現実的な最適解になりつつある LLMは高度な知的タスクを実行可能である。 そんな理解が世界に広まっていく中で、企業は自らが蓄えたデータをLLMに組み合わせてどう活用するか躍起になっています。これからはビッグデータだ!という時代を経ているため、情報インフラに投資した企業も多く、AIでデータを活用する流れはもはや確定路線と言えます。 この問題を解決する手法として一番最初に思いつくのは、モデル自体を改変するファインチューニングです。しかし、ファインチューニングにはいくつかの実用上の問題があります。ファインチューニング自体に専門知識が必要である

    ゼロからRAGを作るならこんなふうに
    DropOutSurf_JOY
    DropOutSurf_JOY 2024/08/16
    gogole, GCP,
  • 第1回 生成AIの得意・不得意 2024・夏 | gihyo.jp

    皆さんこんにちは。スリーシェイク代表の吉田です。 今回より生成AIを、金融業界や製造業、医療業界など各事業ドメイン固有の課題解決にどう使われているのか、具体的なユースケースを提示しながら、それを実現するアーキテクチャについて解説していきます。この連載を通して、これまで生成AIを実際のシステムに組み込むイメージが湧かない方への第一歩として手助けになれば幸いです。 第1回は、生成AI自体の一般的な得意不得意を踏まえながらユースケースを解説します。 生成AIが得意とする処理とは? 生成AIが得意とするのは、「⁠専門性のない一般的な知識をベースにした」テキスト生成、コード生成、画像認識や画像生成が挙げられます。RAG(Retrieval-Augmented Generation)やプロンプトエンジニアリングにより固有ドメインに特化させることは可能ですが、教師あり学習データを前提としたMLやDeep

    第1回 生成AIの得意・不得意 2024・夏 | gihyo.jp
    DropOutSurf_JOY
    DropOutSurf_JOY 2024/07/29
    改善,効率化,生産性,自動化,ワークフロー,
  • RAGで文書を1トークンに圧縮する「xRAG」について

    株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。 記事では、「xRAG」という手法について、ざっくり理解します。xRAGとは、RAGシステムでLLMに投げるドキュメント(通常、数千文字ほどですよね。)を、1トークンに圧縮できるのでは?という手法です。 この記事は何 この記事は、RAGをする際にLLMに渡すドキュメントを1トークンまで圧縮できる手法「xRAG」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー xRAGは、RAGで渡すコンテキストを極限まで圧縮する手法です。北京大学/Microsoftの研究者らによって2024年5月に提案されました。xRAGを使うメリットは、コンテ

    RAGで文書を1トークンに圧縮する「xRAG」について
    DropOutSurf_JOY
    DropOutSurf_JOY 2024/05/29
    絵文字で圧縮プロンプト系の正式版,ベクトル化,1トークン,
  • 1