[B! LLM] mizdraのブックマーク

https://openai.com/index/gpt-4-1/

mizdra 2025/04/15

LLM

リンク

Comparison of AI Models across Intelligence, Performance, Price | Artificial Analysis

Comparison and analysis of AI models across key performance metrics including quality, price, output speed, latency, context window & others.

mizdra 2025/03/31

AI
LLM

リンク

言語モデルの物理学 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

言語モデルの物理学 (Physics of Language Models) とは、FAIR (Meta) の Zeyuan Allen-Zhu が提唱した、言語モデルの研究を進めるためのコンセプトです。ざっくり言うと、「あのモデルはこう」とか「そのモデルはこのモデルよりもこう」というような博物学的な知識を深めるのではなく、17世紀にケプラーやニュートンが物理学において行ったような原理に基づいた研究を進め、「言語モデルはなぜこのような振る舞いをするのか」という問いに答えられるようになるべきという考え方です。言語モデルの物理学の特徴は大きく2つあります。第一は、ウェブから収集したコーパスを使わず、きっちりコントロールされたデータセットを使って言語モデルを訓練するということ。ウェブは誰も全体像を理解できないほど複雑で、ノイズにまみれています。本物の物理学でも空気抵抗や摩擦があると、「鉄球は

mizdra 2025/03/24

LLM
研究

リンク

バイブスでコーディング

バイブスでコーディング Andrej Karpathy（OpenAI共同創業者）がXで提唱した“vibe coding”の概念が、現在のAIエージェントを使った「ノリや雰囲気、感性」などを重視したコーディングスタイルをうまく言語化していて面白い。 There's a new kind of coding I call "vibe coding", where you fully give in to the vibes, embrace exponentials, and forget that the code even exists. It's possible because the LLMs (e.g. Cursor Composer w Sonnet) are getting too good. Also I just talk to Composer with SuperWhi

mizdra 2025/03/22

AI
LLM

リンク

“Deep Researchの中の人”を手動でやってみる - laiso

はじめに：Deep Researchの衝撃 openai.com 先日、ChatGPTの「Deep Research」という機能がProユーザー向けに提供されました。 Deep Researchは、オンライン上の情報ソースからデータを検索し、詳細なレポートを作成してくれる「リサーチエージェント（アシスタント）」と呼ばれるものです。実は、ChatGPTに先駆けてGoogleのGeminiにも同名の機能が存在していたり*1、Perplexity AIにも検索結果と応答から詳細なレポートを生成する機能がすでに提供されていました*2。さらにさかのぼると、LangChainユーザーの間ではGPT Researcherという類似のツールとして知られているかもしれません。私自身は『その仕事、AIエージェントがやっておきました。』という本を通じて、このようなリサーチエージェントの存在を知りました。

mizdra 2025/02/10

AI
LLM

リンク

Introducing the Model Context Protocol

Today, we're open-sourcing the Model Context Protocol (MCP), a new standard for connecting AI assistants to the systems where data lives, including content repositories, business tools, and development environments. Its aim is to help frontier models produce better, more relevant responses. As AI assistants gain mainstream adoption, the industry has invested heavily in model capabilities, achievin

mizdra 2025/02/06

LLM
AI

リンク

https://unsloth.ai/blog/deepseekr1-dynamic

mizdra 2025/02/01

リンク

DeepSeek狂奏曲

DeepSeek狂奏曲 2025.01.30 Updated by Ryo Shimizu on January 30, 2025, 08:35 am JST DeepSeekという中国製のモデルが世界を席巻している。 OpenAIが有償で提供するo1より高性能だとか、OpenAIの規約に違反した方法で学習されているとか、色々あるのだが、それを噂する人々が不正確な情報に基づいてピーチクパーチクやっているだけなので基本的にメディアにはほぼ出鱈目な情報しか出ていない。まず、整理しておきたいのは、DeepSeek(特にV3とR1)とは何か、ということだ。 DeepSeek-V3は、GPT-4o相当のAIであり、オープンウェイト(AIの学習結果=重みが公開されている)で公開されている。オープンソースではない。 DeepSeek-R1は、o1相当のAIであり、こちらもオープンウェイトで公開されてい

mizdra 2025/02/01

LLM
AI

リンク

LLM: 大規模言語モデルとは何でしょうか。 | Machine Learning | Google for Developers

フィードバックを送信 LLM: 大規模言語モデルとは何でしょうか。コレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。新しいテクノロジーである大規模言語モデル（LLM）は、トークンまたはトークンのシーケンスを予測します。場合によっては、数段落分のトークンを予測します。トークンは、単語、サブワード（単語のサブセット）、単一の文字にすることができます。LLM は、次の理由から、N グラム言語モデルや再帰型ニューラルネットワークよりもはるかに優れた予測を行います。 LLM には、再帰モデルよりもはるかに多くのパラメータが含まれています。 LLM ははるかに多くのコンテキストを収集します。このセクションでは、LLM の構築に最も成功し、広く使用されているアーキテクチャである Transf ormer について説明します。 Transf ormer とは Transf

mizdra 2025/01/31

LLM
AI

リンク

BitNet: Scaling 1-bit Transformers for Large Language Models

The increasing size of large language models has posed challenges for deployment and raised concerns about environmental impact due to high energy consumption. In this work, we introduce Bit Net, a scala ble and stable 1-bit Transf ormer architecture designed for large language models. Specifically, we introduce Bit Linear as a drop-in replacement of the nn.Linear layer in order to train 1-bit weights

mizdra 2025/01/30

AI
LLM

リンク

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Recent research, such as Bit Net, is paving the way for a new era of 1-bit Large Language Models (LLMs). In this work, we introduce a 1-bit LLM variant, namely Bit Net b1.58, in which every single parameter (or weight) of the LLM is ternary {-1, 0, 1}. It matches the full-precision (i.e., FP16 or BF16) Transf ormer LLM with the same model size and training tokens in terms of both perplexity and end-t

mizdra 2025/01/30

LLM
AI

リンク

Ollamaを活用したDeepSeek-R1のローカルLLM構築ガイド

DeepSeek-R1は、ローカル環境での大規模言語モデル（LLM）の実行を可能にする強力なモデルです。Ollamaは、そのセットアップと実行を簡素化するツールとして最適です。この記事では、Ollamaを使用してDeepSeek-R1をローカルで実行する手順を説明します。 DeepSeek-R1をローカルで実行するためのOllamaセットアップ手順 1. システム要件の確認オペレーティングシステム：macOS、Linux、またはWindows ハードウェア： RAM：最低8GB（推奨16GB以上） GPU：NVIDIA GPU（CUDA対応）を推奨。ただし、GPUがない場合でもCPUでの実行は可能ですが、パフォーマンスは低下します。ディスク容量：モデルサイズに応じて10GB以上の空き容量なお、今回はGPUを搭載していないノートPCでOllamaを実行しました。 2. Ollamaのイ

mizdra 2025/01/30

LLM
AI

リンク

「プログラマとCLINE - これはパンドラの箱なのか」を観た - laiso

www.youtube.com 昨夜未明、インターネット某所で、プログラミング支援ツール「Cline」と、それを用いたゲーム開発の経験談*1を語り合う会合がありました。 CLINEが持つ、人間の介入を最小限に抑えながら暴走機関車ようにコードを生成する性質を軸に、CopilotやCursorなど既存のAIコーディングツールとの比較や、これまでのコーディングツールのアプローチからの変化、今後の開発における展望も議論されていました。 Clineの性質ホストの@mizchiさんはClineを「強いパーミッション持って自動で実行されるのでイテレーションの回数が多い」「AIにコーディングのアシスタントではなく主導権を持たせても何とかなるということを気づかせてしまった」と評価していました。Cursorなどと比較してその自律性（相談せず勝手にやっちゃう）に強く惹かれているそうです。確かに全部読み込ませ

mizdra 2025/01/28

リンク

わんぱくな JSON ストリームパーサーを見る日 - ぽ靴な缶

この記事ははてなエンジニアアドベントカレンダー 2024 5 日目の記事です。昨日は id:susisu さんの Data types à la carte in TypeScript でした。本人が「アクセス増えたと思ったら別の記事で、全然読まれてない...」と言っていたので「いきなりフランス語で難しそうやからね」と伝えました。本文は日本語なので、みなさんも読んで下さい。今日は最近見て面白かったコードの紹介です。 ChatGPT が流行って以来、アプリでストリームのレスポンスをよく見るようになりました。 LLM によるテキスト生成はわりと時間がかかる処理で、もしすべて生成し終えてからレスポンスするとユーザーを待たせてしまうからでしょう。テキストがちょっとずつ表示される UI は昔からあるものですが、LLM を使ったアプリケーションが出てきて以来、演出としてではなく実用としてよく見

mizdra 2024/12/16

良い

リンク

GitHub - microsoft/vscode-prompt-tsx

As AI engineers, our products communicate with large language models using chat messages composed of text prompts. While developing Copilot Chat, we've found that composing prompts with just bare strings is unwieldy and frustrating. Some of the challenges we ran into include: We used either programmatic string concatenation or template strings for composing prompts. Programmatic string concatenati

mizdra 2024/10/30

LLM のプロンプトを JSX で記述するためのライブラリ。template literal だと余計な空白が入ったり、prettier で format もできなかったりするので、気持ちは分かる。

リンク

Fast and Portable Llama2 Inference on the Heterogeneous Edge

Fast and Porta ble Llama2 Inference on the Heterogeneous EdgeNov 09, 2023 • 12 minutes to read The Rust+Wasm stack provides a strong alternative to Python in AI inference. Compared with Python, Rust+Wasm apps could be 1/100 of the size, 100x the speed, and most importantly securely run everywhere at full hardware acceleration without any change to the binary code. Rust is the language of AGI. We cr

mizdra 2023/11/15

リンク

はてなブックマーク

タグ

関連タグで絞り込む (8)

LLMに関するmizdraのブックマーク (16)

お知らせ

今週のはてなブックマーク数ランキング（2026年1月第3週）

はてなブックマークの計画メンテナンスのお知らせ（2026年1月23日(金) 深夜1:30〜3:00）

今週のはてなブックマーク数ランキング（2026年1月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス