タグ

OpenAIに関するNAPORINのブックマーク (2)

  • ついに正式版になったOpenAI o1の画像理解の実力を試す

    今日未明、サム・アルトマン自らがチームと共にOpenAI o1の能力を説明した。スペック的にはプログラミング能力が向上し、そして画像理解(マルチモーダル)に対応したというのが最大のニュースだろう。 プログラミング能力についての検証はいろんな人が世界中で始めているだろうから、僕は画像理解の方を試してみようと思う。 というのも、僕の手元には手書きで書かれた図解が大量にあるからだ。 手書きが好きすぎてタブレット端末を作ったほどである。 まずは以前作ろうと思ってボツにしたAIアプリの概念図 汚いのは手書きの宿命これを清書してもらうことにする。 以下は、提示された手書きメモを参考に、内容を整理し、簡易的なフローチャートとしてSVGで清書した例です。 手書きメモは主に「静的AI画像作成ツール」の作業フローアイデアを示すものであったため、ステップを分かりやすく整理しています。 ※ 元の手書き図は非構造的

    ついに正式版になったOpenAI o1の画像理解の実力を試す
  • 控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表

    OpenAIは2月15日(現地時間)、テキストから最大1分間の動画を生成できる動画生成AIモデル「Sora」を大量のデモ動画と共に発表した。複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成することができるという。 プロンプトから破綻のない動画を生成 Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W Prompt: “Beautiful, snowy… pic.twitter.com

    控え目に言って革命。OpenAI、動画生成AIモデル「Sora」発表
  • 1