AIの“性格”を手動でミックス。音楽機器のようなインターフェイスの装置が、生成AIの創造性を解き放つ

音楽制作に使われるミキサーなどの機器に着想を得て、大規模言語モデルの性格や語調をノブやスライダーを手で動かすことで調節できる装置を、オーストラリアの研究者たちが開発した。生成AIの創造性を拡張させるきっかけとなるかもしれない。
AIの“性格”を手動でミックス。音楽機器のようなインターフェイスの装置が、生成AIの創造性を解き放つ
Photograph: RapidEye/Getty Images

大規模言語モデル(LLM)との対話といえば、テキストベースのチャット形式が一般的だ。この形式は反応が予測可能になりがちで、入力と出力の間に生じる“創造的なあそび”の余地が乏しい。このため、ユーザーの発想を広げる触媒にはなりにくいといえる。

そこでオーストラリアのモナシュ大学の研究チームは、音楽制作に使われるミキサーやアナログシンセサイザーに着想を得て、ノブやスライダーを手で動かしてLLMの性格や語調を調節できる装置「Memetic Mixer」を開発した。

ノブやスライダーを手で動かして大規模言語モデル(LLM)の性格や語調を調節できる装置「Memetic...

ノブやスライダーを手で動かして大規模言語モデル(LLM)の性格や語調を調節できる装置「Memetic Mixer」のプロトタイプ。言葉の入力は音声認識やキーボードではなく、左手前のプレート部分にマグネットに書かれた単語を並べる“アナログ”なシステムを採用した。

Photograph: Jon McCormack

AIを楽器のように“演奏”

Memetic Mixerの最大の特徴は、フェーダーによって人工知能(AI)の“人格”をミックスできる点にある。具体的には、「楽観と悲観」「夢想と現実」「主導的と従順」といった相反する性格軸がスライダーに対応しており、それぞれを微調整することで出力されるテキストのニュアンスが変化する仕組みだ。

この装置には複数のノブが設けられており、出力にフィルターやエフェクトをかけることもできる。例えば、語彙レベルや文章の長さ、皮肉や感情の強さ、政治的な傾向などを調節することで、同じ入力からでも異なる出力が得られる。この設計により、ユーザーは意味だけでなく口調を含めて生成AIとの対話を好みのものに変えられるという。

研究チームは今回、アートを専攻する6名の大学院生を対象に、単語だけを使ってLLMと対話する装置「Memetic Poet」と、これにノブやスライダーを取り付けたMemetic Mixerを1週間ずつ試用してもらい、その反応を比較した。

その結果、前モデルに相当するMemetic Poetに対しては「すぐに飽きてしまった」「単語を置き換えるだけでは想像力が膨らまない」といった声が多く、出力の幅や意外性に対する不満が目立った。一方で、Memetic Mixerへの反応は明らかに異なっていた。特に「自分の手で人格を調整している感じがしておもしろかった」という学生の感想は、物理的操作が創造性を喚起する体験として機能することを示唆しているという。

単語だけを使ってLLMと対話する「Memetic Poet」(左)と、これにノブやスライダーを取り付けたMemetic Mixer(右)。

単語だけを使ってLLMと対話する「Memetic Poet」(左)と、これにノブやスライダーを取り付けたMemetic Mixer(右)。

Photograph: Jon McCormack

特筆すべきは、参加者の誰ひとりとして装置の使い方を事前に説明されることなく、ノブやフェーダーの機能を即座に理解して使いこなしていた点だろう。これは音楽機器に由来する操作様式が文化的に広く浸透しており、専門家でなくても直感的に受け入れられることを示している。

このほか、装置を使って生成された言葉について音楽的な比喩で語る参加者が多かった点も注目に値する。なかでも「言葉をエフェクトでひずませる」といった表現からは、テキストを“音”として捉える認知的な転換がうかがえるという。インターフェイスの変化がユーザーの認識そのものを変える可能性を示唆していると、研究者たちは考えている。

研究チームは今後、教育や福祉、創作支援などへの応用も視野に入れている。例えば、児童向けのAI家庭教師が子どもの性格に応じて語り口を調整したり、高齢者支援の文脈で心の状態に寄り添う言葉を生成したりする用途が想定される。

言語生成AIがもたらす創造性の拡張には、出力される“中身”だけでなく、それを操作する“手触り”こそが重要なのかもしれない。今回の研究は、音楽の世界で長らく培われてきた直感的な操作様式が、異なる分野におけるインターフェイスの設計に革新をもたらす可能性を示した良例と言える。

(Edited by Daisuke Takimoto)

※『WIRED』による人工知能(AI)の関連記事はこちら


Related Articles
R1 device
音声で指示するだけでアプリを代わりに操作してタスクを実行してくれるAIデバイスが、「CES 2024」で発表された。この「rabbit r1」という製品は、どんな世界をもたらすことになるのか。
A photo illustration of three men talking in a circle with one having a blue overlay over his face and hands.
「Hume AI」が開発した新システムは、主要なAIモデルに人間らしい共感的な声を付与する。AIが人間の感情を“認識”し適切に反応するという技術はAIと人間のコミュニケーションの新局面のようだが、AIの感情表現はあくまで模倣に過ぎないとの指摘もある。

AIの“性格”を手動でミックス。音楽機器のようなインターフェイスの装置が、生成AIの創造性を解き放つ

雑誌『WIRED』日本版 VOL.56
「Quantumpedia:その先の量子コンピューター」好評発売中!

従来の古典コンピューターが、「人間が設計した論理と回路」によって【計算を定義する】ものだとすれば、量子コンピューターは、「自然そのものがもつ情報処理のリズム」──複数の可能性がゆらぐように共存し、それらが干渉し、もつれ合いながら、最適な解へと収束していく流れ──に乗ることで、【計算を引き出す】アプローチと捉えることができる。言い換えるなら、自然の深層に刻まれた無数の可能態と、われら人類との“結び目”になりうる存在。それが、量子コンピューターだ。そんな量子コンピューターは、これからの社会に、文化に、産業に、いかなる変革をもたらすのだろうか? 来たるべき「2030年代(クオンタム・エイジ)」に向けた必読の「量子技術百科(クオンタムペディア)」!詳細はこちら