新規会員は2カ月無料!「年末とくとくキャンペーン」実施中です!

テクノロジー 最前線! AIの世界

生成AIの誕生② 「プロンプト」の発明による劇的な進化 長谷佳明

 現在の生成AIブームのきっかけとなったのは、2022年8月に英国のスタートアップ企業・スタビリティAI社が公開した画像生成AIシステム「ステーブルディフュージョン」である。ステーブルディフュージョンは、フォトリアルな画像やアニメ風の緻密な画像をわずか数秒で生成する。従来の生成AI技術と比べ、生成される画像の質や種類が劇的に向上した。

 ステーブルディフュージョンのような「現在の生成AI」と前回紹介した「かつての生成AI」とは、何が根本的に異なるのであろうか。

AIと対話できる画期的なシステム

「かつての生成AI」を活用したものの例として、2021年6月に、エヌビディアがリリースした「NVIDIA Canvas」がある。生成AIを活用しラフなスケッチを写真風の画像に変換するツールである。 NVIDIA Canvasは、リアリティーさこそ目を引いたが、「風景写真」を「ダリ風の絵画」に変換するような類の機能は、従来からアドビのフォトショップのような写真編集ソフトには「フィルター」として含まれており、画期的とまではいえず、これまでの延長線上の機能でしかなかった(図1)。

「現在の生成AI」の代表格、ステーブルディフュージョンはどうなのか。一番の違いは「プロンプト」の存在であろう。プロンプトとは、もともとはコンピューターなどのシステムをコマンドと呼ばれる「命令」を組み合わせた文(テキスト)によって操作する機能を意味する。ステーブルディフュージョンのようなAIは、プロンプトを通じて、ユーザーと「対話」が可能となった(図2)。

「かつての生成AI」は、AIと対話はできず、処理は一方通行で「便利な道具」の域をでなかった。これに対し、「現在の生成AI」はプロンプトを介して、AIと使う人がやりとりを行うことができる。これが、AIがまるで「有能なアシスタント」のように振る舞うことができる理由である。

 プロンプトによってAIが学習したであろう、さまざまなデータを思い描きながら、コンテンツを生成できる点が画期的で、一部のユーザーの間では写真の発明に匹敵するインパクトで捉えられた。また、写真を意味する「フォトグラフィ」と、生成AIの特徴である「プロンプト」を組み合わせ、「プロンプトグラフィ」という造語も作られた。

「似ている」かどうかを判断

 では、ステーブルディフュージョンのプロンプトはいかにして作られたのか。ステーブルディフュージョンには、ドイツの非営利団体「LAION(Large-scale Artificial Intelligence Open Network)」がインターネットから収集した「画像」と「キャプション」のペアからなる50億超のデータ「LAION-5B」が活用されている。

 大量の画像を学習データとしている点は、従来の手法と変わりないが、キャプション、つまり、画像がどのようなものであるかを言語で説明する大量のテキストを学習している点が異なる。画像を表現したベクトル(数値列)と、その画像に与えられたキャプションを表現したベクトルとが「類似する意味」を表現するようにAIは学習している。

 ベクトルの類似度の計算には、統計学などで用いられる「コサイン類似度」が用いられている。コサイン類似度は「1」から「-1」の間の数値を取り、「1」に近いほど「似ている」といえ、「-1」に近いほど「似ていない」といえる。また「0」に近い場合は「無関係」という状態を示す。

 画像から生み出されるベクトルと、キャプションから生み出されるベクトルとが同じ意味をとらえるように学習できれば、画像を説明するテキストを生み出すことができるし、テキストの内容から連想される画像を生み出すことも可能となる。この仕組みを利用し、プロンプトによる生成画像の操作も可能となった。

多くの「引き出し」を持つまでに発展

 従来の認識系AIでは、たとえば「人を抽出する」「動物の種類を識別する」など目的を設定し、精度よく識別できるよう学習によって調整する。もし、識別する対象を変えるなどしたければ、再度学習しなおさなければならない。

 一方で、現在の生成AIは、大量のデータから、言語の特徴や、作風などを学習した結果、大きくは、画像生成、テキスト生成などの区分けはあるものの、認識系AIのように「目的」に該当するものは、明確には与えられていない。いわば、さまざまな機能の引き出しをもった「複合機」になっている。どの機能を活用し、どのように使うかは、プロンプトによって「設定」できる。

 この柔軟性によって、ある程度は、再学習なく、人の目的に合わせて、その能力を発揮できる点は革新的といえる。現在は、「プロンプトエンジニアリング」という言葉が生まれるほど、この使い方は難しいが、すでに生成AIに合わせた適切なコマンドが先人たちの試行錯誤の末に「発掘」され、使い勝手は改善され始めている。プロンプトの発明こそ、今日の生成AIブームにつながる、偉大な進化であったといえるだろう。

インタビュー

週刊エコノミスト最新号のご案内

週刊エコノミスト最新号

11月26日号

データセンター、半導体、脱炭素 電力インフラ大投資18 ルポ “データセンター銀座”千葉・印西 「発熱し続ける巨大な箱」林立■中西拓司21 インタビュー 江崎浩 東京大学大学院情報理工学系研究科教授、日本データセンター協会副理事長 データセンターの電源確保「北海道、九州への分散のため地産地消の再エネ [目次を見る]

デジタル紙面ビューアーで読む

おすすめ情報

編集部からのおすすめ

最新の注目記事