プラットフォーマーvs生成AI「データは誰のものなのか」② 長谷佳明
生成AIを開発する企業にとって、データは必要不可欠なものだ。前回、グーグルは、ライバル企業となるオープンAIのCEOであるサム・アルトマンとつながりの深いオンライン掲示板サービス「レディット(Reddit)」からでも、データを購入していることを示した。
現時点で、AIの学習に活用されるデータの権利は、各国の法規制に隔たりがあり未整備なため、データの価格決定権は法規制によらず、“あえて支払う”というAI開発企業側にあると推測される。しかし、将来的にデータの権利が一般に認められ、レディットのような企業が供給先を絞ったり、データ取引に関するマーケットを創設したりしたらどうなるか。データの価格は、今よりも確実に高くなるだろう。
「利益相反」にならないのか
例えば原油も「質」によって価格が上下するように、データを提供する企業間の競争も促し、取引されるデータの質が向上したり、データを加工するビジネスが、今後生まれたりするかもしれない。
石油輸出国機構(OPEC)がかつて、エクソンモービルやシェルなどの石油メジャーに代表される国際石油資本から利益を守るために協力したように、将来、巨大AI企業に立ち向かうために、メディア企業をはじめ、データ提供企業は、その権益を守るために組織化されるかもしれない。
すでに、BBCやCNNなどのメディア企業らは、AI企業による一方的なデータ収集に不服を表明し、ボットと呼ばれるデータ収集プログラムの自社サイトへのアクセスをブロックするなどしている。AI開発企業のふるまいに納得ができず、一斉にデータの供給を止めたりすれば、AIは学習が困難になり劣化するだろう。
データ取引市場が実現した暁には、データを買う企業とデータを売る企業には利益相反の観点から、企業統治は分離されるべきであろう。このため、アルトマン氏のように、AI開発企業であるオープンAIのCEOでありなら、データ提供企業のレディットの大株主でもる点は、問題視される可能性もありうる。
またグーグルは、グループ内にYouTubeやGメールなどのデータサービスを抱える。このように、AIを開発する業務と、AIのためのデータを生み出す業務を二つ抱えることに、データ利用上の懸念が抱かれる可能性もある。現時点では一つの仮説にすぎないが、AI開発を別会社として分社化する必要性が生じるかもしれない。
突然に第三者に売ると言われたら……
レディットには、プレミアムと呼ばれる月額5.99ドル(年間契約の場合は49.99ドル)を支払い、広告を非表示にしたり、限定のアバターの利用、会員限定掲示板へのアクセスを可能としたりするサービスなどもあるが、収益の大半はレディット内に掲載される広告収入に依存していた。レディットにとって、グーグルとの契約は、翌月に控えていたIPOへのアピールとして、自社に集まるデータの収益化の第一歩を踏み出し始めた象徴的な出来事といえるものだった。
しかし、メディア企業が自ら執筆し作り出すコンテンツと異なり、レディットのように、ある人にとっては、ひそかな楽しみを語らう日常生活の一部であり、また、ある人にとっては自らの主張を発表する場でもあったコミュニティーが突如、公にデータを第三者に“売りはじめたこと”の衝撃は計り知れなかったであろう。つまり、ここで湧き上がる大きな疑問は「データは誰のものであるのか?」ということだ。
次回は、プラットフォーマーの利用規約なども取り上げ、データの収益化を巡る新たな懸念について引き続き深掘りする。(続く)