「ソブリンAI」の夜明け――各国の開発状況を見る 長谷佳明
パリで5月に開かれた欧州最大のテクノロジーカンファレンス「Viva Technology」(5月22~25日)に参加した。Viva Technologyは年に一度フランス・パリで開かれる。開催者によると、今年は160カ国、16万5000人以上が来場した。また今年は、日本は「Country Of The Year」(特別招待国)で、巨大なブースを設けて日本に関連したイベントも行われていた。
重要な社会インフラになる
Viva Technologyでは、著名なスピーカーによるセミナーが多く開催される。話題の中心はやはりAI(人工知能)だ。いくつかのセッションを聞いた中で、度々登場したキーワードは「ソブリンAI」だった。
「ソブリン(Sovereign)」とは「国王」や「最高」の意味。ソブリンAIは「主権型AI」とも呼ばれ、自国のコンピューター、自国のデータ、自国の人材を用いて自国のためのAIを開発、運用することを示す。ソブリンAIは、文字通り国家が国民のために独自のAIを開発したり、その開発を支援したりする行動といえる。AIが電気と同じくらい重要な社会インフラになると考え、経済安全保障のために、さまざまな国がAIの戦略を見直し始めている。
日本では、産業技術総合研究所、国立情報学研究所、東京工業大学などが大規模言語モデルに関する研究開発を行う「LLM-jp」(2023年11月20日掲載「オープンソース化で生成AI開発に何が起きているか」参照)のほか、スーパーコンピューター「富岳」で開発された「Fugaku-LLM」のように、日本語に特化した大規模言語モデルの開発が、いくつかのグループで進められている。
また経済産業省は24年2月、国内の生成AI開発のための支援プログラム「ジーニアック(Generative AI Accelerator Challenge、GENIAC)」を発表した。国内のAI開発は各所で始められているが、乱立の様相を呈しており、貴重なリソースの有効活用のためにも、ソブリンAIに向けた取りまとめが必要な時期にきているといえる。
海外製AIに頼ることに警鐘
オーストラリアは、同国最大の公的研究機関であるオーストラリア連邦科学産業研究機構が24年3月、ソブリンAIを巡る取り組みに関連して「Artificial Intelligence foundation models」というリポートにまとめた。このリポートは、海外製AIに依存する状況に警鐘を鳴らし、国内でのAI開発体制の整備と、自国の法律や規範、文化に適合したAIの重要性を訴えている。
すでに政府がソブリンAIのための予算を計上して具体的な行動を進めているのがカナダだ。カナダにはモントリオール大学ヨシュア・ベンジオ教授をはじめとする著名なAI研究者が多い。2024年度の予算で24億カナダ・ドル(約2760億円)のAI関連予算が成立。このうち20億カナダ・ドル(約2300億円)は、自国の研究者や企業のためのAI開発環境の整備などを含む「AIコンピュート・アクセス・ファンド」の設立と「カナダ・ソブリン・コンピュート戦略」に使う。
カナダのトルドー首相はこの投資について、「最先端のコンピューティングインフラへのアクセスを確保し、より多くのグローバルなAI投資をカナダに引き付け、最高の人材を育成・採用し、カナダ企業が世界の舞台で競争し、成功するのに役立つ」と主張している。AI人材が豊富に見えるカナダも、ソブリンAIの実現は急を要し、現状に危機感を抱いていると判断しているようだ。
国家が主導するソブリンAIにはリスクも
欧米に対し、独自のAI生態系を構築してきたのが中国である。中国サイバースペース管理局は24年5月、習近平国家主席の著書や政府文書などを学習した大規模言語モデルの開発を発表した。権威主義的な国では当然起こると思われていた動きだが、自由主義国家においても、特定の思想を強く反映したモデルがソブリンAIとして作られることのリスクは拭い去れない。国が主導して大規模言語モデルを開発する際の懸念の一つといえるだろう。
一方で国の枠を超え、AI開発の国際協力を勧めているのが東南アジアだ。24年3月、シンガポールを拠点とする企業や研究機関らなどからなるAIシンガポールとグーグルリサーチは、「Project SEALD (Southeast Asian Languages in One Network Data)」を始めた。タイ語、タミル語、ビルマ語など、この地域特有の言語に特化したAIのためのデータセット(AIのための学習データ)の整備を目指す。データセットが整えば、オープンソースの大規模言語モデルをファインチューニングし、その地域のニーズに沿った独自AIを開発できる。
オープンソースモデルの利用もありうる
ソブリンAIは国が主導して作るとはいえ、大規模な計算リソースや開発に必要な人員を確保するのは容易ではない。ただ昨今は、メタ・プラットフォームズが開発するLlama3をはじめ、フランスのミストラルAIのMixtral、アラブ首長国連邦のテクノロジーイノベーション研究所のFalcon 2など無償で利用できるオープンソースのモデルもある。ゼロからAIを開発しなくとも、商用AIに匹敵するオープンソースのモデルを入手できる環境が整ってきたため、ソブリンAIも、これらのモデルをベースに、地域の共同開発プロジェクトとして進むケースもあるだろう。
ソブリンAIと相対することになるオープンAIやグーグルらは、一国のAI開発費をはるかにしのぐ金額を投じている。このため、ソブリンAIが商用サービスに匹敵する性能を獲得するためには、思いを同じくする国同士が役割を分担し、互いに知恵を出し合い協力することが肝要であろう。