サウンドハウンドAI 音声認識AIの米ベンチャー 長谷川祐子
有料記事
SoundHound AI 鼻歌認識アプリが出発点/89
サウンドハウンドAIは米シリコンバレー発の「音声認識AI(人工知能)」開発ベンチャーだ。
創業者の一人はイラン出身で現最高経営責任者(CEO)のケイバン・モハジャール氏。米スタンフォード大学大学院で電気工学を専攻していた2004年の暮れ、学部生だったジェームズ・ホム現最高プロダクト責任者と学生寮にこもり、人の声を認識して即座に応答するプログラムを開発。2人は翌年、サウンドハウンドAIを創業した。
最初に開発したプログラムは、ユーザーがマイクに向かって鼻歌を歌うと、曲名を言い当てるというもの。
同社のウェブサイトに載るモハジャールCEOのインタビューによると、プログラミングが終わった04年12月24日、最初に歌った鼻歌は映画「ゴッドファーザー」のテーマ曲だったという。その後、この技術を使ったスマートフォンアプリを無料提供し始め、日本語を含む25言語に対応する。「メロディーの一部は覚えている曲名を知りたい」という人のニーズに応えるアプリとして便利に使われている。
スマホアプリのほか、他社の製品に組み込んで実用化されている。同社の音声認識AIを利用する企業には、独メルセデス・ベンツ(北米販売車種の一部)▽韓国の現代自動車と起亜自動車(北米・インド販売車種の一部)▽ホンダ(日本・欧州販売車種の一部)▽米液晶テレビ大手ビジオ(一部機種のリモコン)▽米ファストフード店運営のホワイトキャッスル(ドライブスルー窓口)──などがある。
ホンダeに搭載
ホンダは電気自動車「ホンダe」に搭載する。ドライバーが「OK、ホンダ。近くの充電スタンドまでお願い」と話しかけると、音声認識AIが現在地から最も近い充電スタンドの名称と距離を返答し、道順を案内する。目的地を指で操作せずに済むカーナビゲーションシステムだ。ほかにも天気などさまざまな質問に応答する。
通常、音声認識AIは人の声を文字に置き換え、次にそれをコンピューターで解析して意味を抽出するという2段階で処理する。しかし、サウンドハウンドのAIは両処理を同時に実行でき、これを「発話から意味」と呼んでいる。
同社は2月7日、既存の音声認識AIを格段と進歩させた新技術「ダイナミック・インタラクション・ウィズ・ジェネレーティブ(生成)AI」を公開した。複数の情報を同時並行処理する機能を拡張し、米ベンチャー企業オープンAIが開発した生成AI「チャットGPT」と類似する技術だという。
エヌビディアなども出資
サウンドハウンドAIの先端技術に期待する企業は多い。開示資料によれば、同社に出資した企…
残り1097文字(全文2197文字)
週刊エコノミスト
週刊エコノミストオンラインは、月額制の有料会員向けサービスです。
有料会員になると、続きをお読みいただけます。
・1989年からの誌面掲載記事検索
・デジタル紙面で直近2カ月分のバックナンバーが読める