人口減少社会の生産性を高める。スマートスピーカーの元開発責任者が語る、音声AIの可能性。

テクノロジー部門 リサーチチーム

橋本泰一

2002年 東京工業大学 大学院情報理工学研究科 計算工学専攻 博士課程修了。博士(工学)。 東京工業大学 助手および特任助教授(特任准教授)として約9年間教員として自然言語処理の研究に従事。2012年よりグリー株式会社、2014年よりLINE株式会社に在籍。ビッグデータ分析プラットフォームの開発、スマートスピーカーをはじめとするAI技術を使った製品の開発を統括。 2021年4月よりRevCommにジョイン。音声認識をはじめとするAI技術の研究開発と知財化を担当。情報処理学会、人工知能学会、言語処理学会、各会員。

音声AIは世界を変える

――橋本さんは前職の経験から、音声AIの可能性を強く感じていると伺いました。どのような経験をされたんですか?

最近ようやく音声コンテンツや、音声メディアなど、音声サービスに対しての関心が高まってきましたが、テクノロジーでみれば、まだまだレガシーな領域です。電話が発明されて以降、特に大きな発明はありません。未開拓な領域だからこそ、当社のミッション「コミュニケーションを再発明し、人が人を想う社会を創る」の『コミュニケーションの再発明』ができる余地が多分にあると感じています。

前職のLINEで、『LINE CLOVA(ラインクローバ)』という、話しかけるだけでLINEの送受信もできるスマートスピーカーの開発をしていました。このプロダクトを使うと、小さな子供が「いつ帰ってくる?ご飯はいっしょに食べられる?」とスピーカーに話しかけるだけで、テキストメッセージになって職場にいるお父さんに届く。さらに、テキストでした返信もスピーカーが音読してくれます。

コンピューターはスマホによって低年齢化したと言われていますが、それはせいぜい10歳前後の話。音声ユーザーインターフェースなら、4・5歳のまだスマホを扱えない子供ですら自由に使うことができます。さらに言えば、子供に限らず、お年寄りやタッチパネルの操作が苦手な人たちまで、簡単にインターネットと繋がれるんです。

これは本当に凄いことです。もともとテクノロジーの領域で働くことを決めたのは、労働者人口が減っている日本で、人を代替し、サポートする技術を開発し、社会の生産性をあげたいという思いからでした。音声を使うことによって、これまでコンピューターをうまく操作できなかった人たちがインターネットを利用できるようになれば、その人たちの生活もより豊かになりますし、社会全体も豊かにすることができます。音声AIに世界を変える可能性が秘められていることを確信しました。

――ありがとうございます。大学の研究ではなく、ビジネス領域で挑戦されるようになったのはなぜですか?

現在のAIは、データがあればあるほど効率よく学習し、良いアルゴリズムを生み出せます。しかし、大学で大量のデータを集めることや、それを計算するための計算機資源を手に入れることは、一研究者には限界があるのが現状です。技術的にもある程度確立されてきて、先進的な研究のためのデータと実践が必要になってきたので、大学ではなくビジネス領域で挑戦することを決めました。

1社目のグリーでは、ビッグデータを扱う仕事を担当し、その後LINEに転職して、先ほど話したスマートスピーカーの開発に携わりました。現在ビッグデータを土台にしたAIや、音声認識の領域はGoogleやAmazonなどの企業が先行しています。想像していた通りの未来が来たと思いますし、その技術を用いてプロダクト開発ができていることに非常に面白みを感じています。

推進力と素直さを武器に挑戦したい

――大量のデータを保有するメガベンチャー2社を経験したのち、なぜ創業間もないRevCommに入社したのか、その経緯を教えて下さい。

確かにグリーやLINEは大量のデータを保有していますが、そのデータはユーザーの持ち物だと、僕は考えています。企業はサービスを始める際に、利用規約やプライバシーポリシーを策定して、データの管理方法や使用用途の範囲をしっかり決め、その範囲内でしかデータを使用することはできません。昔はその境界線が曖昧だった部分もありますが、最近では明確化しようとする流れがあり、ある事業で得たデータを、他の事業に横展開するのは難しくなりつつあるんです。

実際、前職でプロダクトを開発する際は、その点をすごくケアしました。ユーザーの不審に繋がらない大規模データの使用方法を設計する中で、大変な思いをしてきました。

そういった観点からいうと、2017年に創業したRevCommはスタートしたばかりなので、シンプルな環境です。今後のビジネス展開を想定しながら、お客様と当社の利害が一致するデータの使用用途を策定し、データ提供をお願いすることができる。ゼロから設計ができるからこそ、可能性は広がると思っています。

――その他の理由はありますか?

新しい技術を開発していく上で、RevCommの「人」がすごく魅力的だったんです。初めて代表の會田と会ったとき、大きなビジョンを持って、非常にパワフルに物事を推進していく力がある人だと思いました。これまで誰もやったことないことを実現するのは、こういう経営者だなと感じたんです。

また、採用のプロセスの中でリサーチのメンバーと食事をした際に、彼らにとても良い印象を覚えました。いわゆるベンチャー企業の社員にありがちな「自分たちが最高だ」「自分たちだけで実現するんだ」という勢いだけの人たちではなく、周りの意見を素直に吸収できるメンバーばかり。

長い教員の経験から、素晴らしい人材へと成長する人には「素直さ」が不可欠だと思っていましたが、RevCommのメンバーは、まさにその特徴が当てはまりました。技術力としての伸び代はありますが、一緒に仕事をさせてもらう中で、彼らの能力を最大限に伸ばしながら、いいプロダクトを作っていく未来が見えたんです。革新的なことを実現する推進力と、学ぶことへの素直さを持ったメンバーが集まっている環境で、新しく挑戦したいと思い入社を決めました。

若い技術者が世の中を変えていける環境を

――橋本さんにとってRevCommは魅力的な仲間と、新しいチャレンジをしていく場所なんですね。これからどのような挑戦をしていきたいですか?

文字データに比べ、音声データは大切な情報を多く含んでいます。例えば、会議の議事録に書かれている文字情報は、究極的には事実かどうかわかりません。書き手の感じ方によってニュアンスが変わってしまう可能性もあります。実際に話している内容が正確に文字化され、その時の感情やニュアンスすらも分析・可視化することできれば、事実に近く、かつ活用しやすいデータを得ることができます。

僕個人のミッションは、R&D(研究開発)部門として、データの活用方法を開発していくことです。テキストに自動変換した会話が、即座に3・4行に要約できたり、成績のいい営業パーソンの声のトーンや間の取り方を分析したりできれば、生産性の向上や育成強化につながります。このように音声データの使い道は多種多様にあるので、ユーザーのためになる開発とは何か、社会の生産性を高め、より豊かにするプロダクトとは何か。そういうことを真剣に考えて、チームを率いていけたらと思っています。

――最後に、意気込みを教えてください。

RevCommはこれからまだまだ成長していきます。そして、そのために優秀なリサーチャーやエンジニアの力が必要です。特に学生の頃からAIやディープラーニングの技術に触れてきた20代の技術者が、これからのビジネスを主導していくことは間違いありません。彼らの持っている感覚やセンス、技術が最大限生かされれば、本当に世の中は変わると思います。音声の領域で挑戦したい人たちが活躍できる環境を、引き続き作っていきたいです。

リサーチエンジニア

AIによる音声認識技術やコミュニケーションのスコアリング機能などを組み込んだアプリケーションのアルゴリズム実装を行なっています。音声と動画解析、新技術の評価や検証を行い、新たなプロダクトを生み出す研究をしております。

関連インタビュー