「日常のタスクをもっと楽にしたい」という思いで音声を研究していたエンジニアが、RevCommにジョインした理由

テクノロジー部門 リサーチチーム

髙橋卓杜

新卒でDonutsに入社。ライブ配信アプリやレコメンドシステムの開発および、楽曲判定システムの構築に従事。音声解析の仕事に携わるべく、2019年7月にRevCommにジョイン。

「音の仕事をメインでやりたい」と転職を決意

――新卒入社で、ITベンチャーを選ばれた理由を教えてください

就職活動している頃、「大手企業はキッチリした仕事をしなければならない」という窮屈なイメージを持っていて「自由に動ける環境で働きたいな」と思い、ITベンチャー企業を探していました。ただ、周りには大手企業を目指す友人が多くて、誰にも相談することができなかったので、エージェントに紹介してもらいました。

正直に言うと、最初に紹介を頂いた時は、そこまで魅力を感じていませんでしたが、面接していく中で20人ほどの社員とお話する機会があり、「Donutsのメンバーとは気が合いそうだな」と、人に魅力を感じ入社を決めました。実際に入ってみると、能力が高い人が集まってるという印象でしたね。

――前職では、どのような仕事をされていたのでしょうか?

サーバーサイドエンジニアとして入社したのですが、配属のタイミングで「データ分析にも興味があります」と伝えたところ、運よくサーバーサイドとデータ分析の両方をやらせてもらうことになりました。そこで、ライブ配信アプリのサーバーサイドの開発に加えて、データ分析系タスクとしてレコメンドシステムの開発も担当していました。

そして、レコメンドシステムの開発が一定の成果が出たところでクローズしたため、「次はどうしようかな?」と考えていました。そこで、私は大学生の頃に音の研究をしていたのですが、「やっぱり音のことを、もう一度やりたい!」と思い、楽曲判定システムの構築を手掛けました。

――なぜ、転職しようと思われたのですか?

楽曲判定システムの構築をしているうちに、「やっぱり、音の仕事をメインでやっていきたいな」とさらに強く思うようになりました。システムの精度がある程度のレベルまで上がり、一区切りついた段階だったので、徐々に転職を考え始めました。入社して1年ちょっとのタイミングでもあり、「エンジニアとして、他の環境も見てみたい」という気持ちもありましたね。

音声技術は日常を便利に楽しくする

――ちなみに、大学生のときは、どのような研究をされていたのでしょうか?

大学生のときは、音楽から楽譜を作る自動採譜の研究を、大学院生のときは、声質変換、いわゆるボイスチェンジャーの研究をしていました。男性の声を女性の声にしたり、高い声を低い声にしたり、変換した音声をいかに本物の人間らしく自然にできるか、ということをテーマとしていました。

――音に興味を抱いたきっかけは、何だったのでしょうか?

なぜ、音に興味を持ったのかというと、パソコンで作業をしているときに、パソコンに向かって適当に話しかけることで、別のサブタスクをやってくれるとうれしいなという気持ちがあったんです。それをパソコンにやらせるためには、音声認識が必要になりますよね。話しかけたら返事を返してほしいし、それを実現するには音声合成が必要になる。そんなところから音に興味が湧きました。まだAIスピーカーもなかった時代でしたが、アニメでそういうシーンを観て、「現実にあったらいいな」と思ったことを覚えています。

また、「楽をしたい」という気持ちがあったことも、きっかけのひとつですね。今までは、何かしらアクションを起こすときに、ボタンを押すような物理的な接触がどうしても必要でした。でもそれが、話しかけたり、身振り手振りで伝えられれば、接触をしなくてもアクションを起こせるようになる。つまり、その場にいなくてもよくなるわけです。「タスクを楽してこなす」という意味でも、音の研究は役に立つと思います。退屈で面倒な作業は、なるべく省きたいですしね(笑)。

音声認識の精度が非常に高い「MiiTel」に魅かれる

――では、転職先として、RevCommを選んだ理由を教えてください

とにかく、「音に関する仕事ができる」ことをメインに考えていたので、その段階でずいぶん企業が絞られましたね。音声ファイルを扱っているという企業ではなく、音声を解析している企業を探していました。転職先の候補として考えていたのはRevCommを含めて4社でした。

RevCommのAI搭載型クラウドIP電話「MiiTel(ミーテル)」は、営業電話のサービスなのですが、前職ではtoCのサービス開発であったことと、営業職の方とも近しくなかったので、当初は、その営業電話サービスの世界観にピンと来ていませんでした。ですが、CTOの平村が、サービスの説明をしながら実演してくれたときに、「音声認識の精度がものすごく高いな」と感じたんです。その一瞬で「MiiTel」に魅かれ、「一緒に開発したい!」と思いました。

また、音声についてはもちろんやりたいと思っていたのですが、この先のキャリアを考えたときに、ちょっと不安もあったんです。そこで、「Web開発にも携わることができたらいいな」と思っていたところ、RevCommでは幅広くやらせてもらえるということで、自分のスキルアップにつながりそうだなと感じ、入社の決意が固まりました。

――現在、RevCommではどのような仕事をされているのでしょうか?

「MiiTel」におけるWeb開発、音声認識の改善などを手掛けています。「MiiTel」では音声認識結果を確認するだけでなく、声の高さや抑揚といった値を確認したり、外部サービスとの連携もできます。これらを含めた新規機能の開発を行っています。

また毎日約2万5000件集まる通話データを学習データとして音声認識モデルに反映させるなど、音声認識のさらなる改善を行っています。

――音声を解析することによって、お客様に何を提供できるのでしょうか?

電話の内容はログとして残らないので、言った言わないのやり取りが発生してしまいます。音声データとして残しておくことでこれを解消できますし、音声認識により音声を聞かなくても通話内容を確認できるため、その検索も容易になるメリットがあります。

また通話データや解析結果を共有することで、引き継ぎの際の業務コストも少なくなります。

仕事ぶりがサービスに反映されるという手応え

――実際に入社してみて、どのような魅力を感じていますか?

元々やりたかったことをやらせてもらっているので、転職の満足度としてはとても高いです。実際に音声の解析を手掛ける中で、知らなかったことを新たに身に付けることができていますし、めちゃくちゃ仕事が楽しいですね(笑)。また、今は「MiiTel」に勢いがあるので、何をやっても反応が返ってくるところがとても魅力的です。

そして、音声解析の精度も、私が入社した当時と比べて、格段にレベルが上がっています。今まで、平村たちが作ってきたプロダクトに、この半年間で新たなデータが加わったことで、実際に目に見えて成果が出ています。私も含めて、研究開発に携わっているメンバーの仕事ぶりが、サービスの向上に反映されているという手応えを感じていますね。

また、RevCommのエンジニアは30代がボリュームゾーンで、かつ他社で社会人を経験しているメンバーばかりなので、技術だけでなくビジネス面でもとても勉強になります。困ったことがあれば、誰かが助けてくれる環境なので、とても働きやすいです。

――現在の課題は何でしょうか?

RevCommのエンジニアは、優秀で技術力が高いメンバーばかりなのですが、人手不足かなと感じています。元々、ひとりのエンジニアが2、3ヶ月で開発した「MiiTel」は、現在、新たに加わったエンジニアが肉付けしているという状況です。ユーザー数も伸びていることを考えると、これからの規模感に見合うサービス提供に向けて対応が追いついてない部分はまだまだありますね。早急にアップデートしていくことが課題だなと感じています。

「自由度の高い働き方」「優秀な人材」が魅力

――最後に、候補者の方へメッセージをお願いします

エンジニアにとっては、とても働きやすい環境だと思います。フルリモートで自由度の高い働き方ができますし、やりたいことがあればチャレンジもさせてもらえる、またスキルの高いエンジニアと一緒に働くことで知識を増やすこともできます。

個人的には、音声解析の研究開発にも携わっているので、そういった研究を間近で見ることができるのも魅力かなと思います。今までできなかったことができるようになるというワクワク感も感じられます。

また、私はいきなり入社したタイプですが、業務委託期間を経てから入社する方もいます。もし不安を感じるようでしたら、そういうスタイルをとることもできますので、まずは気軽に相談してみてください。

――RevCommのエンジニアとして働く魅力は何でしょうか?

エンジニアとして成長するためには、得意分野とは別に自分ができる範囲をどれだけ広げられるかということが重要なポイントだと思うんです。その点において、音声解析や通信、電話といったサービスは、どこの企業でもやっていることではない、専門性の高い分野です。RevCommでは、そういった技術にも触れることができますし、幅広く成長できると思います。

リサーチエンジニア

AIによる音声認識技術やコミュニケーションのスコアリング機能などを組み込んだアプリケーションのアルゴリズム実装を行なっています。音声と動画解析、新技術の評価や検証を行い、新たなプロダクトを生み出す研究をしております。

関連インタビュー