ELYZA:自然言語処理を中核とした最先端 AI を社会実装する技術者集団の舞台裏

Google Cloud Japan Team
「未踏の領域で、あたりまえを創る」をミッションに、大規模言語モデルの実用化による社会の問題解決に挑み続ける AI カンパニーの ELYZA(イライザ) 。ELYZA では、膨大な計算リソースを必要とする大規模言語モデルのトレーニングや推論の基盤として Google Cloud の AI インフラストラクチャを活用しています。その ELYZA の技術の原動力となる研究開発チームを率いる平川氏に、その強みと展望や求める人材像、そして Google Cloud の活用について伺いました。
利用しているサービス:Google Compute Engine, Google Kubernetes Engine, Google Cloud Storage
松尾研究室からのスピンアウトと自然言語処理への集中


ELYZA は、東京大学松尾研究室発の AI カンパニーとして創業しました。創業当初は自然言語処理に加えて、リテールテックにも注力していましたが、2020 年からは自然言語処理を事業の中心に据えています。この決断は、設立当初から BERT のような革新的な技術が生まれ、自然言語処理が将来的に大きく成長するとという見込みを立てていたからです。
ELYZA の 研究開発チームを率いる平川氏は、当時を振り返り「当時は、自然言語処理という領域は、世間からはさほど注目されていませんでしたが、我々は Transformer や BERT などの技術を間近で見ていたため、この領域が確実に伸びると確信していました。」と語ります。
プロジェクトを推進する原動力
ELYZA の強みは、単に技術を研究するだけでなく、その技術の社会実装まで見据えて活動している点にあります。 平川氏は、「技術それ自体への強い興味や探究心を持ちながらも、最終的には技術を使える形にして社会に価値を還元していきたいというモチベーションを持つメンバーが多い。」と語ります。 特に、社会実装を担うチームは、顧客の課題を解決するために、徹底的に現場に寄り添います。ヒアリングから得られた情報を元に、技術をどのように適用すれば良いのかを考え抜き、具体的な解決策を提案。ELYZA が社会実装に重きを置くからこそ、単なる研究で終わらせず、社会を変える大きなインパクトを生み出すことができるのです。
技術力と社会実装力を併せ持つ ELYZA の採用戦略
ELYZA のメンバーは、機械学習や自然言語処理を専門とする修士号や博士号を持つ人材が中心です。 平川氏自身も情報系の出身で、学生時代から機械学習に携わっていました。 平川氏は「最近は情報系の人気が高く、学生のレベルも上がっている。」と現状を語ります。 そのため、ELYZA は技術ブログの公開や、国内学会への積極的な参加を通して、その技術力と認知度を高め、優秀な人材を惹きつけようとしています。 「同分野の技術者や研究者の方に響くような、技術的な情報を積極的に開示するように心がけています。また、学会参加を通してアカデミアで研究している方との交流や意見交換も行なっています。最近では、ELYZA のモデルを研究に使っている、といった話を聞くことも多く、技術発信のモチベーションになっています。」と平川氏。
また、ELYZA では「Long Term Greedy」という価値観を大事にしています。この言葉は、長期的な視点での最適化を重視する ELYZA のカルチャーを表しており、その最たる例として「Data Factory チーム」という、 2021 年に発足したデータのアノテーションを行うチームがあります。平川氏は当時のことを振り返り、「当時の社員数よりも多いアノテーターを採用する、というのは大胆な意思決定でしたが、データのアノテーションという重要なプロセスを内製化することで、迅速に高品質なモデル開発を可能にしたことは、現在でも大きな訴求ポイントになっています。」と語ります。
Google Cloud を選ぶ理由
ELYZA は、Google Cloud を重要なパートナーとして活用しています。 平川氏は、Google Cloud を活用する利点として、「計算リソースの豊富さと、LLM 周りの機能拡充のロードマップが明確で開発スケジュールが立てやすい」点を挙げています。また、「アクセス管理などが容易で、セキュアに運用しやすいため、企業の機密情報を扱うようなプロジェクトでも開発環境として利用することができる。」と語ります。
特に研究開発チームが発足した際に Google Cloud を選んだ決め手となったのは、Google Cloud が提供する TPU(Tensor Processing Unit)でした。 平川氏は、「 TPUは、比較的安価でありながら、高速な分散学習をサポートしており、大規模なモデルの開発に最適でした。AI 研究の最先端を走る Google が提供しているというのも、決め手の一つだったと思います。」と語ります。また、「Google Cloud はスタートアップを支援するプログラムも豊富で、資金面に余裕がないスタートアップとしては非常に助かりました。」とコメントします。 Google Cloud の充実したサポート体制も ELYZA にとって大きなメリットとなります。「Google Cloud 上に学習環境を構築する際や不具合が発生した際にも Google Cloud の担当チームをはじめ、その領域に精通したスペシャリストが迅速に対応してくれるため、開発をスムーズに進めることができます。」と平川氏は述べます。
AI 技術の未来を見据えた ELYZA の事業戦略
ELYZA は、今後も自然言語処理を中核とした AI 技術の研究開発と社会実装に注力していきます。 研究開発では、引き続き LLM の汎用能力の向上を目指し、昨今注目されている Reasoning model や Agent といった技術も取り入れているところです。また、より社会実装に近い点として、特定の業界に特化した LLM の開発も進めていくとのことですが、平川氏は「既に主要なグローバル フロンティア モデルは業界特有の高度な知識を有しており、高い精度でタスクを解くことができるため、業界特化の LLM 開発は、慎重に進める必要があります。」と語ります。そこで、 LLM の業界特化を進める上で重要な要素として、ベースモデルの推論能力、データ収集の困難さ、セキュリティを挙げています。昨年の GENIAC (*1 , *2)では、一般に公開されている Common Crawl などのクロールデータが、日本の行政関連データを十分に網羅できていないことに注目し、独自にデータを収集することで行政分野に特化した LLM を開発しました。
今後の事業戦略については、プロダクトを軸に展開していくことを理想としています。 特に注力する分野として、コンタクト センター領域への展開を視野に入れています。「コンタクト センター領域では、電話応対後の対話記録作成の自動化や 、VoC 分析の効率化・高度化など、既にプロフェッショナル サービスでの実績があります。現在はそこから得られた知見を活かしてパッケージ化を進め、SaaS での展開を目指しています。」と平川氏は述べています。
ELYZA は、自然言語処理という最先端の技術を社会実装するために、Google Cloud という強力なパートナーとともに歩んでいます。 彼らの挑戦は、AI の可能性を広げ、社会の変革を加速させる原動力となるでしょう。 これからも、ELYZA は最先端の技術を社会に届け続けることで、未来を切り開いていくでしょう。
(*1) 経済産業省・NEDOが主導する、国内の生成AI開発力強化プロジェクト
https://www.meti.go.jp/policy/mono_info_service/geniac/index.html
(*2) ELYZAのプレスリリース
https://prtimes.jp/main/html/rd/p/000000053.000047565.html


株式会社ELYZA
2018年設立。東京大学松尾研究室発のAIカンパニーとして、自然言語処理分野における最先端技術を開発。特に日本語に特化した高精度な言語モデルを提供し、企業のDX推進や業務効率化を支援。顧客には大手企業や官公庁が名を連ね、幅広い業界でAI導入を促進。ELYZAは、研究開発と社会実装の両輪を駆使し、AIによる「より良い社会」の実現を目指しています。
インタビュイー
株式会社ELYZA 研究開発グループ グループマネージャー 平川 雅人 氏