コンテンツに移動
顧客事例

キャディ: 図面データ活用クラウドで Vertex AI を採用、多様で大量の図面を扱う AI 基盤を実現

2023年12月15日
https://storage.googleapis.com/gweb-cloudblog-publish/images/hero_image_caddi_horizontal.max-2500x2500.jpg
Google Cloud Japan Team

独自の技術を駆使して装置メーカーや製造メーカーの多様な部品調達業務を支援するスタートアップ企業のキャディ株式会社(以下、キャディ)。同社が提供する図面データ活用クラウド「CADDi DRAWER」は、加工部品の図面に記載されたさまざまな情報を Google Cloud の Vertex AI を利用して読み取り、データ化して活用することで製造業の DX を支援します。今回はキャディによる Google Cloud の AI の活用について、AI Team の お 2 人にお話を伺いました。

利用しているサービス:
BigQuery, Vertex AI Endpoint, Cloud Monitoring, Artifact Registry

利用しているソリューション:
Real-Time Analytics & AI

Google Cloud の AI を活用し、大量で多種多様な図面を効率良くデータ化

キャディでは、大手メーカーなどから加工部品の調達・製造を行っています。この事業の核になっているのが、メーカーから提出される加工部品の図面です。同社が提供する部品調達プラットフォーム「CADDi MANUFACTURING」は、加工部品の図面を解析し、品質や納期、価格が最も適合する加工会社を選定して発注を行います。図面データ活用クラウド「CADDi DRAWER」では、図面画像を読み取ってデータ化して管理し、形状や材質、部品面などから検索したり、類似する図面を見つけることができます。

キャディにおける図面データ活用の大きな特徴は、図面データの読み取りや検索に AI を最大限に利用している点です。DRAWER Tech AI Team Engineer である中村 遵介氏は、同社の AI 活用について次のように説明します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/_ITK2816_small.max-1200x1200.jpg

「弊社で提供している CADDi DRAWER は、簡単に図面が検索できるというのが大きなアピール ポイントです。そのためには、図面の画像から、いかに多くの必要な情報を抽出できるかが重要です。しかし、ひと言に図面といっても、そこに記載される情報は多種多様です。重要な情報が手書きで追記されていたり、折り目や汚れなどのノイズが入っていることも少なくありません。そういった記述のブレやノイズを吸収し、必要な情報を適切に抽出して活用につなげるために AI を利用しています。また、類似した図面の検索なども AI で実現しています。」

中村氏によると、当初は AI ではなくルールベースのアルゴリズムを用いて図面画像を解析していたそうです。しかし、ビジネスが拡大して取り扱う図面の量が飛躍的に増えたことから、複雑な図面やノイズのある図面、古い規格で書かれた図面など、さまざまな図面が増え、ルールベースだけでは運用が難しくなったと言います。

「図面というのは、一般的には JIS 規格に基づいて記述されるので、ルールベースでも基本的な解析は問題なくできていました。また、機械学習のように事前に膨大なデータをためなくても解析が可能というメリットもありました。しかし図面が大量になり、内容も多様化した結果、解析に失敗したり、時間がかかるケースも増えてきたため、より安定して大量かつ多様な図面を解析できる仕組みを必要としていました。そこで、データ駆動で解析ができる機械学習ベースの手法を導入することを決断しました。」(中村氏)

キャディでは、創業当初から Google Workspace をはじめとする Google の各種サービスを利用しています。システム インフラでは GKE(Google Kubernetes Engine)や Cloud Run を積極的に活用しており、データ基盤は BigQuery が大部分を占めています。また、セキュリティ関連では Chronicle SIEM の活用が進んでいます。「そのような背景から、AI 基盤も Google Cloud のサービスを導入するのが自然な流れでした」と、DRAWER Tech AI Team Lead Engineer の西原 康貴氏は語ります。

AI の活用にあたっては、AI 基盤として Google Cloud の Vertex AI を採用しました。その理由について、西原氏は次のように説明します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/_ITK2924_small.max-1200x1200.jpg

「我々が扱う図面データは画像サイズが非常に大きく、一般的な画像サイズの 1 万倍という図面もあります。縮小すると小さい点が消えてしまったり、線の太さが区別できなくなるなど、記載された意味が変わってしまうという問題が生じるので、大きいサイズのまま処理を進めています。そのため、AI で解析するには CPU ではなく GPU のパワーが必要でした。Google Cloud では GKE と Vertex AI が GPU をサポートしていますが、インフラの運用管理の手間を考えたときにフルマネージドな Vertex AI が魅力的だと考え、採用を決定しました。」

Vertex AI Endpoint を利用した ML API 基盤により、機械学習モデルの素早い提供を可能に

本格的に AI を活用する段階になり、次にキャディが取り組んだのは機械学習用の API 基盤の構築でした。機械学習モデルの作成までは個人で問題なくできるものの、それを実際にサービスとして導入するには複雑なプロセスが必要でした。そこで、作成したモデルを簡単に API としてデプロイできる仕組みとして、ML API 基盤に着手したと中村氏は言います。

ML API 基盤の中心となる API サーバーには Vertex AI Endpoint を採用しました。その理由について、中村氏は次のように説明します。

「当時はチームメンバーが 3 人しかいなかったので、管理コストを最小限にするために、フルマネージドのサービスを使いたかったというのが Vertex AI Endpoint を採用した 1 番の理由です。 Vertex AI Endpoint であれば、仕様に沿った機械学習モデルをデプロイすればすぐにサービスに適用することができ、監視やスケールといった運用面の心配も取り払うことができます。その分の時間を、デプロイの方法やキャパシティ テスト、使い勝手の改善などといった別の問題の解決に集中できるというのは大きな魅力でした。結果的に、エンジニア 3 人とマネージャー 1 人という少人数体制で、約 3 か月で ML API 基盤を開発することができました。」

キャディの ML API 基盤には、API サーバーに加えて、作成した API をデプロイするためのデプロイツールや、API の仕様を社内で共有するためのドキュメント ツール、API の品質を確認するためのテストツール、そして API の状態を監視するためのモニタリング ツールなどを備えています。特にデプロイに関しては、できる限り作業のフローが簡単になるように設計されていると西原氏は語ります。

「作業の認知負荷を下げ、再現性を高めるためにデプロイフローは極力シンプルに、ボタン 1 つで実施できるようにしてあります。テストについても GitHub Actions を利用して自動で行います。API を更新した際には、自動テストによって精度が落ちていないかなどを検証し、チーム全員が結果を確認できます。ドキュメントによる情報の共有に力を入れている点も大きな特徴で、API の追加や更新をする際に、Open API 仕様に準拠したスキーマを定義して自動で共有できる仕組みになっています。」

ML API 基盤を整備したことによって、キャディの AI システムでは、API のデプロイにかかる時間が大幅に短縮されました。

「ML API 基盤を使うようになってからは、早ければ ML エンジニアがコードを書き終えたその日に API をリリースすることもできるようになりました。テストやドキュメント作成もデプロイとセットになっているので、品質にブレが発生せず、ドキュメントの正確さも保証できます。それに加えて、メンバーが増えた際にもインフラについて意識する必要がないので、オンボーディングが簡単になります。それぞれのメンバーの認知負荷を下げるという意味でも、Vertex AI の導入は効果的でした。」(中村氏)

西原氏は、運用負荷が最小限で済んでいるという点でも、フルマネージド サービスの Vertex AI Endpoint を採用した効果が出ていると語ります。

「Vertex AI Endpoint のおかげで、ML API 基盤に関してはほとんど運用コストがかかっていません。Virtual Private Cloud(VPC) や サブネット、ファイアウォールなどのネットワークの設定や、スケーリング、メトリクスのロギングなど、運用に必要なほとんどの作業をサービス側に任せることができています。バージョン管理は Vertex AI Model Registry で行っており、更新した API に問題が生じた場合でも、 1 つ前のバージョンに差し戻したり、トラフィックを分割して比較するといったことが簡単にできます。API の状態は Cloud Monitoring で監視できるので、予測レイテンシが増大するなどの問題が発生した場合でもすぐに検知できます。」

https://storage.googleapis.com/gweb-cloudblog-publish/images/CADDi_akitekuchiyaTu_small.max-1200x1200.png

機械学習モデルの精度を継続的に改善するための仕組み作りにも挑戦

キャディでは、主に機械学習エンジニアが AI サービスの核となる機械学習モデルの作成や更新を担当しています。具体的なプロセスとしては、まずプロダクト マネージャーが要求仕様書を作成し、それを元に機械学習エンジニアが Design Doc を作成します。そして、何度かのレビューを経てアノテーション チームがアノテーション定義書を作成し、実際にアノテーションを開始してデータを収集します。

必要な量のデータが準備できたら、機械学習エンジニアが学習や評価、デプロイ、負荷テストなどを実施します。その結果のレポートをプロダクト マネージャーと共有し、定性と定量の両方で精度目標に到達しているかどうかを評価して最終的なリリース判断を行います。

「性能評価については、エンジニアでなくても適正な評価ができるように、 作成した機械学習モデルを Web UI 上で試して結果を見られる仕組みを用意しています。ビジネス パーソンが実際にモデルを動かして結果を確認できるので、その良し悪しを自分自身で把握して判断できるというメリットがあります。」(西原氏)

現在は、この機械学習の開発プロセスをさらに改善するために、機械学習パイプラインやストリーム処理基盤の開発にも挑戦していると西原氏は説明します。

「現状は必要な量のアノテーション データが集まったら、エンジニアが手動でそのデータを取り込んで機械学習モデルを更新しています。この部分を改善して、Vertex AI Piplines を利用することで、ある程度のデータがたまったら人の手を介さずに自動でモデルを更新できるようにと考えています。また、今の Web API はアクセスのスパイクが生じると少し不安定になることがあります。そこで、リアルタイム性を求められないタスクに関しては非同期なストリーム処理にすることで安定性を向上させられると考えています。これには Google Cloud Dataflow の活用も考えています。」

中村氏は、今後のビジネスの成長に合わせて、引き続き Google Cloud を積極的に活用していきたいと語ります。

「近い将来、CADDi DRAWER はさらに成長し、お客さまから預かる図面の数も桁が 1 つか 2 つ大きくなる見込みです。このデータ量の増加に対して適切にスケールさせながら、よりコスト効率の良い仕組みを構築するのが今後の課題です。その他に、機械学習系のサービスの動向には常に注目していて、特に機械学習でデータを加工するための Dataflow や Batch Prediction、BigQuery ML などは気になっています。現実のシステムでは、データをそのまま機械学習モデルに入れて完了となるケースは少なく、前処理や後処理、保存、ストリーム処理やバッチ処理、追跡など、さまざまなことを気にかける必要があります。そのような中でこれらのサービスをどう活用するのか、適切に判断していきたいと考えています。」


https://storage.googleapis.com/gweb-cloudblog-publish/images/small_ITK2986.max-1400x1400.jpg

キャディ株式会社
2017 年 11 月設立。製造業のバリュー チェーンが抱える構造的な課題に対し、「モノづくり産業のポテンシャルを解放する」を企業理念に掲げ、最新の技術を駆使して、産業の常識を変える「新たな仕組み」を作り出すことに挑戦しています。主なサービスとしては、設計図面を読み取って解析し、構造化されたデータとして蓄積・活用する図面データ活用クラウド「CADDi DRAWER」や、板金・切削・製缶・樹脂類の加工品の調達・製作をワンストップで請け負う「CADDi MANUFACTURING」などがあります。

インタビュイー(写真右から)
・DRAWER Tech AI Team Lead Engineer 西原 康貴 氏
・DRAWER Tech AI Team Engineer 中村 遵介 氏


その他の導入事例はこちらをご覧ください。

投稿先