Translation API Advanced のビジネス ドキュメント翻訳が 100 以上の言語に対応
Google Cloud Japan Team
※この投稿は米国時間 2021 年 5 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。
ドキュメント、ソフトウェア、トレーニング資料、ウェブサイトを複数の言語でリリースする場合、多くのデベロッパーやローカリゼーション プロバイダにとって欠かせないのが翻訳です。企業は多数の言語と形式でコンテンツを取得して共有していますが、ドキュメント形式が複数あったり、OCR と統合する必要があったり、業界用語に合わせて訳文を修正する必要があったりするため、このニーズに合わせて翻訳の処理量を増やすのは難しい課題です。現在では、Google Cloud が誇る翻訳プロダクトを使用すれば、デベロッパーは機械学習を活用してこれまで以上に迅速かつ効率的に翻訳することができます。
このたび、Google Cloud の翻訳サービスの新機能として、Translation API Advanced 向けの Document Translation(現在プレビュー版)を発表いたします。この機能を使用すれば、お客様はドキュメントの形式を維持しながら、100 以上の言語、そして DOCX、PPTX、XLSX、PDF などの形式でドキュメントを直接翻訳することができます。
Welocalize もこの機能をフル活用している企業の 1 つです。同社は Translation API Advanced を利用し、マルチメディア、e ラーニング、ローカリゼーションなど、多岐にわたる企業顧客の案件で機械翻訳を使い、1 年間に何億単語もの翻訳を行っています。
「Google Cloud の Translation API を使えば、顧客の持ち込んでくる疎データに対して幅広い用語を適用でき、顧客のドキュメントを高精度で翻訳できます。Translation API の事前トレーニング済みモデルのおかげで、リアルタイムのオンデマンド翻訳を提供できるようになり、タイムラグを短縮できました。ユーザーはわずか数秒で、自分の言語でコンテンツを取得できます。」- Welocalize ランゲージ サービス担当バイス プレジデント Olga Beregovaya 氏
リアルタイムのオンライン翻訳を数秒で実現
従来型の企業はバッチ処理式の翻訳を使用して翻訳ニーズを満たしているかもしれませんが、もっと高速で価値を実現する必要がある企業もあります。Translation API Advanced のドキュメント機能の大きな差別化要因として、単一ファイルに対してリアルタイム(同期処理)のオンライン翻訳を実行する機能が挙げられます。たとえば、人事(HR)関連文書などのビジネス ドキュメントを翻訳する場合、オンライン翻訳により、比較的小さなファイルを素早く翻訳したいお客様にも柔軟に対応できるようになっています。REST または gRPC を通じてモバイルやブラウザ アプリケーションと API を簡単に統合でき、100 以上の言語ペアにすばやくアクセスできるため、サポートされている任意の言語にコンテンツを翻訳できます。次の図は、Translation API Advanced を使用してドキュメントを翻訳するワークフローを示しています。
AutoML Translation でカスタム翻訳モデルを構築する
Google が管理するモデルの代わりに、独自の AutoML 翻訳モデルを使用してドキュメントを翻訳することもできます。新機能の Document Translation では、SOTA 翻訳モデルを使用してビジネス ドキュメントをすばやく簡単に翻訳できます。また、Translation API Advanced 機能を組み合わせて、AutoML でトレーニングした用語集やモデルを使ってカスタム翻訳を簡単に管理できます。Translation API の用語集機能によって、翻訳されたコンテンツ内でブランド名を統一できます。ソース言語とターゲット言語で名前と語彙を定義してから、用語集ファイルを翻訳プロジェクトに保存します。各単語やフレーズは翻訳リクエストの結果に自動的に挿入されます。
Google の包括的な翻訳ポートフォリオには、チャット アプリケーション、ソーシャル メディア、ゲームなどの一般的なユースケースで事前トレーニング済みモデルを使用する方にあわせて、翻訳 API(Basic と Advanced)が用意されています。また、AutoML Translation を使用すると、コードを 1 行も書かずに、本番環境に対応した高品質なカスタム翻訳モデルを構築できます。
上に挙げたのは、Google が推進し続けている、非構造化ソースから構造化データを抽出するための AI を活用したイノベーションのうち、最新の例にすぎません。Document AI では、データの抽出と分類を通じて、このテクノロジーを世界で最もニーズの大きなドキュメント ベースのワークフローに応用しました。これに加えてこのたび、Translation API Advanced のドキュメント サポートにより、ビジネス ドキュメントを大量に翻訳できるドキュメント処理ソリューションを提供できるようになりました。
その他の Cloud Translation リソース
Cloud Translation サービスの詳細については、Google Cloud のウェブサイトをご覧ください。この機能の使用方法に関する技術レビューについては、こちらのドキュメントをご確認ください。
- Cloud Translation プロダクト マネージャー Sarah Weldon
- Cloud AI プロダクト マーケティング Yang Liang