AI アプリケーションの概要
このドキュメントでは、BigQuery ML がサポートする AI アプリケーション機能について説明します。これらの機能を使用すると、大規模言語モデル(LLM)と Cloud AI API を使用して BigQuery ML で AI タスクを実行できます。サポートされているタスクは次のとおりです。
LLM または Cloud AI API にアクセスして、BigQuery ML で大規模言語モデル(LLM)または API を表すリモートモデルを作成し、これらの関数のいずれかを実行します。使用する AI リソースでリモートモデルの作成後、リモートモデルに対して BigQuery ML 関数を実行することで、そのリソースの機能にアクセスします。
このアプローチでは、基盤となる AI リソースの機能に習熟していなくてもアクセスできます。API の場合は、Python を知る必要性もありません。
生成 AI
生成自然言語を使用して、テキスト要約やテキスト生成などのタスクを実行できます。たとえば、長いレポートの要約やメールの最初の下書きの生成が可能です。
生成自然言語のタスクを実行するには、リモートモデルを作成して ENDPOINT
値の LLM 名を指定することで、いずれかの Vertex AI text-bison*
自然言語の基盤モデルへの参照を作成できます。その後、ML.GENERATE_TEXT
関数を使用して、そのモデルを操作できます。ML.GENERATE_TEXT
は、標準テーブルのデータを処理します。推論はすべて Vertex AI で行われます。結果は BigQuery に保存されます。
詳細については、ML.GENERATE_TEXT
関数を使用してテキストを生成してみてください。
自然言語処理
自然言語処理を使用して、データの分類や感情分析などのタスクを実行できます。たとえば、商品のフィードバックを分析して、特定の商品が顧客に好評かどうかを判断できます。
自然言語タスクを実行するには、リモートモデルを作成し、REMOTE_SERVICE_TYPE
の値に CLOUD_AI_NATURAL_LANGUAGE_V1
を指定することで、Cloud Natural Language API への参照を作成できます。その後、ML.UNDERSTAND_TEXT
関数を使用してそのサービスを操作できます。ML.UNDERSTAND_TEXT
は、標準テーブルのデータを処理します。推論はすべて Vertex AI で行われます。結果は BigQuery に保存されます。
詳細については、ML.UNDERSTAND_TEXT
関数でテキストを理解するをご覧ください。
機械翻訳
機械翻訳を使用して、テキストデータを他の言語に翻訳できます。たとえば、顧客からのフィードバックをよく知らない言語から馴染みのある言語に翻訳します。
機械翻訳タスクを実行するには、リモートモデルを作成し、REMOTE_SERVICE_TYPE
の値に CLOUD_AI_TRANSLATE_V3
を指定することで、Cloud Translation API への参照を作成できます。その後、ML.TRANSLATE
関数を使用してそのサービスを操作できます。ML.TRANSLATE
は、標準テーブルのデータを処理します。推論はすべて Vertex AI で行われます。結果は BigQuery に保存されます。
詳細については、ML.TRANSLATE
関数を使用したテキストの翻訳をご覧ください。
テキスト エンベディング
テキスト エンベディングを使用すると、2 つのテキストの類似度を特定できます。テキストが意味的に類似している場合、それぞれのエンベディングはエンベディング ベクトル空間内で互いに近接しています。テキスト エンベディングを使用すると、検索テキストがセマンティック類似度に基づいてランク付けされる、セマンティック検索などのタスクを実行できます。
テキスト エンベディングを作成するには、リモートモデルを作成して ENDPOINT
値の LLM 名を指定して、いずれかの Vertex AI textembedding-gecko*
テキスト エンベディングの基盤モデルへの参照を作成できます。その後、ML.GENERATE_TEXT_EMBEDDING
関数を使用して、そのモデルを操作できます。ML.GENERATE_TEXT_EMBEDDING
は、標準テーブルのデータを処理します。推論はすべて Vertex AI で行われます。結果は BigQuery に保存されます。
詳細については、ML.GENERATE_TEXT_EMBEDDING
関数を使用してテキストを埋め込むをご覧ください。
よりサイズが小さく軽量のテキスト埋め込みには、NNLM、SWIVEL、BERT などの事前トレーニング済み TensorFlow モデルを使用してみてください。
音声文字起こし
音声文字起こしを使用して、音声ファイルを書き起こしテキストに変換できます。たとえば、ボイスメールの録音をテキスト メッセージに変換します。
音声文字起こしタスクを実行するには、リモートモデルを作成し、REMOTE_SERVICE_TYPE
の値に CLOUD_AI_SPEECH_TO_TEXT_V2
を指定することで、Speech-to-Text API への参照を作成できます。必要に応じて、使用する認識ツールを指定して、音声コンテンツを処理できます。その後、ML.TRANSCRIBE
関数を使用して、音声ファイルを文字変換できます。ML.TRANSCRIBE
は、オブジェクト テーブル内の音声ファイルに対して機能します。推論はすべて Vertex AI で行われます。結果は BigQuery に保存されます。
詳細については、ML.TRANSCRIBE
関数を使用した音声ファイルの文字変換をご覧ください。
ドキュメント処理
ドキュメント処理を使用すると、非構造化ドキュメントから分析情報を抽出できます。たとえば、請求書ファイルから関連情報を抽出し、会計ソフトウェアに入力できるようにします。
ドキュメント処理タスクを実行するには、リモートモデルを作成し、REMOTE_SERVICE_TYPE
の値に CLOUD_AI_DOCUMENT_V1
を指定して、ドキュメント コンテンツを処理するために使用するプロセッサを指定することで、Document AI API への参照を作成します。その後、ML.PROCESS_DOCUMENT
関数を使用してドキュメントを処理できます。ML.PROCESS_DOCUMENT
は、オブジェクト テーブルのドキュメントに対して機能します。推論はすべて Vertex AI で行われます。結果は BigQuery に保存されます。
詳細については、ML.PROCESS_DOCUMENT
関数でのドキュメントの処理をお試しください。
コンピュータ ビジョン
コンピュータ ビジョンを使用して画像解析タスクを実行できます。たとえば、画像を分析して、顔が含まれているかどうかを検出できます。また、画像内のオブジェクトを説明するラベルを生成できます。
コンピュータ ビジョン タスクを実行するには、リモートモデルを作成し、REMOTE_SERVICE_TYPE
の値に CLOUD_AI_VISION_V1
を指定することで、Cloud Vision API への参照を作成できます。その後、ML.ANNOTATE_IMAGE
関数を使用し、そのサービスを使用することで画像にアノテーションを付けることができます。ML.ANNOTATE_IMAGE
は、オブジェクト テーブルのデータに対応しています。推論はすべて Vertex AI で行われます。結果は BigQuery に保存されます。
詳細については、ML.ANNOTATE_IMAGE
関数を使用してオブジェクト テーブル画像にアノテーションを付けるをご覧ください。
次のステップ
- ML モデルに対する推論の実行について詳しくは、モデル推論の概要をご覧ください。