Ringkasan AI generatif

Dokumen ini menjelaskan fitur-fitur kecerdasan buatan (AI) generatif yang didukung BigQuery ML. Fitur-fitur ini memungkinkan Anda melakukan tugas-tugas AI BigQuery ML menggunakan Vertex AI terlatih model dasar. Tugas yang didukung meliputi:

Anda mengakses model Vertex AI untuk menjalankan salah satu fungsi tersebut dengan membuat model jarak jauh di BigQuery ML yang merepresentasikan Vertex AI, endpoint model. Setelah Anda membuat model jarak jauh melalui model Vertex AI yang ingin digunakan, Anda mengakses dengan menjalankan fungsi BigQuery ML terhadap model jarak jauh.

Pendekatan ini memungkinkan Anda menggunakan kemampuan Vertex AI model untuk menganalisis data BigQuery dengan menggunakan SQL.

Alur kerja

Anda dapat menggunakan model jarak jauh melalui model Vertex AI dan model jarak jauh melalui layanan Cloud AI beserta fungsi BigQuery ML untuk mencapai analisis data yang kompleks dan tugas AI generatif.

Diagram berikut menunjukkan beberapa alur kerja umum yang dapat Anda gunakan kemampuan bersama-sama:

Diagram yang menunjukkan alur kerja umum untuk model jarak jauh yang menggunakan model Vertex AI atau layanan Cloud AI.

AI Generatif

Anda dapat menggunakan model bahasa besar (LLM) untuk melakukan tugas seperti membuat teks perangkuman dokumen. Misalnya, Anda bisa meringkas laporan panjang, atau menganalisis sentimen dalam masukan pelanggan. Anda dapat menggunakan model bahasa Vision (VLM) untuk menganalisis konten visual seperti gambar dan video untuk tugas seperti teks visual dan tanya jawab visual. Anda dapat menggunakan model multimodal untuk melakukan tugas yang sama seperti LLM dan VLM, ditambah tugas tambahan seperti transkripsi audio dan analisis dokumen.

Untuk melakukan tugas AI generatif, Anda dapat membuat referensi ke Vertex AI terlatih model dengan membuat model jarak jauh dan menentukan nama model untuk nilai ENDPOINT. Model Vertex AI berikut didukung:

  • gemini-1.5-flash (Pratinjau)
  • gemini-1.5-pro (Pratinjau)
  • gemini-1.0-pro
  • gemini-1.0-pro-vision (Pratinjau)
  • text-bison
  • text-bison-32k
  • text-unicorn

Model Claude antropik (Pratinjau) juga didukung.

Untuk memberikan masukan atau meminta dukungan untuk model yang dipratinjau, kirim email ke bqml-feedback@google.com.

Saat Anda membuat model jarak jauh yang mereferensikan gemini-1.0-pro-002 atau versi apa pun dari model text-bison, Anda dapat Anda juga dapat memilih untuk mengonfigurasi supervised tuning (Pratinjau) secara bersamaan.

Setelah membuat model, Anda dapat menggunakan Fungsi ML.GENERATE_TEXT untuk berinteraksi dengan model tersebut:

  • Untuk model jarak jauh berdasarkan gemini-1.0-pro, text-bison, text-bison-32k, atau model text-unicorn, Anda dapat menggunakan fungsi ML.GENERATE_TEXT dengan prompt yang Anda berikan dalam kueri atau dari kolom dalam tabel standar.
  • Untuk model jarak jauh berdasarkan model gemini-1.0-pro-vision, Anda dapat menggunakan ML.GENERATE_TEXT untuk menganalisis konten gambar atau video dari tabel objek dengan prompt sediakan sebagai argumen fungsi.
  • Untuk model jarak jauh berdasarkan gemini-1.5-flash atau gemini-1.5-pro Anda dapat menggunakan fungsi ML.GENERATE_TEXT untuk menganalisis teks, gambar, konten audio, video, atau PDF dari tabel objek dengan meminta Anda sediakan sebagai argumen fungsi, atau Anda dapat menghasilkan teks dari prompt berikan dalam kueri atau dari kolom dalam tabel standar.

Anda dapat menggunakan grounding dan atribut keamanan saat Anda menggunakan model Gemini dengan fungsi ML.GENERATE_TEXT, asalkan Anda menggunakan tabel standar untuk input. Grounding memungkinkan Model Gemini menggunakan informasi tambahan dari internet untuk menghasilkan respons yang lebih spesifik dan faktual. Atribut keamanan memungkinkan Model Gemini memfilter respons yang ditampilkannya berdasarkan atribut yang Anda tentukan.

Semua inferensi terjadi di Vertex AI. Hasilnya disimpan di menggunakan BigQuery.

Untuk mempelajari lebih lanjut, coba buat teks dengan fungsi ML.GENERATE_TEXT.

Embedding

Anda dapat menggunakan penyematan untuk mengidentifikasi item yang mirip secara semantik. Sebagai contoh, Anda dapat menggunakan embedding teks untuk mengidentifikasi kemiripan dua bagian teks. Jika potongan-potongan teks tersebut mirip secara semantik, kemudian embedding terletak berdekatan satu sama lain dalam ruang vektor embedding.

Anda dapat menggunakan model BigQuery ML untuk membuat jenis embeddings,

  • Untuk membuat embedding teks, Anda dapat membuat referensi ke salah satu Vertex AI text-embedding atau text-multilingual-embedding model penyematan dengan membuat model jarak jauh dan menentukan nama LLM untuk ENDPOINT dengan sejumlah nilai.
  • Untuk membuat embedding multimodal, yang dapat menyematkan teks, gambar, dan video ke ruang semantik yang sama, Anda bisa membuat referensi ke LLM multimodalembedding dengan membuat model jarak jauh dan menentukan Nama LLM untuk nilai ENDPOINT. Fitur ini ada dalam pratinjau lebih lanjut.
  • Untuk membuat embedding bagi data terstruktur variabel acak independen dan terdistribusi identik (IID) data, Anda dapat menggunakan Analisis komponen utama (PCA) model atau Autoencoder model transformer. Fitur ini berada dalam pratinjau.
  • Untuk membuat embedding bagi data pengguna atau item, Anda dapat menggunakan Faktorisasi matriks model transformer. Fitur ini berada dalam pratinjau.

Setelah membuat model, Anda dapat menggunakan Fungsi ML.GENERATE_EMBEDDING untuk berinteraksi dengannya. Untuk semua jenis model yang didukung, ML.GENERATE_EMBEDDING bekerja dengan data di tabel standar. Untuk multimodal model penyematan, ML.GENERATE_EMBEDDING juga berfungsi dengan konten dalam tabel objek. Untuk remote model, semua inferensi terjadi di Vertex AI. Untuk jenis model lainnya, maka semua inferensi terjadi di BigQuery. Hasilnya disimpan di menggunakan BigQuery.

Untuk mempelajari lebih lanjut, coba buat embedding teks, penyematan gambar dan penyematan video dengan fungsi ML.GENERATE_EMBEDDING.

Untuk penyematan teks yang lebih kecil dan ringan, coba gunakan model TensorFlow yang telah dilatih sebelumnya, seperti NNLM, SWIVEL, atau BERT.

Untuk mengetahui informasi tentang pemilihan model terbaik untuk kasus penggunaan embedding, lihat Memilih model penyematan teks.

Langkah selanjutnya