Mulai menggunakan penelusuran media
Anda dapat dengan cepat membuat aplikasi penelusuran media canggih. Penelusuran media memungkinkan audiens Anda menemukan konten, dengan hasil berkualitas Google.
Untuk informasi umum tentang Vertex AI Search untuk media, lihat Pengantar penelusuran dan rekomendasi media.Dalam tutorial memulai ini, Anda akan menggunakan set data Movielens untuk menunjukkan cara mengupload katalog konten media ke Vertex AI Search. Set data Movielens berisi katalog film (dokumen).
Setelah mengupload data film, Anda akan membuat aplikasi penelusuran dan mengujinya melalui halaman pratinjau.
Jika Anda telah menyelesaikan tutorial Memulai rekomendasi media dan masih memiliki penyimpanan data (nama yang disarankan quickstart-media-data-store
), Anda dapat menggunakan penyimpanan data tersebut, bukan
membuat penyimpanan data lain. Dalam hal ini, Anda harus memulai tutorial di
Membuat aplikasi untuk penelusuran media.
Estimasi waktu untuk menyelesaikan tutorial ini: ~1 jam.
Tujuan
- Pelajari cara mengimpor dokumen media untuk membuat penyimpanan data media.
- Membuat, mengonfigurasi, dan menguji aplikasi penelusuran.
Sebelum mengikuti tutorial ini, pastikan Anda telah melakukan langkah-langkah di Sebelum memulai.
Jika ingin mengikuti panduan langkah demi langkah untuk tugas ini langsung di Konsol Google Cloud, klik Pandu saya:
Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI Agent Builder, Cloud Storage, BigQuery APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI Agent Builder, Cloud Storage, BigQuery APIs.
Menyiapkan set data
Catatan: Jika Anda telah menyelesaikan tutorial Memulai rekomendasi media dan masih memiliki penyimpanan data (nama yang disarankanquickstart-media-data-store
), lanjutkan ke Membuat aplikasi untuk penelusuran media.
Anda menggunakan Cloud Shell untuk mengimpor set data Movielens dan menyusun ulang set data untuk Vertex AI Search untuk media.
Buka Cloud Shell
- Buka konsol Google Cloud.
- Pilih project Google Cloud Anda.
- Catat project ID di kartu Project info di halaman dasbor. Anda memerlukan project ID untuk prosedur berikut.
Klik tombol Activate Cloud Shell di bagian atas konsol. Sesi Cloud Shell akan terbuka di dalam frame baru di bagian bawah Konsol Google Cloud dan menampilkan perintah command line.
Mengimpor set data
Set data Movielens tersedia di bucket Cloud Storage publik untuk mempermudah impor.
Jalankan perintah berikut menggunakan project ID Anda untuk menetapkan project default untuk command line.
gcloud config set project PROJECT_ID
Buat set data BigQuery:
bq mk movielens
Muat
movies.csv
ke tabel BigQuerymovies
baru:bq load --skip_leading_rows=1 movielens.movies \ gs://cloud-samples-data/gen-app-builder/media-recommendations/movies.csv \ movieId:integer,title,genres
Muat
ratings.csv
ke tabel BigQueryratings
baru:bq load --skip_leading_rows=1 movielens.ratings \ gs://cloud-samples-data/gen-app-builder/media-recommendations/ratings.csv \ userId:integer,movieId:integer,rating:float,time:timestamp
Membuat tampilan BigQuery
Pada langkah ini, Anda akan menyusun ulang set data Movielens agar mengikuti format yang diharapkan untuk penyimpanan data media.
Untuk panduan ini, Anda akan membuat peristiwa pengguna view-item
palsu selama 90 hari terakhir dari rating positif (< 4
).
Buat tampilan yang mengonversi tabel film menjadi skema
Document
:bq mk --project_id=PROJECT_ID \ --use_legacy_sql=false \ --view ' WITH t AS ( SELECT CAST(movieId AS string) AS id, SUBSTR(title, 0, 128) AS title, SPLIT(genres, "|") AS categories FROM `PROJECT_ID.movielens.movies`) SELECT id, "default_schema" as schemaId, null as parentDocumentId, TO_JSON_STRING(STRUCT(title as title, categories as categories, CONCAT("http://mytestdomain.movie/content/", id) as uri, "2023-01-01T00:00:00Z" as available_time, "2033-01-01T00:00:00Z" as expire_time, "movie" as media_type)) as jsonData FROM t;' \ movielens.movies_view
Sekarang tampilan baru memiliki skema yang diharapkan oleh Vertex AI Agent Builder API.
Buka halaman BigQuery di konsol Google Cloud.
Di panel Penjelajah, luaskan nama project Anda, luaskan set data
movielens
, lalu klikmovies_view
untuk membuka halaman kueri untuk tampilan ini.Buka tab Penjelajah tabel.
Di panel Kueri yang dihasilkan, klik tombol Salin ke kueri. Editor kueri akan terbuka.
Klik Jalankan untuk melihat data film dalam tampilan yang Anda buat.
Buat fictive peristiwa pengguna dari rating film dengan menjalankan perintah Cloud Shell berikut:
bq mk --project_id=PROJECT_ID \ --use_legacy_sql=false \ --view ' WITH t AS ( SELECT MIN(UNIX_SECONDS(time)) AS old_start, MAX(UNIX_SECONDS(time)) AS old_end, UNIX_SECONDS(TIMESTAMP_SUB( CURRENT_TIMESTAMP(), INTERVAL 90 DAY)) AS new_start, UNIX_SECONDS(CURRENT_TIMESTAMP()) AS new_end FROM `PROJECT_ID.movielens.ratings`) SELECT CAST(userId AS STRING) AS userPseudoId, "view-item" AS eventType, FORMAT_TIMESTAMP("%Y-%m-%dT%X%Ez", TIMESTAMP_SECONDS(CAST( (t.new_start + (UNIX_SECONDS(time) - t.old_start) * (t.new_end - t.new_start) / (t.old_end - t.old_start)) AS int64))) AS eventTime, [STRUCT(movieId AS id, null AS name)] AS documents, FROM `PROJECT_ID.movielens.ratings`, t WHERE rating >= 4;' \ movielens.user_events
Mengaktifkan Vertex AI Agent Builder
Di konsol Google Cloud, buka halaman Agent Builder.
Baca dan setujui Persyaratan Layanan, lalu klik Lanjutkan dan aktifkan API.
Membuat aplikasi untuk penelusuran media
Prosedur di bagian ini memandu Anda membuat dan men-deploy aplikasi penelusuran media.
Di konsol Google Cloud, buka halaman Agent Builder.
Klik
Create app .Di halaman Create App, klik Create di bagian Media catalog search.
Di kolom Nama aplikasi Anda, masukkan nama untuk aplikasi Anda seperti
quickstart-media-search
. ID aplikasi Anda akan muncul di bagian nama mesin.Klik Lanjutkan.
Jika Anda telah menyelesaikan tutorial Memulai rekomendasi media dan masih memiliki penyimpanan data (nama yang disarankan
quickstart-media-data-store
), pilih penyimpanan data tersebut, klik Buat, lalu lanjutkan ke Pratinjau penelusuran.Jika Anda tidak memiliki penyimpanan data yang berisi set data movielens, buat penyimpanan data baru dan pilih:
Di halaman Data Store, klik Create data store.
Masukkan nama tampilan untuk penyimpanan data Anda, seperti
quickstart-media-data-store
, lalu klik Create.Pilih penyimpanan data yang baru saja Anda buat, lalu klik Create untuk membuat aplikasi. Anda akan dialihkan ke halaman Select a data source.
Mengimpor data
Selanjutnya, impor data film dan peristiwa pengguna yang diformat sebelumnya.
Mengimpor dokumen
Jika Anda tidak otomatis dialihkan ke halaman Pilih sumber data:
- Buka tab Documents.
- Klik Impor Data.
Di halaman Select a data source, pilih BigQuery.
Masukkan nama tampilan BigQuery
movies
yang Anda buat, lalu klik Import.PROJECT_ID.movielens.movies_view
Tunggu hingga semua dokumen diimpor, yang akan memerlukan waktu sekitar 15 menit. Setelah selesai, akan ada 86.537 dokumen.
Anda dapat memeriksa tab Aktivitas untuk mengetahui status operasi impor. Setelah impor selesai, status operasi impor akan berubah menjadi Selesai.
Mengimpor peristiwa pengguna
Buka tab Peristiwa.
Klik Impor Peristiwa.
Pilih BigQuery.
Masukkan nama tampilan BigQuery
user_events
yang Anda buat, lalu klik Import.PROJECT_ID.movielens.user_events
Anda dapat melanjutkan ke langkah berikutnya sebelum peristiwa diimpor, tetapi hasil penelusuran belum akan berisi set data lengkap.
Anda dapat memeriksa tab Aktivitas untuk mengetahui status operasi. Proses ini memerlukan waktu sekitar satu jam untuk diselesaikan karena Anda mengimpor jutaan baris.
Melihat pratinjau dan mengonfigurasi penelusuran
Di menu navigasi, klik
Konfigurasi .Di kotak Telusuri di sini, ketik nama film, seperti "The Lord of the Rings".
Perhatikan bahwa hasil penelusuran relevan dengan judul film yang dimasukkan.
Di halaman ini, Anda dapat menyesuaikan cara widget penelusuran menampilkan informasi hasil penelusuran. Lihat Mengonfigurasi hasil untuk widget penelusuran untuk mempelajari lebih lanjut.
Untuk aplikasi penelusuran media, Anda dapat:
- Mengonfigurasi kolom untuk penelusuran
- Mengonfigurasi pelengkapan otomatis
- Mengonfigurasi hasil penelusuran
Setelah melakukan perubahan, klik Simpan dan publikasikan untuk memperbarui widget.
Men-deploy widget penelusuran
Di menu navigasi, klik Integration.
Pastikan tab Widget dipilih.
Pilih Berbasis JWT atau OAuth sebagai jenis otorisasi widget.
Di kolom Domain, masukkan nama domain untuk halaman web tempat Anda akan menempatkan widget. Misalnya, jika Anda akan menyalin widget ke halaman web
example.com/ai.html
, masukkanexample.com
sebagai domain.Klik Tambahkan, lalu klik Simpan.
Salin cuplikan kode yang disediakan di bagian Salin kode berikut ke aplikasi web Anda.
Di codebase Anda, buat token otorisasi.
Untuk meneruskan token otorisasi ke widget, gunakan cuplikan kode "Setasikan token otorisasi" yang disediakan di bagian Salin kode berikut ke aplikasi web Anda dan ganti teks
<JWT or OAuth token provided by you backend>
dengan token otorisasi Anda.Untuk mendapatkan bantuan dalam mengintegrasikan aplikasi penelusuran ke aplikasi web Anda, lihat contoh kode di Mendapatkan hasil penelusuran.
Pembersihan
Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang digunakan pada halaman ini, ikuti langkah-langkah berikut.
Anda dapat menggunakan kembali penyimpanan data yang dibuat untuk rekomendasi media dalam tutorial Mulai menggunakan rekomendasi media. Coba tutorial tersebut sebelum melakukan prosedur pembersihan ini.
- Untuk menghindari tagihan Google Cloud yang tidak perlu, gunakan Konsol Google Cloud untuk menghapus project jika Anda tidak memerlukannya.
- Jika Anda membuat project baru untuk mempelajari Vertex AI Agent Builder dan Anda tidak lagi memerlukan project tersebut, hapus project tersebut.
- Jika Anda menggunakan project Google Cloud yang sudah ada, hapus resource yang dibuat untuk menghindari tagihan pada akun Anda. Untuk mengetahui informasi selengkapnya, lihat Menghapus aplikasi, Menghapus data dari penyimpanan data, dan Menghapus penyimpanan data.
- Ikuti langkah-langkah di Menonaktifkan Vertex AI Agent Builder.
Jika Anda membuat set data BigQuery, hapus di Cloud Shell:
bq rm --recursive --dataset movielens