Tentang aplikasi dan penyimpanan data

Halaman ini menjelaskan aplikasi dan penyimpanan data Gemini Enterprise.

Dengan Gemini Enterprise, Anda membuat aplikasi dan menghubungkannya ke penyimpanan data. Project tertentu dapat berisi beberapa aplikasi. Google Cloud

Istilah utama:

  • Aplikasi: Aplikasi Gemini Enterprise menyediakan hasil penelusuran, tindakan, dan agen kepada pengguna akhir Anda. Istilah aplikasi dapat digunakan secara bergantian dengan istilah mesin dalam konteks API.

  • Penyimpanan data: Penyimpanan data adalah entitas yang berisi data yang diserap dari sumber data pihak pertama seperti Cloud Storage atau aplikasi pihak ketiga seperti Jira atau Salesforce. Penyimpanan data yang berisi data dari aplikasi pihak ketiga juga disebut konektor data.

Hubungan antara aplikasi dan penyimpanan data

Aplikasi harus terhubung ke penyimpanan data agar dapat menggunakan data dari penyimpanan tersebut untuk menayangkan hasil penelusuran, jawaban, atau tindakan.

Aplikasi memiliki hubungan many-to-many dengan penyimpanan data. Jika beberapa penyimpanan data terhubung ke satu aplikasi, hal ini disebut sebagai penelusuran gabungan. Untuk mengetahui informasi tentang batasan menghubungkan aplikasi penelusuran ke lebih dari satu penyimpanan data, lihat Tentang penelusuran gabungan.

Metode pembuatan aplikasi dan penyerapan data

Cara membuat aplikasi dan menyerap data bergantung pada jenis data yang Anda miliki:

  • Untuk data pihak ketiga, Anda menggunakan konsol, bukan API, untuk membuat aplikasi dan memasukkan data. Google Cloud

  • Untuk data lainnya, Anda dapat menggunakan Google Cloud konsol atau API.

Dokumen

Setiap penyimpanan data memiliki satu atau beberapa kumpulan data, yang disebut dokumen. Hal yang diwakilkan oleh dokumen bervariasi sesuai jenis data dalam penyimpanan data tersebut:

  • Data untuk sumber data pihak ketiga. Dokumen merupakan entity yang spesifik terhadap sumber data pihak ketiga, seperti masalah Jira atau ruang Confluence.

  • Data terstruktur. Dokumen adalah baris dalam tabel atau kumpulan data JSON yang mengikuti skema tertentu. Anda dapat memberikan skema ini sendiri atau membiarkan Gemini Enterprise menentukan skema dari data yang diserap.

  • Data tidak terstruktur. Dokumen adalah file dalam format HTML, PDF dengan teks tersemat, atau TXT. Format PPTX dan DOCX tersedia dalam Pratinjau.

Penyimpanan data dan aplikasi

Di Gemini Enterprise, ada berbagai jenis penyimpanan data. Penyimpanan data hanya dapat berisi satu jenis data.

Data terstruktur untuk penyimpanan data pihak ketiga

Konektor sumber data pihak ketiga berikut tersedia dalam Pratinjau dengan daftar yang diizinkan:

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

Data dari pihak ketiga ini dianggap sebagai data terstruktur.

Saat menyiapkan konektor baru, Anda memilih frekuensi sinkronisasi. Anda juga dapat memilih entitas mana yang akan disinkronkan. Entitas bervariasi bergantung pada sumbernya, seperti masalah untuk Jira dan konten serta ruang untuk Confluence. Penyimpanan data unik dibuat untuk setiap entitas. Penyimpanan data entitas dikelompokkan berdasarkan instance konektor.

Langkah berikutnya

Data terstruktur

Penyimpanan data dengan data terstruktur memungkinkan penelusuran semantik atau rekomendasi dari data terstruktur. Anda dapat mengimpor data dari BigQuery atau Cloud Storage. Anda juga dapat mengupload data JSON terstruktur secara manual melalui API.

Misalnya, Anda dapat mengaktifkan penelusuran atau rekomendasi terhadap katalog produk untuk pengalaman e-commerce Anda atau direktori dokter untuk penelusuran atau rekomendasi penyedia layanan.

Gemini Enterprise otomatis mendeteksi skema dari data yang Anda impor. Secara opsional, Anda dapat memberikan skema untuk data Anda. Menyediakan skema untuk data Anda biasanya meningkatkan kualitas hasil.

Langkah berikutnya

Data tidak terstruktur

Penyimpanan data tidak terstruktur memungkinkan penelusuran atau rekomendasi semantik atas data seperti dokumen dan gambar.

Penyimpanan data tidak terstruktur mendukung dokumen dalam format HTML, PDF dengan teks tersemat, dan TXT. Format PPTX dan DOCX tersedia dalam Pratinjau.

Penelusuran memberikan hasil berupa 10 URL dan ringkasan jawaban untuk kueri bahasa alami. Dokumen harus diupload ke bucket Cloud Storage dengan izin akses yang sesuai. Misalnya, lembaga keuangan dapat mengaktifkan penelusuran atau rekomendasi atas korpus pribadi publikasi penelitian keuangan mereka, atau perusahaan bioteknologi dapat mengaktifkan penelusuran atau rekomendasi atas repositori pribadi penelitian medis mereka.

Langkah berikutnya

Tentang penelusuran gabungan

Dengan penelusuran gabungan, beberapa penyimpanan data dapat dihubungkan ke satu aplikasi. Hal ini memungkinkan aplikasi menelusuri beberapa sumber dan jenis data.

Untuk membuat aplikasi penelusuran gabungan, pilih beberapa penyimpanan data saat membuat aplikasi baru. Jika Anda tidak memilih beberapa penyimpanan data selama pembuatan, Anda tidak dapat menambahkan penyimpanan data tambahan nanti.

Saat mendapatkan hasil penelusuran, Anda dapat menelusuri semua penyimpanan data, atau memfilter hasil dari satu penyimpanan data.

Penelusuran gabungan memiliki batasan berikut:

  • Menambahkan dan menghapus penyimpanan data:
    • Untuk mengaktifkan penelusuran gabungan untuk aplikasi, Anda harus menghubungkan setidaknya dua penyimpanan data ke aplikasi tersebut selama pembuatan aplikasi.
    • Anda dapat menambahkan atau menghapus penyimpanan data dari aplikasi penelusuran gabungan, tetapi aplikasi tidak boleh memiliki kurang dari dua penyimpanan data yang terhubung ke aplikasi tersebut kapan saja.
    • Jika Anda menghubungkan satu penyimpanan data ke aplikasi penelusuran selama pembuatan aplikasi, maka Anda tidak dapat menambahkan atau menghapus penyimpanan data tersebut.
  • Penyimpanan data yang berisi data tidak terstruktur yang diimpor menggunakan BigQuery tidak didukung.
  • Penelusuran gabungan mengizinkan kolom berikut dalam permintaan penelusuran:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • Penelusuran gabungan mengizinkan kolom berikut di dataStoreSpecs:
    • dataStore
    • boostSpec: Jika ada spesifikasi peningkat yang ditentukan untuk SearchRequest dan dataStoreSpecs, kedua spesifikasi peningkat tersebut diterapkan ke hasil penelusuran
    • filter: Jika ada filter yang ditentukan untuk SearchRequest dan dataStoreSpecs, kedua filter tersebut diterapkan ke hasil penelusuran
  • Operasi Create, Read, Update, dan Delete (CRUD) pada konfigurasi penayangan didukung untuk aplikasi gabungan. Hanya kolom berikut yang dapat ditambahkan atau diperbarui dalam konfigurasi penayangan:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Operasi CRUD pada kontrol berikut didukung untuk aplikasi penelusuran gabungan:
    • boostAction
    • synonymAction
    • filterAction
  • Ada batas 50 penyimpanan data per aplikasi penelusuran.
  • Jika satu penyimpanan data menggunakan konfigurasi CMEK, semua penyimpanan data lainnya juga harus menggunakan konfigurasi CMEK yang sama.