AI generatif dan tata kelola data

Google adalah yang pertama di industri yang memublikasikan Komitmen Privasi AI/ML, yang menguraikan keyakinan kami bahwa pelanggan harus memiliki tingkat keamanan dan kontrol tertinggi atas data mereka yang disimpan di cloud. Komitmen tersebut juga mencakup produk AI Generatif Google Cloud. Google memastikan bahwa timnya mematuhi komitmen ini melalui praktik tata kelola data yang andal, yang mencakup peninjauan data yang digunakan Google Cloud dalam pengembangan produknya. Detail selengkapnya tentang cara Google memproses data juga tersedia di Adendum Pemrosesan Data Cloud (CDPA) Google.

Definisi

Istilah Deskripsi
Model dasar Model machine learning (ML) skala besar yang dilatih dengan data dalam jumlah besar dan dapat digunakan untuk berbagai tugas.
Model adaptor Juga dikenal sebagai lapisan adaptor atau bobot adaptor. Model ini adalah model ML yang berfungsi bersama dengan model dasar untuk meningkatkan performa tugas khusus.
Data pelanggan Untuk mengetahui definisinya, lihat Persyaratan Layanan Google Cloud Platform.
Pelatihan Proses penggunaan data untuk melatih model ML.
Prediksi Juga dikenal sebagai inferensi, yang mengacu pada pemrosesan input dengan model ML untuk menghasilkan output.
Pengklasifikasi keamanan Digunakan untuk mengidentifikasi kategori konten tertentu, seperti materi yang berpotensi kekerasan selama proses prediksi.

Pelatihan model dasar

Secara default, Google Cloud tidak menggunakan data pelanggan untuk melatih model dasar -nya. Pelanggan dapat menggunakan model dasar Google Cloud dengan mengetahui bahwa perintah, respons, dan data pelatihan model adaptor mereka tidak digunakan untuk pelatihan model dasar.

Pelatihan Model Adaptor

Vertex AI menawarkan layanan yang memungkinkan pelanggan melatih model adaptor. Data pelatihan model adaptor adalah data pelanggan dan tidak disimpan. Selain itu, data pelanggan tidak digunakan untuk meningkatkan model dasar Google Cloud. Model adaptor hanya tersedia untuk pelanggan yang melatih model adaptor. Google tidak mengklaim kepemilikan model adaptor kecuali jika model adaptor menggunakan kekayaan intelektual Google yang sudah ada sebelumnya. Secara default, data pelanggan disimpan dalam bentuk terenkripsi dan dienkripsi saat dalam proses pengiriman. Pelanggan juga dapat mengontrol enkripsi model adaptor mereka menggunakan kunci enkripsi yang dikelola pelanggan (CMEK) dan dapat menghapus model adaptor kapan saja.

Prediksi

Input dan output yang diproses oleh model dasar, model adaptor, dan pengklasifikasi keamanan selama prediksi adalah data pelanggan. Data pelanggan tidak pernah dicatat ke dalam log oleh Google, tanpa izin eksplisit dari pelanggan dengan memilih untuk mengizinkan Google menyimpan input dan output dalam cache.

Selama prediksi, kami tidak mencatat data pelanggan untuk menghasilkan output pelanggan atau melatih model dasar. Secara default, Google meng-cache input dan output pelanggan untuk model Gemini guna mempercepat respons terhadap perintah berikutnya dari pelanggan. Konten dalam cache disimpan hingga 24 jam. Privasi tingkat project diterapkan untuk data yang di-cache. Untuk mempelajari cara menggunakan API untuk mendapatkan status penyimpanan dalam cache, menonaktifkan penyimpanan dalam cache, atau mengaktifkan kembali penyimpanan dalam cache untuk project Google Cloud, lihat Bagaimana cara mengaktifkan atau menonaktifkan penyimpanan dalam cache? Jika Anda menonaktifkan caching, Anda mungkin mengalami latensi yang lebih tinggi.

Memilih tidak ikut Program Penguji Tepercaya

Jika sebelumnya Anda memilih untuk mengizinkan Google menggunakan data Anda guna meningkatkan layanan AI/ML pra-GA sebagai bagian dari persyaratan Program Penguji Tepercaya, Anda dapat menggunakan formulir Program Penguji Tepercaya - Permintaan Tidak ikut untuk memilih tidak ikut.

Langkah selanjutnya